是尘封已久的记忆再次融化 是堆积心底的烈火再次燃烧 是直觉让我来到这久违的大地 是信念让我开始了新的征途 在硝烟中我得到了成长 在伤痛中我学会了坚强 在沉默中我明白了等待 在孤独中我体味了感伤 并不是我不懂得眼泪 并不是我只知道使命 在内心深处我同你一样火热 在我的眼中也有着多情的泪光 也许我的生命如落叶般短暂 也许我只是岁月长河中的一个过客 但我对自己所做的一切无怨无悔 因为我品尝到了那最后一刻的泪光
随笔-6  评论-24  文章-8  trackbacks-0
  1#include <cutil_inline.h>
  2#include <cv.h>
  3#include <cstdio>
  4#include <iostream>
  5#include <cutil.h>
  6#include <ctime>
  7#include <cstdlib>
  8#include <highgui.h>
  9#include <windows.h>
 10
 11#pragma comment(lib, "cuda.lib")
 12#pragma comment(lib, "cudart.lib")
 13#pragma comment(lib, "cutil32.lib")
 14#pragma comment(lib, "cv.lib")
 15#pragma comment(lib, "cxcore.lib")
 16#pragma comment(lib, "highgui.lib")
 17
 18using namespace std;
 19
 20__global__ void main_kernel(uchar4* d_dataC, uchar4* d_dataA, uchar4* d_dataB, int width, int height)
 21{
 22    unsigned int x = blockIdx.x*blockDim.x+threadIdx.x;
 23    unsigned int y = blockIdx.y*blockDim.y+threadIdx.y;
 24    float w = 0.2;
 25    if( x>0 && x < width && y>0 && y < height )
 26    {
 27        d_dataC[y*width+x].x = (unsigned char)(w*d_dataA[y*width+x].x+(1-w)*d_dataB[y*width+x].x);
 28        d_dataC[y*width+x].y = (unsigned char)(w*d_dataA[y*width+x].y+(1-w)*d_dataB[y*width+x].y);
 29        d_dataC[y*width+x].z = (unsigned char)(w*d_dataA[y*width+x].z+(1-w)*d_dataB[y*width+x].z);
 30
 31        d_dataC[y*width+x].w = 0;
 32    }

 33}

 34
 35char *filenameA = "01.JPG";
 36char *filenameB = "02.JPG";
 37int main()
 38{
 39    IplImage *imageA = cvLoadImage(filenameA);
 40    IplImage *imageB = cvLoadImage(filenameB);
 41
 42    uchar4* h_image_dataA =(uchar4*)malloc( (imageA->width)*(imageA->height)*sizeof(uchar4) );
 43    for(int i=0;i <imageA->width;i++
 44    {
 45        for(int j = 0; j <imageA->height; j++)
 46        
 47            h_image_dataA[j*(imageA->width)+i].x = ((unsigned char*)(imageA->imageData+imageA->widthStep*j))[i*3]; 
 48            h_image_dataA[j*(imageA->width)+i].y = ((unsigned char*)(imageA->imageData+imageA->widthStep*j))[i*3+1]; 
 49            h_image_dataA[j*(imageA->width)+i].z = ((unsigned char*)(imageA->imageData+imageA->widthStep*j))[i*3+2]; 
 50            h_image_dataA[j*(imageA->width)+i].w =  0
 51        }

 52    }

 53
 54    uchar4* h_image_dataB =(uchar4*)malloc( (imageB->width)*(imageB->height)*sizeof(uchar4) );
 55    for(int i=0;i <imageB->width;i++
 56    {
 57        for(int j = 0; j <imageB->height; j++)
 58        
 59            h_image_dataB[j*(imageB->width)+i].x = ((unsigned char*)(imageB->imageData+imageB->widthStep*j))[i*3]; 
 60            h_image_dataB[j*(imageB->width)+i].y = ((unsigned char*)(imageB->imageData+imageB->widthStep*j))[i*3+1]; 
 61            h_image_dataB[j*(imageB->width)+i].z = ((unsigned char*)(imageB->imageData+imageB->widthStep*j))[i*3+2]; 
 62            h_image_dataB[j*(imageB->width)+i].w =  0
 63        }

 64    }

 65
 66    uchar4* d_dataA = NULL;
 67    CUDA_SAFE_CALL( cudaMalloc( (void**)&d_dataA, ( imageA->width*imageA->height*sizeof(uchar4) ) ) );
 68
 69    uchar4* d_dataB = NULL;
 70    CUDA_SAFE_CALL( cudaMalloc( (void**)&d_dataB, ( imageB->width*imageB->height*sizeof(uchar4) ) ) );
 71
 72    uchar4* d_dataC = NULL;
 73    CUDA_SAFE_CALL( cudaMalloc( (void**)&d_dataC, ( imageB->width*imageB->height*sizeof(uchar4) ) ) );
 74    
 75    CUDA_SAFE_CALL( cudaMemcpy( d_dataA, h_image_dataA, imageA->width*imageA->height*sizeof(uchar4), cudaMemcpyHostToDevice) );
 76    CUDA_SAFE_CALL( cudaMemcpy( d_dataB, h_image_dataB, imageB->width*imageB->height*sizeof(uchar4), cudaMemcpyHostToDevice) );
 77    //
 78    LARGE_INTEGER start_time;
 79    LARGE_INTEGER end_time;
 80    double start = GetTickCount();
 81    QueryPerformanceCounter((LARGE_INTEGER*)&start_time);    
 82    dim3 dimBlock(16161);
 83    dim3 dimGrid( (imageA->width+dimBlock.x-1)/dimBlock.x, (imageA->height+dimBlock.y-1)/dimBlock.y );
 84    main_kernel<<<dimGrid, dimBlock, 0>>>(d_dataC, d_dataA,d_dataB, imageA->width, imageA->height);
 85    CUDA_SAFE_CALL(cudaThreadSynchronize());
 86    float diff_time = 0.0f;
 87    QueryPerformanceCounter((LARGE_INTEGER*)&end_time);
 88    diff_time = (float)(((double)end_time.QuadPart - (double)start_time.QuadPart) / 1000000);
 89    printf( "time=%f ms\n", diff_time);
 90    
 91    double end =  (GetTickCount() - start)/1000;
 92    printf("time used:%f s\n",end);
 93
 94    IplImage* imageC = cvCreateImage(cvGetSize(imageA),imageA->depth, imageA->nChannels );
 95    uchar4* h_image_dataC =(uchar4*)malloc( (imageC->width)*(imageC->height)*sizeof(uchar4) );
 96    CUDA_SAFE_CALL( cudaMemcpy( h_image_dataC, d_dataC, imageC->width*imageC->height*sizeof(uchar4), cudaMemcpyDeviceToHost) );
 97    for(int i=0;i <imageC->width;i++
 98    {
 99        for(int j = 0; j <imageC->height; j++)
100        
101            ((unsigned char*)(imageC->imageData+imageC->widthStep*j))[i*3]   = h_image_dataC[j*imageC->width+i].x; 
102            ((unsigned char*)(imageC->imageData+imageC->widthStep*j))[i*3+1= h_image_dataC[j*imageC->width+i].y; 
103            ((unsigned char*)(imageC->imageData+imageC->widthStep*j))[i*3+2= h_image_dataC[j*imageC->width+i].z;
104        }
 
105    }

106
107    cvNamedWindow("test",CV_WINDOW_AUTOSIZE);
108    cvShowImage("test",imageC);
109
110    cvWaitKey(0);
111    cvDestroyAllWindows();
112
113    CUDA_SAFE_CALL(cudaFree(d_dataA));
114    CUDA_SAFE_CALL(cudaFree(d_dataB));
115    CUDA_SAFE_CALL(cudaFree(d_dataC));
116
117    free(h_image_dataA);
118    free(h_image_dataB);
119    free(h_image_dataC);
120    cvReleaseImage(&imageA);
121    cvReleaseImage(&imageB);
122    cvReleaseImage(&imageC);
123    return 0;
124}
posted on 2009-12-25 10:48 noBugnoGain 阅读(4927) 评论(9)  编辑 收藏 引用

评论:
# re: opencv联合cuda进行图像混合操作 2009-12-25 15:01 | liuliu
支持。不过忘记做aligned了,CUDA是要64byte对齐,opencv的图像只是标准的4byte对齐。  回复  更多评论
  
# re: opencv联合cuda进行图像混合操作 2009-12-25 15:57 | 凡客诚品官方网站
CUDA是要64byte对齐,opencv的图像只是标准的4byte对齐  回复  更多评论
  
# re: opencv联合cuda进行图像混合操作 2009-12-26 11:04 | 李佳
CUDA就是看过介绍 下载下来了 不过显卡也不行G105M 就没怎么用了   回复  更多评论
  
# re: opencv联合cuda进行图像混合操作 2009-12-28 16:15 | wmgl
@liuliu
请问具体如果64byte对齐呢?  回复  更多评论
  
# re: opencv联合cuda进行图像混合操作 2010-08-18 15:42 | STICKGY
怎样将cuda与opencv联合起来编程啊?如果方便的话还请您指教一下,我现在是个初学者,连建什么项目,在.cpp还是.cu中编程都不清楚,谢了。
  回复  更多评论
  
# re: opencv联合cuda进行图像混合操作 2010-12-23 09:37 | noBugnoGain
@STICKGY
安装好cuda driver和sdk,在vs里面配置下就可以了。  回复  更多评论
  
# re: opencv联合cuda进行图像混合操作 2011-05-09 14:20 | 吾乃利刃
楼主博主用的opencv、VS、cuda都是是哪个版本的啊?编译的时候用什么编译器啊?用cuda的还是vs的啊?  回复  更多评论
  
# re: opencv联合cuda进行图像混合操作 2011-08-17 11:30 | hql
请问你的OPENCV+CUDA是怎么弄得啊?
我用的OPENCV2.1+CUDA+vs2008运行程序出现
1>C:\OpenCV2.1\vc2008\include\opencv\cxoperations.hpp(1254): error: no operator "=" matches these operands
1> operand types are: const cv::Range = cv::Range
1>C:\OpenCV2.1\vc2008\include\opencv\cxmat.hpp(730): error: function "cv::Mat_<_Tp>::t" returns incomplete type "cv::MatExpr_<cv::MatExpr_Op2_<cv::Mat, double, cv::Mat, cv::MatOp_T_<cv::Mat>>, cv::Mat>"
1>C:\OpenCV2.1\vc2008\include\opencv\cxmat.hpp(2978): error: no suitable user-defined conversion from "cv::MatExpr_<cv::MatExpr_Op3_<cv::Mat, cv::Scalar, int, cv::Mat, cv::MatOp_Bin_<cv::Mat>>, cv::Mat>" to "cv::MatExpr_<cv::MatExpr_Op3_<cv::Mat, cv::Scalar, int, cv::Mat, cv::MatOp_BinS_<cv::Mat>>, cv::Mat>" exists
1>Project : error PRJ0019: A tool returned an error code from "Compiling with CUDA Build Rule..."
  回复  更多评论
  
# re: opencv联合cuda进行图像混合操作 2012-09-13 14:17 | YJX
请教下,我在.cu文件里include cv.h之类就会报错
/usr/lib/gcc/x86_64-redhat-linux/4.1.2/include/emmintrin.h(1417): error: argument of type "__v2di *" is incompatible with parameter of type "__attribute((vector_size(16))) long *"
1 error detected in the compilation of "/tmp/tmpxft_00002ea9_00000000-4_mycuda2.

请问有遇到过这种情况么  回复  更多评论
  

只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理