学习笔记12:CUDA 中 FFTW 和 cufft 的使用过程

一、流程1.使用cufftHandle创建句柄2.使用cufftPlan1d(),cufftPlan3d(),cufftPlan3d(),cufftPlanMany()对句柄进行配置,主要是配置句柄对应的信号长度,信号类型,在内存中的存储形式等信息。 cufftPlan1d():针对单个 1 维信号cufftPlan2d():针对单个 2 维信号cufftPlan3d():针对单个 3 维信号cu
阅读本文

学习笔记13:代码运行时间测试

CUDA内核运行时间的测量函数cudaEvent_t start1; cudaEventCreate(&start1); cudaEvent_t stop1; cudaEventCreate(&stop1); cudaEventRecord(start1, NULL); // 需要测时间的内核函数kernel; cudaEventRecord(stop1, NULL); cudaEventSync
阅读本文

第三篇:CUDA 标准编程模式

前言模式描述       1. 定义需要在 device 端执行的核函数。( 函数声明前加 _golbal_ 关键字 )       2. 在显存中为待运算的数据以及需要存放结果的变量开辟显存空间。( cudaMalloc 函数实现 )       3. 将待运算的数据传输进显存。( cudaMemcpy,cublasSetVector 等函数实现 )       4. 调用 device 端函数
阅读本文

ubuntu16.04 安装NVIDIA和CUDA9.2 cudNN7.1

1.安装NVIDIA驱动(1)查询NVIDIA驱动首先去官网(http://www.nvidia.com/Download/index.aspx?lang=en-us)查看适合自己显卡的驱动(下载runfile文件): 2)安装驱动先按Ctrl + Alt + F1到控制台,关闭当前图形环境   $sudo service lightdm stop 卸载可能存在的旧版本 nvidia 驱动sudo
阅读本文

CUDA程序设计(二)

算法设计:直方图统计直方图频数统计,也可以看成一个字典Hash计数。用处不是很多,但是涉及CUDA核心操作:全局内存、共享内存、原子函数。1.1  基本串行算法这只是一个C语言练习题。#define MAXN 1005 #define u32 unsigned int __host__ void count(char *hist_data, u32 *bin_data) { for
阅读本文

QT下的darknet-GPU项目属性

#------------------------------------------------- # # Project created by QtCreator 2018-08-04T19:39:17 # #------------------------------------------------- QT += core gui greaterThan(QT_MAJOR_V
阅读本文

ubuntu12.04+cuda6.0+caffe(新版)的安装

参照两位的博客http://caffe.berkeleyvision.org/    官网http://www.mintos.org/config/ubuntu-nvidia-prime.html(对于ubuntu14.04的话很重要)  前前后后装了有20+遍系统,今天终于把caffe搞定了。推荐ubuntu12.04+cuda(5.0,5.5或6.0的版本)+mkl+opencv+caffe显
阅读本文

【CUDA】Win10 + VS2017新 CUDA 项目配置

一、新建项目  打开VS2017 → 新建项目 → Win32控制台应用程序 → “空项目”打钩二、调整配置管理器平台类型  右键项目 → 属性 → 配置管理器 → 全改为“x64”  三、配置生成属性  右键项目 → 生成依赖项 → 生成自定义 → 勾选“CUDA 9.0XXX”  三、配置基本库目录  注意:后续步骤中出现的目录地址需取决于你当前的CUDA版本及安装路径  右键项目 → 属性
阅读本文

win10 + gtx1060 + cuda8.0 + caffe + vs2013 + Tensorflow

一. 安装cuda8.01)先去官网下载cuda8.0  https://developer.nvidia.com/cuda-toolkit2)下载完之后进行安装,安装时间有点长,请耐心等待,默认是安装在c盘目录下 安装完后会生成两个系统变量:CUDA_PATH C:Program FilesNVIDIA GPU Computing ToolkitCUDAv8.0 CUDA_PAT
阅读本文

tensorflow在windows下的安装

1.python 的安装2.测试python安装是否成功在cmd中输入python,若安装成功会显示版本信息 若不成功,请查看环境变量是否添加,若已经添加,请坚信重启大法好3.安装TensorFlow因为我的显卡貌似不支持cuda8.0,这里我安装的是cpu版本 以管理员身份运行cmd(右键win徽标点击管理员方式运行命令提示符或者在cmd中输入runas /user:administrator
阅读本文

Caffe深度学习计算框架

Caffe | Deep Learning Framework1 Caffe::set_mode(Caffe::GPU);Caffe的优势 上手快:模型与相应优化都是以文本形式而非代码形式给出。 Caffe给出了模型的定义、最优化设置以及预训练的权重,方便立即上手。 速度快:能够运行最棒的模型与海量的数据。 Caffe与cuDNN结合使用,测试AlexNet模型,在K40上处理每张图片只需要1.
阅读本文

MacBook外置显卡eGPU折腾笔记

MacBook外置显卡eGPU折腾笔记硬件选购当今市场上个人电脑的独立显卡,基本上能选的只有NVIDIA和AMD了,如果你想买外置显卡来打游戏的话,NVIDIA和AMD的都可以,但如果是像我一样准备用来做深度学习加速的,那最好还是选择NVIDIA了。另外,如果要用来做深度学习加速,一定要查看英伟达官方网站,必须是支持CUDA的显卡才行,因为现在大多数的深度学习框架,底层都是调用GPU的CUDA编程
阅读本文

LINUX离线安装Cuda的最全教程-2017年12月最新

最近有个小项目需要安装10台显卡为Quadro K620的机子,期间查看了许多教程都不太完整,所以整理了一下,把自己成功的经验分享给大家,给自己写博客开个小头,有问题可以留言。系统版本:CentOS7CUDA版本:CUDA-9.1安装方式:离线U盘拷贝,控制台界面,cuda.run包安装(不需要分开安装驱动)具体信息:CentOS7【everything版+计算节点(无可视化的控制台界面)】 、【
阅读本文

Windows下VS2017编译OpenCV 3.4.0-rc

简述很久没有用过OpenCV了,这次需要做一点图像处理相关的工作,又需要用起来,这里记录一下编译的过程。。 编译好的文件在这里https://pan.baidu.com/s/1qXCWxkw1、下载源码这里就不下载源码压缩包了,直接从github上克隆一下。# 因为访问github较慢,这里直接使用的国内码云同步仓库 git clone https://gitee.com/mirrors/open
阅读本文

windows下caffe GPU版本配置

由于项目需要,所以在自己本子上配置了一下windows下GPU版本的caffe;硬件:  win10    ;      gtx1070独显(计算能力6.1);安装软件:     cudnn-8.0-windows10-x64-v5.1  ;  cuda_8.0.61_win10  ;  NugetPackages.zip  ;  caffe-master;(主要按照这篇和下面两篇来配置的)
阅读本文

OpenCV 3.2.0 +Win10+ CUDA 8.0+ VS2013 编译

OpenCV发布时并不包含GPU模块,若要使用GPU加速的OpenCV代码需要重新编译OpenCV。一个英文版本的教程环境和资源准备计算机必须有支持CUDA 的NVIDIA GPU,并且装好了驱动程序。下载OpenCV 3.2 选择的win pack版本,解压到指定文件目录下。下载地址下载安装CMake。版本使用的是cmake-3.10.1-win64-x64.msi。下载地址opencv-con
阅读本文

TensorFlow 安装教程

1.准备好Anaconda环境tensorflow是属于很高层的应用。高层应用的一个比较大的麻烦就是需要依赖的底层的东西很多,如果底层依赖没有弄好的话,高层应用是没法玩转的。 在极客学院有关tensorflow的教程中,提到了这样几种安装方式:Pip, Docker, Virtualenv, Anaconda 或 源码编译的方法安装 TensorFlow。在这里,我强烈推荐大家使用Anacond
阅读本文

0_Simple__matrixMulCUBLAS

使用CUDA的线性代数库cuBLAS来计算矩阵乘法。这里主要记录调用规则,关于乘法函数中详细的参数说明和调用规则见另一篇随笔。▶ 源代码: 1 #include <assert.h> 2 #include <helper_string.h> 3 #include <cuda_runtime.h> 4 #include <cublas_v2.h> 5 #include <helpe
阅读本文

Docker 安装tensorflow

安装DOCKER1. https://docs.docker.com/engine/installation/linux/docker-ce/ubuntu/nstall from a packageIf you cannot use Docker’s repository to install Docker CE, you can download the .deb file for your r
阅读本文