win10 + gtx1060 + cuda8.0 + caffe + vs2013 + Tensorflow

一. 安装cuda8.01)先去官网下载cuda8.0  https://developer.nvidia.com/cuda-toolkit2)下载完之后进行安装,安装时间有点长,请耐心等待,默认是安装在c盘目录下 安装完后会生成两个系统变量:CUDA_PATH C:Program FilesNVIDIA GPU Computing ToolkitCUDAv8.0 CUDA_PAT
阅读本文

tensorflow在windows下的安装

1.python 的安装2.测试python安装是否成功在cmd中输入python,若安装成功会显示版本信息 若不成功,请查看环境变量是否添加,若已经添加,请坚信重启大法好3.安装TensorFlow因为我的显卡貌似不支持cuda8.0,这里我安装的是cpu版本 以管理员身份运行cmd(右键win徽标点击管理员方式运行命令提示符或者在cmd中输入runas /user:administrator
阅读本文

Caffe深度学习计算框架

Caffe | Deep Learning Framework1 Caffe::set_mode(Caffe::GPU);Caffe的优势 上手快:模型与相应优化都是以文本形式而非代码形式给出。 Caffe给出了模型的定义、最优化设置以及预训练的权重,方便立即上手。 速度快:能够运行最棒的模型与海量的数据。 Caffe与cuDNN结合使用,测试AlexNet模型,在K40上处理每张图片只需要1.
阅读本文

MacBook外置显卡eGPU折腾笔记

MacBook外置显卡eGPU折腾笔记硬件选购当今市场上个人电脑的独立显卡,基本上能选的只有NVIDIA和AMD了,如果你想买外置显卡来打游戏的话,NVIDIA和AMD的都可以,但如果是像我一样准备用来做深度学习加速的,那最好还是选择NVIDIA了。另外,如果要用来做深度学习加速,一定要查看英伟达官方网站,必须是支持CUDA的显卡才行,因为现在大多数的深度学习框架,底层都是调用GPU的CUDA编程
阅读本文

LINUX离线安装Cuda的最全教程-2017年12月最新

最近有个小项目需要安装10台显卡为Quadro K620的机子,期间查看了许多教程都不太完整,所以整理了一下,把自己成功的经验分享给大家,给自己写博客开个小头,有问题可以留言。系统版本:CentOS7CUDA版本:CUDA-9.1安装方式:离线U盘拷贝,控制台界面,cuda.run包安装(不需要分开安装驱动)具体信息:CentOS7【everything版+计算节点(无可视化的控制台界面)】 、【
阅读本文

Windows下VS2017编译OpenCV 3.4.0-rc

简述很久没有用过OpenCV了,这次需要做一点图像处理相关的工作,又需要用起来,这里记录一下编译的过程。。 编译好的文件在这里https://pan.baidu.com/s/1qXCWxkw1、下载源码这里就不下载源码压缩包了,直接从github上克隆一下。# 因为访问github较慢,这里直接使用的国内码云同步仓库 git clone https://gitee.com/mirrors/open
阅读本文

windows下caffe GPU版本配置

由于项目需要,所以在自己本子上配置了一下windows下GPU版本的caffe;硬件:  win10    ;      gtx1070独显(计算能力6.1);安装软件:     cudnn-8.0-windows10-x64-v5.1  ;  cuda_8.0.61_win10  ;  NugetPackages.zip  ;  caffe-master;(主要按照这篇和下面两篇来配置的)
阅读本文

OpenCV 3.2.0 +Win10+ CUDA 8.0+ VS2013 编译

OpenCV发布时并不包含GPU模块,若要使用GPU加速的OpenCV代码需要重新编译OpenCV。一个英文版本的教程环境和资源准备计算机必须有支持CUDA 的NVIDIA GPU,并且装好了驱动程序。下载OpenCV 3.2 选择的win pack版本,解压到指定文件目录下。下载地址下载安装CMake。版本使用的是cmake-3.10.1-win64-x64.msi。下载地址opencv-con
阅读本文

TensorFlow 安装教程

1.准备好Anaconda环境tensorflow是属于很高层的应用。高层应用的一个比较大的麻烦就是需要依赖的底层的东西很多,如果底层依赖没有弄好的话,高层应用是没法玩转的。 在极客学院有关tensorflow的教程中,提到了这样几种安装方式:Pip, Docker, Virtualenv, Anaconda 或 源码编译的方法安装 TensorFlow。在这里,我强烈推荐大家使用Anacond
阅读本文

0_Simple__matrixMulCUBLAS

使用CUDA的线性代数库cuBLAS来计算矩阵乘法。这里主要记录调用规则,关于乘法函数中详细的参数说明和调用规则见另一篇随笔。▶ 源代码: 1 #include <assert.h> 2 #include <helper_string.h> 3 #include <cuda_runtime.h> 4 #include <cublas_v2.h> 5 #include <helpe
阅读本文

Docker 安装tensorflow

安装DOCKER1. https://docs.docker.com/engine/installation/linux/docker-ce/ubuntu/nstall from a packageIf you cannot use Docker’s repository to install Docker CE, you can download the .deb file for your r
阅读本文

深度平台搭建-20171030

前两天为了尝试一下mxnet和torch的框架,把笔记本上的环境给高乱了。笔记本配置:显卡:gtx850m  4gcpu:  i7 4710hq于是,昨天和今天就为此折腾。昨天搞了很久基本上都是失败的---或者叫做是坎坷的经历。而今天的明显顺畅了。先说昨天:1。 先是糊里糊涂的安装了ubuntu17.04.  随后,情况如下:caffe    从源码编译,一直过不了。 不记得是什么问题了,因为我一
阅读本文

Qt FFMPEG环境搭建

FFMPEG下载地址:https://ffmpeg.zeranoe.com/builds/ 配置环境变量(需重启电脑):PATH:E:/ffmpeg/Shared/bin; PRO添加如下代码:INCLUDEPATH += E:/ffmpeg/dev/include LIBS += -LE:/ffmpeg/dev/lib/ -lavcodec -lavdevice -lavfilter -lav
阅读本文

NV12格式转RGB的CUDA实现

NV12格式是yuv420格式的一种,NV12格式的u,v排布顺序为交错排布,假如一幅图像尺寸为W*H,则先Y分量有W*H个,然后U分量和V分量交错排布,U分量和V分量各有W*H/4个,U,V加起来总数是Y分量的一半。 下面是CUDA实现的NV12格式到BGR格式的转换代码。StepY,StepUV分别为ffmpeg解码出的源数据中的Y分量一行的宽度和UV分量一行的宽度,比实际的图像宽度要大。_
阅读本文

训练网络时遇到的小问题

问题1:训练时报错:cudasuccess …… out of memeory 这真的是GPU内存不够导致的,batchsize 太大了,设置小点问题2:制作lmdb文件时提示: Corrupt JPEG data : premature end od data segment 这就是某个图像坏掉了,赶紧把它找出来# -*- coding:utf-8 -*- ‘‘‘ 在创建lmdb文件时显示 Co
阅读本文

0_Simple__asyncAPI

关于CPU - GPU交互的简单接口函数。源代码: 1 // 2 // This sample illustrates the usage of CUDA events for both GPU timing and 3 // overlapping CPU and GPU execution. Events are inserted into a stream 4 // of C
阅读本文

0_Simple__cdpSimpleQuicksort

利用CUDA动态并行实现快排算法(有单线程的递归调用)源代码: 1 #include <iostream> 2 #include <cstdio> 3 #include <cuda_runtime.h> 4 #include “device_launch_parameters.h“ 5 #include <D:ProgramCUDASamplescommoninche
阅读本文

使用MDnet时遇到的一些问题(matlab版)

https://github.com/HyeonseobNam/MDNethttps://github.com/HyeonseobNam/py-MDNet由于python版本需要使用torch,决定先使用matlab版本试一下,然后就踩进了一些坑,以下做一下记录备忘(机器配置Ubuntu 16.04 LTS, CPU E5 1620, GPU GTX1080ti, CUDA 8.0首先编译matc
阅读本文

CUDA7.5 安装

准备工作:1. 目前,CUDA ToolKit的官方最新版本是9.0,CUDA7.5的官方下载网址是:https://developer.nvidia.com/cuda-75-downloads-archive2. CUDA7.5只支持以下版本的编译器:下载Visual Studio 2013开始安装:1.  常规安装Visual Studio 20132. 安装CUDA7.5 (PS:我在安装C
阅读本文