深度学习框架介绍与比较

caffe, TensorFlow, Torch 框架 开发语言 最新版本 运行速度 灵活 文档 适合网络 平台 学习难度 Caffe c++/cuda 2017,1.0 快 一般 全面 CNN 所有系统 中等 TensorFlow c++/cuda/python 2017,1.3 中等 好 中
阅读本文

[Torch7]的安装

1 安装Torch。1.1 安装luarocklua是通过luarock来进行软件包管理的,Torch7的接口是lua,因此需要先安装Lua,本人安装的是lua52,安装过程主要参考Torch官方文档。1.2 参考官方文档遇到的问题记录参考Torch官方文档安装Torch7出现一些问题。 qlua installationluarocks install qtlua //not q
阅读本文

CUDA 学习笔记 1

CUDA 如今已是基本功了,得抓紧学习。 从哪开始呢,就先简介吧。 在这个数据爆炸的时代,对计算机性能的要求越来越高。而CPU时钟频率因接近物理极限无法继续提高,所以并行计算便成为了解决这一难题的最好方法。 如今 的CPU早已是多核心了,但并行计算还应该发掘更多的计算能力。GPU 作为一个具有很强运算能力的子系统,自然应当仁不让,尽力发挥作用。事实上这些研究早在几十年前就开始了。 GPU 的设计初
阅读本文

yolo V2

YOLO: Real-Time Object Detection只看一次 (YOLO)是一个实时对象检测系统。在 Titan X 上处理速度可以达到 40-90 FPS ,在  VOC 2007 上mAP(平均准确率)为78.6% ,在COCO test-dev上平均准确率为48.1%。 Model Train Test mAP FLOPS FPS Cfg Weights Old YOL
阅读本文

配有Tesla K40c的服务器新装Ubuntu16.04并安装CUDA8.0、Anaconda3、Matlab2016a、OPENCV3.1、CuDNN5.1、MXNet

决定加入深度学习的大军,感谢导师给配了台新设备!第一次接触服务器并配置开发环境,整个过程中遇到不少坑,但是好在最后都成功解决了。不过有点担心的是,Tesla k40c 默认还要一个辅助供电,我目前只插了8pin的供电接口,6pin的供电接口没插,不知道后续计算会不会受影响……心里怕怕的……     首先报一下硬件配置:        服务器:联想TD350:
阅读本文

编译thrift外篇-关于默认链接包

根据 https://stackoverflow.com/questions/9922949/how-to-print-the-ldlinker-search-path 使用 ldconfig -v 2>/dev/null | grep -v ^$‘t‘ll /usr/local/cuda-8.0/lib64 /usr/lib/x86_64-linux-gnu/libfakeroot /usr/
阅读本文

OpenCV学习之图像分割

一、边缘提取常用算子1、sobel算子边缘检测//Sobel梯度算子 void imageSobel(){ const char* name = “lena.tif“; IplImage* image = cvLoadImage(name, CV_LOAD_IMAGE_GRAYSCALE); if (image == NULL){ printf(“image load failed.n
阅读本文

object detection[YOLOv2]

接着扯YOLO v21 - 在所有卷积层上用BN,并扔掉dropout(448*448)的图片微调10个epoch,然后在将前面的卷积层留待检测模型用。 3 - 使用anchor box(而这几个anchor box是基于训练集数据的标签中(w,h)聚类出来的),加快模型收敛 4 - 去掉全连接层,扔掉最后一层池化层,并且将网络的输入端resize为(416*416),从而输出的是一个
阅读本文

使用Faster-Rcnn进行目标检测(实践篇)转载

原理上一篇文章,已经说过了,大家可以参考一下,实验我使用的代码是Python版本的Faster Rcnn,官方也有Matlabpy-faster-rcnn(python)faster-rcnn(matlab)环境配置按照官方的README进行配置就好,不过在这之前大家还是看下硬件要求吧 For training smaller networks (ZF, VGG_CNN_M_1024) a g
阅读本文

GPU、CPU的异同

一、概念  CPU(Center Processing Unit)即中央处理器,GPU(Graphics Processing Unit)即图形处理器。二、CPU和GPU的相同之处  两者都有总线和外界联系,有自己的缓存体系,以及数字和逻辑运算单元,两者都为了完成计算任务而设计。三、CPU和GPU的不同之处  CPU虽然有多核,但一般也就几个,每个核都有足够大的缓存和足够多的数字和逻辑运算单元,需
阅读本文

二插排序树

二分查找只适用于静态查找,不适合改变查找表。当然他们的时间复杂度都是logn 头文件 #ifndef _BSTREE_H_ #define _BSTREE_H_ typedef void BSTree;//数据封装 typedef void BSKey; /********************** 结点指针域定义 **********************/ typ
阅读本文

插值法查找

#include <stdio.h> #include <time.h> #define SIZE 20 void print_array(int a[], int len) { int i = 0; for (i = 0; i < len; i++){ printf(“%d,“, a[i]); } printf(
阅读本文

CMU开源:多目标人体关键点实时检测

即将加入(但是已经实现!)身体+手势+人脸估计展示: 尽管该库使用了Caffe,但是代码还是很容易向其他框架(如Tensorflow 或者Torch 等)中移植。如果你实现了任何这方面的代码,请发出合并请求我们会很乐意在该库中添加你的实现。 OpenPose库的主要功能性: 多人15或18关键点身体位姿估计和渲染: 多人2*21关键点手势估计和渲染(未来1-2月内开源!)
阅读本文

TensorFlow配置日志等级

import os os.environ[‘TF_CPP_MIN_LOG_LEVEL‘]=‘2‘ import os os.environ[‘TF_CPP_MIN_LOG_LEVEL‘]=‘1‘ # 这是默认的显示等级,显示所有信息 # 2级 import os os.environ[‘TF_CPP_MIN_LOG_LEVEL‘]=‘2‘ # 只显示 warning 和 Error # 3级
阅读本文

keras中文文档笔记4——配置与安装

配置 推荐配置 如果您是高校学生或者高级研究人员,并且实验室或者个人资金充沛,建议您采用如下配置: 主板:X299型号或Z270型号 CPU: i7-6950X或i7-7700K 及其以上高级型号 内存:品牌内存,总容量32G以上,根据主板组成4通道或8通道 SSD: 品牌固态硬盘,容量256G以上 显卡:NVIDIA GTX TITAN(XP) NVIDIA GTX 1080ti、NV
阅读本文

TX2(1)--Jetson TX2 刷机并安装JetPack3.0

一般而言,刷机是在Ubuntu16.04的系统上进行,本人在ubuntu16.04系统上进行了初步的测试,暂时存在一些问题,因此建议首先配备一台Ubuntu14.04的host主机(不建议使用虚拟机)。由于TX2有两种开发板,至于NVIDIA最官方的开发板有相关的教程,因此不再此处赘述,详情参见相关教程。本人使用的是另一种类型的TX2开发版。如图所示: 1. 从官网下载JetPack3.0下载地址
阅读本文

OpenGL与CUDA互操作方式总结

一、介绍CUDA是Nvidia推出的一个通用GPU计算平台,对于提升并行任务的效率非常有帮助。本人主管的项目中采用了OpenGL做图像渲染,但是在数据处理方面比较慢,导致帧率一直上不来。于是就尝试把计算工作分解成小的任务,使用核函数在CUDA中加速计算。对于CUDA和OpenGL如何交互以前从来没有接触过,这次在实施时趟了不少的坑。在这里记录下OpenGL与CUDA的互操作的两种方式。二、基本操作
阅读本文

Deep Photo的TensorFlow版本

Prisma这个应用,你可能很熟悉。这是一个能将不同的绘画风格,迁移到照片中,形成不同艺术风格的图片。LouieYang将该Torch实现转换成了TensorFlow实现。项目地址:https://github.com/LouieYang/deep-photo-styletransfer-tf(照片风格迁移示例如下,以下三列从左到右分别是:输入图像、风格图像、Torch效果、TensorFlow效
阅读本文

CUDA学习(2)--编程模型

Key Abstraction of CUDA Thread Hierarchy –> Divide thread into several blocks Memory Hierarchy –> Local memory of threads, shared memory of blocks and global memory of grid Heterogonous Programming
阅读本文

计算显卡对比

科学计算显卡的两个主要性能指标:1、运算能力:FLOPS 每秒浮点运算次数,TFLOPS表示每秒万亿(10^12)次浮点计算;2、显存大小:显存大小也决定了实验中能够使用的样本数量和模型复杂度。3. cuda 核心数量 1、CUDA compute capability对比(computer capability 并不代表显卡的计算能力,主版本号说明GPU的架构,副版本号相当于更新的版本)
阅读本文