写在此系列前的一些话
在人工智能、深度学习爆红的年代,今天我也来凑凑热闹,本人也是一个GIS在读研究生,所以对深度学习方面可能还有很多理解不透彻的地方,这个系列就是本人一个梳理和学习的过程,如果学习过中涉及一些代码和本人学习的教程,我也会在每篇的末尾贴上Github地址以及学习视频的地址。
系列介绍
本人学习深度学习框架是Tensorflow以及后期会介绍Keras的部分,学习的内容会按照《Tensorflow实战Google深度学习框架》这本书来进行以及youtube上的一些学习视频来进行相关案例补充和介绍。
本文介绍一些Tensorflow GPU版本的环境搭建。
Tensorflow版本介绍
Tensorflow分为GPU和CPU版本,GPU版本必须要有英伟达的显卡才可以进行安装配置,CPU简单直接安装即可。
本文介绍基于Ubuntu1604版本的TensorflowGPU版本安装介绍。
Ubuntu Server 1604安装部署
选择语言
建议选择英语,亲测选择简体中文之后,后面安装会出错。
安装
选择安装Install Ubuntu Server
后面几步默认即可
配置主机名和用户
设置主机名
创建用户
设置密码
分区
选择自定义分区(这一步是上网查询所写)实际选择第二项即可,后面依次默认就可以安装成功。
选择挂载上的分区
新建分区
然后看到这个图片的时候就是安装成功的时候,后面重启就行啦。
重启登录以及设置
重启登录只要输入之前设置的用户和密码
然后输入sudo passwd root
,即可初次为root用户设置密码
Ubuntu安装后的准备工作
安装ssh
输入Apt-get install openssh-server
启动ssh,输入Service ssh start
开机自启,发现ubuntu中没有chkconfig工具。
自启动ssh
没有chkconfig,但是ubuntu中有一个类似的工具,sysv-rc-conf
输入apt-get install sysv-rc-conf
安装即可
然后sysv-rc-conf即可
安装显卡驱动
检查显卡型号
输入lshw -numeric -C display
如
可以看到我的显卡型号
显卡驱动安装准备工作
首先要暂停了ubuntu自带的nouveau,再安装显卡驱动,不然会出错。
首先把驱动加入黑名单中:vim /etc/modprobe.d/blacklist.conf 在这个文件中加入
1 | blacklist nouveau |
再用以下命令禁用nouveau内核
1 | echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf |
重启:reboot之后就可以了。
具体的显卡驱动的安装在安装cuda的时候安装,多次证明还是利用cuda安装不会出问题。
安装cuda
cuda选择与安装
cuda需要去官网查看下载对应版本,我是下载的ubuntu1604版本的
https://developer.nvidia.com/cuda-downloads注意下载runfile文件,deb格式的安装会有一些意想不到的问题。
输入sh cuda_8.0.61_375.26_linux.run
安装即可。
下面就是一步一步点即可,这个过程中也安装了显卡驱动,所以之前查看完显卡驱动之后可以选择不安装。
cuda环境变量配置
在 ~/.bashrc
文件中添加
1 | export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}} |
前两个是cuda官网安装文档中建议的变量,第三个是tensorflow-GPU版本要求的变量
然后重新生成一下source ~/.bashrc
检查显卡驱动安装结果
这时候可以一起检查下显卡驱动的结果了nvidia-smi
安装深度学习库cuDNN
到官网下载cudnn,需要注册,填很多表,然后选择对应的学习库
我选择的是5.1版本的,因为版本7的实际安装之后出现了一些没能解决的问题。
然后解压tar xvzf cudnn-8.0-linux-x64-v5.1.tgz
之后
将其复制到相应路径
1 | cp cuda/include/cudnn.h /usr/local/cuda/include |
并且修改文件访问权限
1 | sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn* |
安装Anaconda
下载Anaconda
在网上下载Anaconda,选择linux python 3.6版本,https://www.anaconda.com/download/,
得到一个Anaconda3-4.4.0-Linux-x86_64.sh
安装Anaconda
bash Anaconda3-4.4.0-Linux-x86_64.sh,这样安装就可以路径选择时 输入/usr/anaconda3
即可
此上都是在root用户下安装配置。
Python降级
Anaconda3安装的python3是python3.6,但是tensorflow需要用python3.5版本
所以需要降级:conda install python=3.5
即可
创建并切换用户
创建新用户 useradd tf2
为新用户设置密码pass tf2
切换用户 sudo tf2
安装虚拟环境
切换到tf2用户下,进行安装,首先要给tf2用户权限
1 | chown -R tf2 /usr/anaconda3 |
创建名字叫tensorflow的虚拟环境,指定python版本为3.5.2
1 | conda create --name tensorflow python=3.5.2 |
显示所有环境名字和路径conda info --envs
使用环境和退出环境activate tensorflow/deactivate tensorflow
进入环境之后就可以安装各种东西 进行运算啦pip install tensorflow-gpu
安装keras输入conda install keras
克隆环境conda create -n my_th --clone tensorflow
删除环境conda remove -n my_th --all