Fork me on GitHub

Tensorflow学习系列(1)——环境配置

写在此系列前的一些话

  在人工智能、深度学习爆红的年代,今天我也来凑凑热闹,本人也是一个GIS在读研究生,所以对深度学习方面可能还有很多理解不透彻的地方,这个系列就是本人一个梳理和学习的过程,如果学习过中涉及一些代码和本人学习的教程,我也会在每篇的末尾贴上Github地址以及学习视频的地址。

系列介绍

  本人学习深度学习框架是Tensorflow以及后期会介绍Keras的部分,学习的内容会按照《Tensorflow实战Google深度学习框架》这本书来进行以及youtube上的一些学习视频来进行相关案例补充和介绍。
  本文介绍一些Tensorflow GPU版本的环境搭建。

Tensorflow版本介绍

  Tensorflow分为GPU和CPU版本,GPU版本必须要有英伟达的显卡才可以进行安装配置,CPU简单直接安装即可。
  本文介绍基于Ubuntu1604版本的TensorflowGPU版本安装介绍。

Ubuntu Server 1604安装部署

选择语言

  建议选择英语,亲测选择简体中文之后,后面安装会出错。
语言选择英语

安装

  选择安装Install Ubuntu Server
Install界面
  后面几步默认即可
语言选择
地点选择
配置键盘
键盘配置选择
网络配置
不配置网络

配置主机名和用户

  设置主机名
设置主机名
  创建用户
创建用户
确认创建用户
  设置密码
设置密码

分区

  选择自定义分区(这一步是上网查询所写)实际选择第二项即可,后面依次默认就可以安装成功。
自定义分区
  选择挂载上的分区
选择挂载分区
  新建分区
新建分区
  然后看到这个图片的时候就是安装成功的时候,后面重启就行啦。
重启界面

重启登录以及设置

  重启登录只要输入之前设置的用户和密码
登录界面
  然后输入sudo passwd root,即可初次为root用户设置密码

Ubuntu安装后的准备工作

安装ssh

  输入Apt-get install openssh-server
  启动ssh,输入Service ssh start
  开机自启,发现ubuntu中没有chkconfig工具。

自启动ssh

  没有chkconfig,但是ubuntu中有一个类似的工具,sysv-rc-conf
  输入apt-get install sysv-rc-conf安装即可
  然后sysv-rc-conf即可

安装显卡驱动

检查显卡型号

  输入lshw -numeric -C display
查看显卡型号
可以看到我的显卡型号

显卡驱动安装准备工作

  首先要暂停了ubuntu自带的nouveau,再安装显卡驱动,不然会出错。

  首先把驱动加入黑名单中:vim /etc/modprobe.d/blacklist.conf 在这个文件中加入

1
2
3
4
5
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off

  再用以下命令禁用nouveau内核

1
2
echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf  
sudo update-initramfs –u

  重启:reboot之后就可以了。
  具体的显卡驱动的安装在安装cuda的时候安装,多次证明还是利用cuda安装不会出问题。

安装cuda

cuda选择与安装

  cuda需要去官网查看下载对应版本,我是下载的ubuntu1604版本的
  https://developer.nvidia.com/cuda-downloads注意下载runfile文件,deb格式的安装会有一些意想不到的问题。
CUDA下载
  输入sh cuda_8.0.61_375.26_linux.run安装即可。

  下面就是一步一步点即可,这个过程中也安装了显卡驱动,所以之前查看完显卡驱动之后可以选择不安装。

cuda环境变量配置

  在 ~/.bashrc文件中添加

1
2
3
export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64/
export CUDA_HOME=/usr/local/cuda

  前两个是cuda官网安装文档中建议的变量,第三个是tensorflow-GPU版本要求的变量
  然后重新生成一下source ~/.bashrc

检查显卡驱动安装结果

  这时候可以一起检查下显卡驱动的结果了nvidia-smi
显卡运行情况

安装深度学习库cuDNN

  到官网下载cudnn,需要注册,填很多表,然后选择对应的学习库
cudnn对应库选择
  我选择的是5.1版本的,因为版本7的实际安装之后出现了一些没能解决的问题。
  然后解压tar xvzf cudnn-8.0-linux-x64-v5.1.tgz之后
将其复制到相应路径

1
2
cp cuda/include/cudnn.h /usr/local/cuda/include
cp cuda/lib64/libcudnn* /usr/local/cuda/lib64

  并且修改文件访问权限

1
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

安装Anaconda

下载Anaconda

  在网上下载Anaconda,选择linux python 3.6版本,https://www.anaconda.com/download/,
  得到一个Anaconda3-4.4.0-Linux-x86_64.sh

安装Anaconda

  bash Anaconda3-4.4.0-Linux-x86_64.sh,这样安装就可以路径选择时 输入/usr/anaconda3即可
此上都是在root用户下安装配置。

Python降级

  Anaconda3安装的python3是python3.6,但是tensorflow需要用python3.5版本
  所以需要降级:conda install python=3.5即可

创建并切换用户

  创建新用户 useradd tf2
  为新用户设置密码pass tf2
  切换用户 sudo tf2

安装虚拟环境

  切换到tf2用户下,进行安装,首先要给tf2用户权限

1
chown -R tf2 /usr/anaconda3

  创建名字叫tensorflow的虚拟环境,指定python版本为3.5.2

1
conda create --name tensorflow python=3.5.2

  显示所有环境名字和路径conda info --envs
  使用环境和退出环境activate tensorflow/deactivate tensorflow
  进入环境之后就可以安装各种东西 进行运算啦pip install tensorflow-gpu
  安装keras输入conda install keras
  克隆环境conda create -n my_th --clone tensorflow
  删除环境conda remove -n my_th --all

一个努力向上的GISER
0%