首頁 > 軟體

Ubuntu 18.04安裝Tensorflow(GPU)

2020-06-16 16:35:35

1.Ubuntu安裝Python3.6:

首先拉取遠端倉庫

sudo add-apt-repository ppa:jonathonf/python-3.6 

更新源

sudo apt-get update

線上安裝

sudo apt-get install python3.6

補充,其實安裝python3用一句:sudo apt-get install python3-dev 即可。檢視版本:python3 --version

更改預設值,python預設為Python2,現在修改為Python3

sudo update-alternatives --install /usr/bin/python python /usr/bin/python2 100

sudo update-alternatives --install /usr/bin/python python /usr/bin/python3 150

2.Ubuntu安裝nvidia顯示卡驅動(參考上一篇部落格)

檢視nvidia顯示卡驅動版本

nvidia-smi  

3.安裝對應版本的CUDA

在安裝CUDA時一定要注意其與英偉達顯示卡驅動以及Linux系統和GCC版本的對應關係,如果版本之間不匹配,是安裝不成功的。

CUDA與Driver的對應版本
參考連結:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
cuda8.0與Linux系統以及GCC的對應關係
參考連結:https://docs.nvidia.com/cuda/archive/8.0/cuda-installation-guide-linux/index.html
cuda9.0與Linux系統以及GCC的對應關係
參考連結:https://docs.nvidia.com/cuda/archive/9.0/cuda-installation-guide-linux/index.html
cuda10.0與Linux系統以及GCC的對應關係
參考連結:https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html

檢視gcc版本:

gcc -v

由於RTX2060顯示卡驅動在Ubuntu18.04上是418.56版本,所以選擇對應的cuda10.1版本安裝

cuda官網下載:https://developer.nvidia.com/cuda-toolkit

另附歷史版本:https://developer.nvidia.com/cuda-toolkit-archive

CUDA安裝命令:
sudo sh cuda_xxx_linux.run

4.安裝CUDA對應的CUDNN版本

cudnn官網下載(需要註冊):https://developer.nvidia.com/cudnn

另附:https://developer.nvidia.com/rdp/cudnn-archive 

下載Ubuntu18.04對應的CUDNN安裝包,然後進入CUDNN安裝包所在目錄,執行以下命令:

sudo dpkg -i runtime包.deb 
sudo dpkg -i developer包.deb 
sudo dpkg -i 程式碼sample包.deb

至此,CUDNN安裝完成。

5.安裝對應版本的Tensorflow

首先要清楚最新版Tensorflow最多支援到CUDA哪個版本?

https://www.tensorflow.org/install/install_sources

安裝pip3(針對python3): 

sudo apt-get install python3-pip

官方推薦是用Virtualenv安裝,不過這裡我們僅使用pip進行安裝。

sudo pip3 install tensorflow-gpu

 我現在這裡安裝的是tensorflow_gpu-1.13.1。由於CUDA最新版本是10.1,但是目前最新的tensorflow1.13.1還不支援這個版本,所以只能用CUDA10.0。

推薦搭配:CUDA10.0+CUDNN7.5+tensorflow-gpu1.13.1+python3.6.7

解除安裝cuda和cudnn,重新安裝:

sudo apt remove cudnn*
sudo apt-get remove cuda*
sudo apt-get autoclean
然後在目錄切換到/esr/local/下
cd /usr/local/
sudo rm -r cuda-10.1
搞定啦
可以重新安裝其他版本啦

設定root使用者密碼:

sudo passwd root

以下是編輯 profile檔案命令:
1.su 然後輸入密碼 進入root 2.gedit etc/profile 3.編輯儲存.

首先確認/etc/profile中的路徑包含了cuda10.0的安裝路徑及相應的庫檔案
編輯/etc/profile新增:

export PATH=$PATH:/usr/local/cuda-10.0/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.0/lib64
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda-10.0/lib64

然後
source /etc/profile
使組態檔生效,再次執行。

安裝vim:
sudo apt-get install vim
vim --version
問題報錯:ImportError: libcublas.so.10.0: cannot open shared object file: No such file or directory
由於伺服器TensorFlow經常報這個錯誤,
步驟1:
sudo vim ~/.bashrc
按下i進入編輯
在末位加入:
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.0/lib64
export PATH=$PATH:/usr/local/cuda-10.0/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.0
按下ESC退出編輯,輸入:wq命令進行儲存。
使之生效
source ~/.bashrc
步驟2:
據說在修改了步驟1就好了。但是每次我步驟1弄完,問題依舊存在。但是只需要步驟2,問題就可以解決。
檢查 /usr/local/cuda-10.0/lib64 下是否有 libcublas.so.10.0
如果有,終端輸入:
sudo ldconfig /usr/local/cuda-10.0/lib64

然後終端輸入python

import tensorflow as tf
hello = tf.constant('Hello, TensorFlow!')
sess = tf.Session()
print(sess.run(hello))

進行tensorflow是否安裝成功的驗證。

Ubuntu 18.04安裝Tensorflow(CPU)  https://www.linuxidc.com/Linux/2019-06/158934.htm


IT145.com E-mail:sddin#qq.com