2021-05-12 14:32:11
Ubuntu 18.04安裝Tensorflow(GPU)
首先拉取遠端倉庫
sudo add-apt-repository ppa:jonathonf/python-3.6
更新源
sudo apt-get update
線上安裝
sudo apt-get install python3.6
補充,其實安裝python3用一句:sudo apt-get install python3-dev 即可。檢視版本:python3 --version
更改預設值,python預設為Python2,現在修改為Python3
sudo update-alternatives --install /usr/bin/python python /usr/bin/python2 100
sudo update-alternatives --install /usr/bin/python python /usr/bin/python3 150
2.Ubuntu安裝nvidia顯示卡驅動(參考上一篇部落格)
檢視nvidia顯示卡驅動版本
nvidia-smi
3.安裝對應版本的CUDA
在安裝CUDA時一定要注意其與英偉達顯示卡驅動以及Linux系統和GCC版本的對應關係,如果版本之間不匹配,是安裝不成功的。
CUDA與Driver的對應版本
參考連結:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
cuda8.0與Linux系統以及GCC的對應關係
參考連結:https://docs.nvidia.com/cuda/archive/8.0/cuda-installation-guide-linux/index.html
cuda9.0與Linux系統以及GCC的對應關係
參考連結:https://docs.nvidia.com/cuda/archive/9.0/cuda-installation-guide-linux/index.html
cuda10.0與Linux系統以及GCC的對應關係
參考連結:https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html
檢視gcc版本:
gcc -v
由於RTX2060顯示卡驅動在Ubuntu18.04上是418.56版本,所以選擇對應的cuda10.1版本安裝
cuda官網下載:https://developer.nvidia.com/cuda-toolkit
另附歷史版本:https://developer.nvidia.com/cuda-toolkit-archive
CUDA安裝命令:
sudo sh cuda_xxx_linux.run
4.安裝CUDA對應的CUDNN版本
cudnn官網下載(需要註冊):https://developer.nvidia.com/cudnn
另附:https://developer.nvidia.com/rdp/cudnn-archive
下載Ubuntu18.04對應的CUDNN安裝包,然後進入CUDNN安裝包所在目錄,執行以下命令:
sudo dpkg -i runtime包.deb
sudo dpkg -i developer包.deb
sudo dpkg -i 程式碼sample包.deb
至此,CUDNN安裝完成。
5.安裝對應版本的Tensorflow
首先要清楚最新版Tensorflow最多支援到CUDA哪個版本?
https://www.tensorflow.org/install/install_sources
安裝pip3(針對python3):
sudo apt-get install python3-pip
官方推薦是用Virtualenv安裝,不過這裡我們僅使用pip進行安裝。
sudo pip3 install tensorflow-gpu
我現在這裡安裝的是tensorflow_gpu-1.13.1。由於CUDA最新版本是10.1,但是目前最新的tensorflow1.13.1還不支援這個版本,所以只能用CUDA10.0。
推薦搭配:CUDA10.0+CUDNN7.5+tensorflow-gpu1.13.1+python3.6.7
解除安裝cuda和cudnn,重新安裝:
sudo apt remove cudnn*
sudo apt-get remove cuda*
sudo apt-get autoclean
然後在目錄切換到/esr/local/下
cd /usr/local/
sudo rm -r cuda-10.1
搞定啦
可以重新安裝其他版本啦
設定root使用者密碼:
sudo passwd root
以下是編輯 profile檔案命令:
1.su 然後輸入密碼 進入root 2.gedit etc/profile 3.編輯儲存.
首先確認/etc/profile中的路徑包含了cuda10.0的安裝路徑及相應的庫檔案
編輯/etc/profile新增:
export PATH=$PATH:/usr/local/cuda-10.0/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.0/lib64
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda-10.0/lib64
然後
source /etc/profile
使組態檔生效,再次執行。
安裝vim:
sudo apt-get install vim
vim --version
問題報錯:ImportError: libcublas.so.10.0: cannot open shared object file: No such file or directory
由於伺服器TensorFlow經常報這個錯誤,
步驟1:
sudo vim ~/.bashrc
按下i進入編輯
在末位加入:
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.0/lib64
export PATH=$PATH:/usr/local/cuda-10.0/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.0
按下ESC退出編輯,輸入:wq命令進行儲存。
使之生效
source ~/.bashrc
步驟2:
據說在修改了步驟1就好了。但是每次我步驟1弄完,問題依舊存在。但是只需要步驟2,問題就可以解決。
檢查 /usr/local/cuda-10.0/lib64 下是否有 libcublas.so.10.0
如果有,終端輸入:
sudo ldconfig /usr/local/cuda-10.0/lib64
然後終端輸入python
import tensorflow as tf
hello = tf.constant('Hello, TensorFlow!')
sess = tf.Session()
print(sess.run(hello))
進行tensorflow是否安裝成功的驗證。
Ubuntu 18.04安裝Tensorflow(CPU) https://www.linuxidc.com/Linux/2019-06/158934.htm
相關文章