首頁 > 軟體

Python進行資料分析及相關Package的安裝

2020-06-16 17:13:23

一、為什麼要使用Python進行資料分析?

Python擁有一個巨大的活躍的科學計算社群,擁有不斷改良的庫,能夠輕鬆的整合C,C++,Fortran程式碼(Cython專案),可以同時用於研究和原型的構建以及生產系統的構建。

二、Python的優勢與劣勢:

1.Python是一種直譯語言,執行速度比編譯型資料慢。
2.由於python有一個全域性直譯器鎖(GIL),防止直譯器同時執行多條python位元組碼,所以python不適用於高並行、多執行緒的應用程式。
 
三、使用Python進行資料分析常用的擴充套件包。
 
目前初始階段的學習主要涉及4個包的安裝:numpy、scipy、pandas、matplotlib
我筆電裡安裝的是Python2.7版本,在安裝了pip和setuptools工具,關於pip和setuptools工具的安裝詳見相關筆記。
最初使用的安裝命令很簡單:
pip install pandas
pip install numpy
pip install scipy
pip install matplotlib

但是只安裝成功了numpy和matplotlib兩個包,pandas和scipy安裝失敗,查閱了相關資料發現可能是版本問題或者包的依賴相關。

最終在stack overflow發現了一個很棒的Python包提供網址:http://www.lfd.uci.edu/~gohlke/pythonlibs/

當然官網也是非常好的,但是有些包更新的太頻繁,官網可能不提供2.7某些包的支援。

--這裡要Mark一下,後邊爭取寫一個爬蟲,搞下來所有的包防止丟失。

以上網址是加州大學歐文分校提供的Python相關庫的下載地址,修改#後邊的名字可以進去其他包的下載頁面,此頁面中提供了安裝某個包需要依賴的前置包的說明,非常友好。

依賴包說明類似:

Pandas, a cross-section and time series data analysis toolkit.
Requires numpy, dateutil, pytz, setuptools, and optionally numexpr, bottleneck, scipy, matplotlib, pytables, lxml, xarray, blosc, backports.lzma, statsmodels, sqlalchemy and other dependencies.

然後就是一堆的pandas下載地址。

最終根據各個包的相關性先安裝了numpy+mkl的whl檔案,然後是安裝scipy最後是pandas。

安裝的方法如下:

1.下載對應的4個包放在D:目錄下(很奇怪我筆電是AMD64位元的但是安裝amd64版本的包報不支援的platform的錯誤,安裝了32位元的可以正常import)

2.cmd命令列進入D:目錄執行:pip install <包的全名>進行安裝。(如果已安裝了其他錯誤的版本,使用pip uninstall解除安裝)

最後使用如下類似命令檢視包的安裝位置:

 

Python 安裝setuptools和pip工具

 

setuptools模組和pip模組是python進行第三方庫擴充套件的極重要工具,例如我們在需要安裝一些爬蟲或者資料分析的包時就可以使用pip install命令來直接安裝這些包了,因此pip工具一定要提前安裝。

 

一、安裝setuptools

 

在python互動介面執行如下命令,指令碼我單獨拿出來:

 

 

from urllib import urlopen
data = urlopen('http://peak.telecommunity.com/dist/ez_setup.py')
open('ez_setup.py','wb').write(data.read())
exit()

 

執行完畢後可以發現在C:UsersAdministrator目錄下出現了一個ez_setup.py的檔案,cmd執行python ez_setup.py,則安裝setuptools完畢

 

二、安裝pip工具

 

安裝setuptool之後就可以安裝pip啦。

 

安裝setuptools完畢後在C:Python27Scripts就可以看到easy_install的模組了,可以使用cmd命令進入此目錄,執行easy_install.exe pip來安裝pip模組。

 

執行安裝完畢後就可以在C:Python27Scripts下看到pip.exe工具,將C:Python27Scripts加入PATH則可以安裝其他第三方標準庫模組了,例如:

 

pip install requests可以安裝requests模組。

本文永久更新連結地址http://www.linuxidc.com/Linux/2017-06/144606.htm


IT145.com E-mail:sddin#qq.com