首頁 > 軟體

如何使用Swiss Knife python軟體包

2021-05-17 23:00:34

您是否曾夢想過有一些程式碼片段來讀取磁碟上的任何類型的檔案,同時顯示許多圖形,創建並自動調整大小以將直方圖儲存在python中?

當然,還有Panda,matplotlib,seaborn,但您不必一遍又一遍地編寫相同的程式碼,也不要在Stack-Overflow中搜索一些程式碼片段。

這是utilmy所做的:

大量的One-Liner功能可提高日常工作效率並減少用於日常資料科學和快速輸出的程式碼量。

一些例子:

從utilmy匯入pd_read_file

df = pd_read_file([「「 path1 / data * .parquet」,「 path2 / datab _ *。csv」],n_pool = 4)

以並行方式從磁碟讀取檔案並將其串聯到Pandas資料幀中。

將檔案讀取到Pandas Dataframe

pd_read_file函數使您可以從本地磁碟讀取和連線檔案。 它應用並行化以提高速度和效率。 結果變數是pandas資料框,可與該庫相容的許多其他功能一起使用。

將資料框儲存到檔案

使用pd_to_file()函數,我們可以輕鬆地將pandas資料幀儲存到本地磁碟。 它會自動檢測檔案格式。

繪製多個變數

通過pd_plot_multi()函數,我們可以從pandas資料框中快速繪製多個變數。 我們只需要指定資料框,以及一個包含要繪製的列的列表即可。 完成此操作後,將顯示一個matplotlib圖。

將分層抽樣應用於資料框

pd_sample_strat()函數使我們可以在特定的資料幀列上應用分層取樣。 對於指定列的每個唯一值,將選擇n個隨機樣本,而其餘樣本將被丟棄。

合併數值

裝箱是將連續的數值按稱為箱的間隔進行分組的過程。 使用pd_col_bins函數可以輕鬆完成此操作。 您只需要指定一個pandas資料框,要對其應用合併的數字列以及合併數。

將日期轉換為Unix時間戳

在許多情況下,獲取日期的Unix時間戳可能很有用。 使用to_timeunix()函數可以輕鬆完成此操作。 您只需將日期作為字元串傳遞,然後返回Unix時間戳。

獲取作業系統記憶體資訊

在很多情況下,瞭解可用的RAM記憶體很有用。 os_memory()列印系統的總RAM以及當時可用和已使用的數量。

獲取CPU核心數

os_cpu()函數顯示可用的CPU核心數。 如果您在遠端計算機上工作並且不知道它有多少個核心,則此功能很有用。 此外,您可以使用它來定義支援並行處理的功能中應使用的核心數。

獲取當前工作目錄

從utilmy import os_getcwd

os_getcwd()函數返回作業系統的當前工作目錄,

以正確的Unix格式「 /」(Windows轉換為Unix)。

獲取兩個列表的交集

從utilmy import np_list_intersection

([1、2、3、4],[3、4、5、6])

兩個列表的交集包含兩個列表中包含的元素。 我們可以使用np_list_intersection()函數輕鬆地做到這一點,該函數將兩個列表作為參數。 在此示例中,返回的列表將是[3,4],因為這是兩個常見元素。

好了,本文到此結束。如果對程式設計、計算機、程式設計師方面感興趣的話,歡迎私信聯絡我,隨時交流!點個關注,是對我莫大的鼓勵!


IT145.com E-mail:sddin#qq.com