您是否曾梦想过有一些代码片段来读取磁盘上的任何类型的文件,同时显示许多图形,创建并自动调整大小以将直方图保存在<em>python</em>中?当然,还有Panda,matplotlib,seaborn,但您不必一遍又一遍地编写相同的代码,也不要在Stack
2021-05-17 23:00:34
您是否曾夢想過有一些程式碼片段來讀取磁碟上的任何類型的檔案,同時顯示許多圖形,創建並自動調整大小以將直方圖儲存在python中?
當然,還有Panda,matplotlib,seaborn,但您不必一遍又一遍地編寫相同的程式碼,也不要在Stack-Overflow中搜索一些程式碼片段。
這是utilmy所做的:
大量的One-Liner功能可提高日常工作效率並減少用於日常資料科學和快速輸出的程式碼量。
一些例子:
從utilmy匯入pd_read_file
df = pd_read_file([「「 path1 / data * .parquet」,「 path2 / datab _ *。csv」],n_pool = 4)
以並行方式從磁碟讀取檔案並將其串聯到Pandas資料幀中。
將檔案讀取到Pandas Dataframe
pd_read_file函數使您可以從本地磁碟讀取和連線檔案。 它應用並行化以提高速度和效率。 結果變數是pandas資料框,可與該庫相容的許多其他功能一起使用。
將資料框儲存到檔案
使用pd_to_file()函數,我們可以輕鬆地將pandas資料幀儲存到本地磁碟。 它會自動檢測檔案格式。
繪製多個變數
通過pd_plot_multi()函數,我們可以從pandas資料框中快速繪製多個變數。 我們只需要指定資料框,以及一個包含要繪製的列的列表即可。 完成此操作後,將顯示一個matplotlib圖。
將分層抽樣應用於資料框
pd_sample_strat()函數使我們可以在特定的資料幀列上應用分層取樣。 對於指定列的每個唯一值,將選擇n個隨機樣本,而其餘樣本將被丟棄。
合併數值
裝箱是將連續的數值按稱為箱的間隔進行分組的過程。 使用pd_col_bins函數可以輕鬆完成此操作。 您只需要指定一個pandas資料框,要對其應用合併的數字列以及合併數。
將日期轉換為Unix時間戳
在許多情況下,獲取日期的Unix時間戳可能很有用。 使用to_timeunix()函數可以輕鬆完成此操作。 您只需將日期作為字元串傳遞,然後返回Unix時間戳。
獲取作業系統記憶體資訊
在很多情況下,瞭解可用的RAM記憶體很有用。 os_memory()列印系統的總RAM以及當時可用和已使用的數量。
獲取CPU核心數
os_cpu()函數顯示可用的CPU核心數。 如果您在遠端計算機上工作並且不知道它有多少個核心,則此功能很有用。 此外,您可以使用它來定義支援並行處理的功能中應使用的核心數。
獲取當前工作目錄
從utilmy import os_getcwd
os_getcwd()函數返回作業系統的當前工作目錄,
以正確的Unix格式「 /」(Windows轉換為Unix)。
獲取兩個列表的交集
從utilmy import np_list_intersection
([1、2、3、4],[3、4、5、6])
兩個列表的交集包含兩個列表中包含的元素。 我們可以使用np_list_intersection()函數輕鬆地做到這一點,該函數將兩個列表作為參數。 在此示例中,返回的列表將是[3,4],因為這是兩個常見元素。
好了,本文到此結束。如果對程式設計、計算機、程式設計師方面感興趣的話,歡迎私信聯絡我,隨時交流!點個關注,是對我莫大的鼓勵!
相關文章
您是否曾梦想过有一些代码片段来读取磁盘上的任何类型的文件,同时显示许多图形,创建并自动调整大小以将直方图保存在<em>python</em>中?当然,还有Panda,matplotlib,seaborn,但您不必一遍又一遍地编写相同的代码,也不要在Stack
2021-05-17 23:00:34
为给定的数据科学问题生成第一个模型可能非常简单。建立具有高精确度的有效模型要困难得多。数据科学家必须清理数据,完善功能,找到正确的指标,找到正确的验证策略,正确构建测试和训练集,以及微调所选模型的参数。这些步骤
2021-05-17 23:00:30
编程上机样题测试均使用使用win10系统、<em>python</em>3.9,与win7系统、<em>python</em>3.7效果基本一致,如有不同之处请留言,喜欢的朋友给个关注和收藏,方便以后查阅。上机样题 下列程序求1到20之间所有偶数的和,请完善:
2021-05-17 23:00:18
<em>AMD</em> 自第二代 EPYC " Rome "推出后,以核心数量、通道技术等在服务器市场迅速突破现况,当前也成为许多资料中心、超算系统的热门选择,今年第三代 EPYC " Milan "登场后的市场表现也仍旧相当看好,而根据 Videocard
2021-05-17 22:31:49
会议现场,来自中国电信、中国移动、中国联通、华为、英特尔、<em>高通</em>等多位通信运营商及产业链代表分别聚焦5G建设发展、数字化转型、工业互联网应用、网络安全基座等主题进行演讲。与此同时,《2020河南省互联网
2021-05-17 22:31:17
这块屏幕也是夏普自研自产的,号称是“Pro IGZO OLED”,拥有高达2000nit的峰值亮度,2000万的对比度,还有10bit色深。从参数上看完全可以媲美顶级的三星OLED屏幕。它的SoC则是<em>高通</em>骁龙888,并配备了LPDDR 5 12GB + U
2021-05-17 22:31:09