<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
有沒有頭疼過百度雲盤都要塞滿了,可是又沒有工具能剔除大量重複無用的檔案?這裡教你一個簡單的方法,通過整理目錄的方式來處理我們雲盤中無用的檔案吧。
使用 Everything 找到雲盤快取 db 檔案,複製到指令碼的目錄下。
我們發現這個是一個 sqlite3 的檔案,用 Navicat 開啟先看看。
我們所有云盤的檔案以及對應的路徑儲存在 cache_file 中,直接匯出可能會有些問題,所以我們用 pandas 來處理資料就可以了。
我的雲盤匯出來了 40MB 的目錄資料,看著都頭疼。
把雲盤的目錄資料匯出到 excel,後去該怎麼處理就怎麼處理吧。程式碼非常少,如果喜歡用 python 處理就用 pandas 處理,如果感覺有困難直接在 excel 中處理就可以了。
import sqlite3 import pandas as pd file_dict = {} con = sqlite3.connect('BaiduYunCacheFileV0.db') cursor = con.cursor() cursor.execute("select * from cache_file") values = cursor.fetchall() df = pd.DataFrame(values,columns=["id","fid","parent_path","server_filename","file_size","md5","isdir","category","server_mtime","local_mtime","reserved1","reserved2","reserved3","reserved4","reserved5","reserved6","reserved7","reserved8","reserved9"]) df.to_excel("data.xlsx")
這個由於百度雲盤沒有對應的API介面可以使用爬蟲的方式進行網頁的操作對重複資料進行刪除,但是容易誤操作,所以還是手動把要處理的資料整理出來然後進行操作把。
通過檔名稱判斷重複,有了結果後續自己處理就好了。
df["server_filename"].duplicated() 0 False 1 False 2 False 3 False 4 False ... 379563 False 379564 False 379565 True 379566 True 379567 False Name: server_filename, Length: 379568, dtype: bool df[df["server_filename"].duplicated()]["server_filename"] 188 WE_rk_nos06.txt 252 django.po 254 django.po 255 django.po 256 django.po ... 378517 video.mp4 378518 top_level.txt 378543 Blog_articleinfo.xlsx 379565 apps 379566 職業培訓規劃.mmap Name: server_filename, Length: 152409, dtype: object
到此這篇關於Python實現一鍵整理百度雲盤中重複無用檔案的文章就介紹到這了,更多相關Python整理重複檔案內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45