<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
需求說明:將單個或者多個Excel檔案資料進行去重操作,去重的列可以通過自定義制定。
開始原始碼說明之前,先說明一下工具的使用過程。
1、準備需要去重的資料檔案。
2、使用工具執行去重操作。
3、處理完成後的結果檔案。
PyQt5 介面UI相關的模組參照
from PyQt5.QtWidgets import * from PyQt5.QtGui import *
核心元件
from PyQt5.QtCore import *
主題樣式模組參照
from QCandyUi import CandyWindow
在這個應用中使用一個預設的楊氏模組QCandyUi,可以改變整個應用的主題顏色設計不用一個控制元件一個控制元件的去修改樣式。有一個不好的地方就是應用本身設定的標題和應用圖示不能生效,必須利用這個樣式控制元件CandyWindow來修改,就像下面這樣需要將我們自己寫的UI空間放到裡面。
# w = CandyWindow.createWindow(EDataDel(), theme='blueGreen', title='Excel批資料去重器 公眾號:[Python 集中營]', # ico_path='資料去重.ico') # w.show()
應用操作相關模組
import sys import os
Excel資料處理模組
import pandas as pd import openpyxl as pxl
UI介面佈局設計、號誌槽函數繫結實現
class EDataDel(QWidget): def __init__(self): super(EDataDel, self).__init__() self.init_ui() def init_ui(self): self.brower = QTextBrowser() self.brower.setReadOnly(True) self.brower.setFont(QFont('微軟雅黑', 8)) self.brower.setPlaceholderText('處理程序展示區域...') self.brower.ensureCursorVisible() form = QFormLayout() self.file_paths = QLineEdit() self.file_paths.setReadOnly(True) self.file_paths_btn = QPushButton() self.file_paths_btn.setText('載入批檔案') self.file_paths_btn.clicked.connect(self.file_paths_btn_click) self.colums_label = QLabel() self.colums_label.setText('自定義去重複列') self.colums_text = QLineEdit() self.colums_text.setPlaceholderText('列名1,列名2,列名3,...') form.addRow(self.file_paths, self.file_paths_btn) form.addRow(self.colums_label, self.colums_text) self.work = DataWork(self) self.work.trigger.connect(self.update_log) self.work.finished.connect(self.finished) vbox = QVBoxLayout() self.start_btn = QPushButton() self.start_btn.setText('開始執行') self.start_btn.clicked.connect(self.start_btn_click) vbox.addLayout(form) vbox.addWidget(self.start_btn) hbox = QHBoxLayout() hbox.addWidget(self.brower) hbox.addLayout(vbox) self.setLayout(hbox) def file_paths_btn_click(self): paths = QFileDialog.getOpenFileNames(self, '選擇檔案', os.getcwd(), 'Excel Files(*.xlsx)') files = paths[0] path_strs = '' for file in files: path_strs = path_strs + file + ';' self.file_paths.setText(path_strs) if self.file_paths.text().strip() != '': self.update_log('已經完成批檔案路徑載入!') else: self.update_log('沒有選擇任何檔案!') def save_dir_btn_click(self): directory = QFileDialog.getExistingDirectory(self, '選擇資料夾', os.getcwd()) self.save_dir.setText(directory) def update_log(self, text): cursor = self.brower.textCursor() cursor.movePosition(QTextCursor.End) self.brower.append(text) self.brower.setTextCursor(cursor) self.brower.ensureCursorVisible() def start_btn_click(self): self.start_btn.setEnabled(False) self.work.start() def finished(self, finished): if finished is True: self.start_btn.setEnabled(True)
建立子執行緒,處理業務邏輯(清理Excel重複檔案)
class DataWork(QThread): trigger = pyqtSignal(str) finished = pyqtSignal(bool) def __init__(self, parent=None): super(DataWork, self).__init__(parent) self.parent = parent self.working = True def __del__(self): self.working = False self.wait() def run(self): self.trigger.emit('啟動批次處理子執行緒...') file_paths = self.parent.file_paths.text().strip() colums_text = self.parent.colums_text.text().strip() colums = [] if ',' in colums_text: colums = colums_text.split(',') else: colums.append(colums_text) self.trigger.emit('獲取設定項完成!') for file in file_paths.split(';'): if file.strip() != '': web_sheet = pxl.load_workbook(file) sheets = web_sheet.sheetnames print(file) new_file = file.split('.')[0] + '_已去重.' + file.split('.')[1] print(new_file) writer = pd.ExcelWriter(new_file) for sheet in sheets: sheet_name = sheet.title() print(sheet_name) self.trigger.emit('準備處理工作表名稱:' + str(sheet.title())) data_frame = pd.read_excel(file, sheet_name=sheet_name) print(data_frame) repe = data_frame.duplicated(subset=colums) repe = repe[repe] print(data_frame.iloc[repe.index]) res = data_frame.drop_duplicates(subset=colums) print(res) self.trigger.emit(str(sheet.title()) + ':已清除') res.to_excel(writer, sheet_name, index=False) writer.save() else: self.trigger.emit('當前檔案路徑為空,繼續...') self.trigger.emit('資料處理完成...') self.finished.emit(True)
使用主函數啟動整個應用
if __name__ == '__main__': app = QApplication(sys.argv) w = CandyWindow.createWindow(EDataDel(), theme='blueGreen', title='Excel批資料去重器 公眾號:[Python 集中營]', ico_path='資料去重.ico') w.show() sys.exit(app.exec_())
以上就是基於PyQt5製作Excel檔案資料去重小工具的詳細內容,更多關於PyQt5資料去重的資料請關注it145.com其它相關文章!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45