首頁 > 軟體

八個超級好用的Python自動化指令碼(小結)

2022-07-28 22:03:41

每天你都可能會執行許多重複的任務,例如閱讀新聞、發郵件、檢視天氣、開啟書籤、清理資料夾等等,使用自動化指令碼,就無需手動一次又一次地完成這些任務,非常方便。而在某種程度上,Python 就是自動化的代名詞。

1、自動化閱讀網頁新聞

這個指令碼能夠實現從網頁中抓取文字,然後自動化語音朗讀,當你想聽新聞的時候,這是個不錯的選擇。

程式碼分為兩大部分,第一通過爬蟲抓取網頁文字呢,第二通過閱讀工具來朗讀文字。

需要的第三方庫:

  • Beautiful Soup - 經典的HTML/XML文字解析器,用來提取爬下來的網頁資訊
  • requests - 好用到逆天的HTTP工具,用來向網頁傳送請求獲取資料
  • Pyttsx3 - 將文字轉換為語音,並控制速率、頻率和語音
import pyttsx3
import requests
from bs4 import BeautifulSoup
engine = pyttsx3.init('sapi5')
voices = engine.getProperty('voices')
newVoiceRate = 130                       ## Reduce The Speech Rate
engine.setProperty('rate',newVoiceRate)
engine.setProperty('voice', voices[1].id)
def speak(audio):
  engine.say(audio)
  engine.runAndWait()
text = str(input("Paste articlen"))
res = requests.get(text)
soup = BeautifulSoup(res.text,'html.parser')

articles = []
for i in range(len(soup.select('.p'))):
    article = soup.select('.p')[i].getText().strip()
    articles.append(article)
text = " ".join(articles)
speak(text)
# engine.save_to_file(text, 'test.mp3') ## If you want to save the speech as a audio file
engine.runAndWait()

2、自動化資料探索

資料探索是資料科學專案的第一步,你需要了解資料的基本資訊才能進一步分析更深的價值。

一般我們會用pandas、matplotlib等工具來探索資料,但需要自己編寫大量程式碼,如果想提高效率,Dtale是個不錯的選擇。

Dtale特點是用一行程式碼生成自動化分析報告,它結合了Flask後端和React前端,為我們提供了一種檢視和分析Pandas資料結構的簡便方法。

我們可以在Jupyter上實用Dtale。

需要的第三方庫:Dtale - 自動生成分析報告

### Importing Seaborn Library For Some Datasets
import seaborn as sns

### Printing Inbuilt Datasets of Seaborn Library
print(sns.get_dataset_names())

### Loading Titanic Dataset
df=sns.load_dataset('titanic')

### Importing The Library
import dtale

#### Generating Quick Summary
dtale.show(df)

3、自動傳送多封郵件

這個指令碼可以幫助我們批次定時傳送郵件,郵件內容、附件也可以自定義調整,非常的實用。

相比較郵件使用者端,Python指令碼的優點在於可以智慧、批次、高客製化化地部署郵件服務。

需要的第三方庫:

  • Email - 用於管理電子郵件訊息;
  • Smtlib - 向SMTP伺服器傳送電子郵件,它定義了一個 SMTP 使用者端對談物件,該物件可將郵件傳送到網際網路上任何帶有 SMTP 或ESMTP 監聽程式的計算機;
  • Pandas - 用於資料分析清洗地工具;
import smtplib 
from email.message import EmailMessage
import pandas as pd

def send_email(remail, rsubject, rcontent):
    email = EmailMessage()                          ## Creating a object for EmailMessage
    email['from'] = 'The Pythoneer Here'            ## Person who is sending
    email['to'] = remail                            ## Whom we are sending
    email['subject'] = rsubject                     ## Subject of email
    email.set_content(rcontent)                     ## content of email
    with smtplib.SMTP(host='smtp.gmail.com',port=587)as smtp:     
        smtp.ehlo()                                 ## server object
        smtp.starttls()                             ## used to send data between server and client
        smtp.login("deltadelta371@gmail.com","delta@371") ## login id and password of gmail
        smtp.send_message(email)                    ## Sending email
        print("email send to ",remail)              ## Printing success message

if __name__ == '__main__':
    df = pd.read_excel('list.xlsx')
    length = len(df)+1

    for index, item in df.iterrows():
        email = item[0]
        subject = item[1]
        content = item[2]

        send_email(email,subject,content)

4、將 PDF 轉換為音訊檔

指令碼可以將 pdf 轉換為音訊檔,原理也很簡單,首先用 PyPDF 提取 pdf 中的文字,然後用 Pyttsx3 將文字轉語音。

import pyttsx3,PyPDF2 
pdfreader = PyPDF2.PdfFileReader(open('story.pdf','rb')) 
speaker = pyttsx3.init() 
for page_num in range(pdfreader.numPages):    
    text = pdfreader.getPage(page_num).extractText()  ## extracting text from the PDF 
    cleaned_text = text.strip().replace('n',' ')  ## Removes unnecessary spaces and break lines 
    print(cleaned_text)                ## Print the text from PDF 
    #speaker.say(cleaned_text)        ## Let The Speaker Speak The Text 
    speaker.save_to_file(cleaned_text,'story.mp3')  ## Saving Text In a audio file 'story.mp3' 
    speaker.runAndWait() 
speaker.stop() 

5、從列表中播放隨機音樂

這個指令碼會從歌曲資料夾中隨機選擇一首歌進行播放,需要注意的是 os.startfile 僅支援 Windows 系統。

import random, os 
music_dir = 'G:\new english songs' 
songs = os.listdir(music_dir) 
song = random.randint(0,len(songs)) 
print(songs[song])  ## Prints The Song Name 
os.startfile(os.path.join(music_dir, songs[0]))  

6、智慧天氣資訊

國家氣象局網站提供獲取天氣預報的 API,直接返回 json 格式的天氣資料。所以只需要從 json 裡取出對應的欄位就可以了。

下面是指定城市(縣、區)天氣的網址,直接開啟網址,就會返回對應城市的天氣資料。比如:

http://www.weather.com.cn/data/cityinfo/101021200.html 上海徐彙區對應的天氣網址。

具體程式碼如下:

import requests 
import json 
import logging as log 

def get_weather_wind(url): 
    r = requests.get(url) 
    if r.status_code != 200: 
        log.error("Can't get weather data!") 
    info = json.loads(r.content.decode()) 

    # get wind data 
    data = info['weatherinfo'] 
    WD = data['WD'] 
    WS = data['WS'] 
    return "{}({})".format(WD, WS) 

def get_weather_city(url): 
    # open url and get return data 
    r = requests.get(url) 
    if r.status_code != 200: 
        log.error("Can't get weather data!") 

    # convert string to json 
    info = json.loads(r.content.decode()) 

    # get useful data 
    data = info['weatherinfo'] 
    city = data['city'] 
    temp1 = data['temp1'] 
    temp2 = data['temp2'] 
    weather = data['weather'] 
    return "{} {} {}~{}".format(city, weather, temp1, temp2) 

if __name__ == '__main__': 
    msg = """**天氣提醒**:   

{} {}   
{} {}   

來源: 國家氣象局 
""".format( 
    get_weather_city('http://www.weather.com.cn/data/cityinfo/101021200.html'), 
    get_weather_wind('http://www.weather.com.cn/data/sk/101021200.html'), 
    get_weather_city('http://www.weather.com.cn/data/cityinfo/101020900.html'), 
    get_weather_wind('http://www.weather.com.cn/data/sk/101020900.html') 
) 
    print(msg) 

執行結果如下所示:

7、長網址變短網址

有時,那些大URL變得非常惱火,很難閱讀和共用,此腳可以將長網址變為短網址。

import contextlib 
from urllib.parse import urlencode 
from urllib.request import urlopen 
import sys 

def make_tiny(url): 
 request_url = ('http://tinyurl.com/api-create.php?' +  
 urlencode({'url':url})) 
 with contextlib.closing(urlopen(request_url)) as response: 
  return response.read().decode('utf-8') 

def main(): 
 for tinyurl in map(make_tiny, sys.argv[1:]): 
  print(tinyurl) 

if __name__ == '__main__': 
 main() 

這個指令碼非常實用,比如說有內容平臺是遮蔽公眾號文章的,那麼就可以把公眾號文章的連結變為短連結,然後插入其中,就可以實現繞過。

8、清理下載資料夾

世界上最混亂的事情之一是開發人員的下載資料夾,裡面存放了很多雜亂無章的檔案,此指令碼將根據大小限制來清理您的下載資料夾,有限清理比較舊的檔案。

import os 
import threading 
import time 

def get_file_list(file_path): 
#檔案按最後修改時間排序 
    dir_list = os.listdir(file_path) 
    if not dir_list: 
        return 
    else: 
        dir_list = sorted(dir_list, key=lambda x: os.path.getmtime(os.path.join(file_path, x))) 
    return dir_list 

def get_size(file_path): 
    """[summary] 
    Args: 
        file_path ([type]): [目錄] 

    Returns: 
        [type]: 返回目錄大小,MB 
    """ 
    totalsize=0 
    for filename in os.listdir(file_path): 
        totalsize=totalsize+os.path.getsize(os.path.join(file_path, filename)) 
    #print(totalsize / 1024 / 1024) 
    return totalsize / 1024 / 1024 

def detect_file_size(file_path, size_Max, size_Del): 
    """[summary] 
    Args: 
        file_path ([type]): [檔案目錄] 
        size_Max ([type]): [資料夾最大大小] 
        size_Del ([type]): [超過size_Max時要刪除的大小] 
    """ 
    print(get_size(file_path)) 
    if get_size(file_path) > size_Max: 
        fileList = get_file_list(file_path) 
        for i in range(len(fileList)): 
            if get_size(file_path) > (size_Max - size_Del): 
                print ("del :%d %s" % (i + 1, fileList[i])) 
                #os.remove(file_path + fileList[i]) 

到此這篇關於八個超級好用的Python自動化指令碼(小結)的文章就介紹到這了,更多相關Python自動化指令碼內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com