首頁 > 軟體

基於Python實現簡單的漢字拼音轉換工具

2022-09-05 14:01:23

將漢字轉為拼音,可以用於批次漢字註音、文字排序、拼音檢索文字等常見場景。

現在網際網路上有許多拼音轉換工具,基於Python的開源模組也不少,今天給大家介紹一個功能特性最多的模組:  pypinyin ,它支援以下特性:

  • 1. 根據片語智慧匹配最正確的拼音。
  • 2. 支援多音字。
  • 3. 簡單的繁體支援, 註音支援。
  • 4. 支援多種不同拼音/註音風格。
  • 5. 命令列工具一鍵轉化

1.準備

開始之前,你要確保Python和pip已經成功安裝在電腦上,如果沒有,可以存取這篇文章:超詳細Python安裝指南 進行安裝。

(可選1) 如果你用Python的目的是資料分析,可以直接安裝Anaconda,它內建了Python和pip.

(可選2) 此外,推薦大家用VSCode編輯器,它有許多的優點

請選擇以下任一種方式輸入命令安裝依賴

1. Windows 環境 開啟 Cmd (開始-執行-CMD)。

2. MacOS 環境 開啟 Terminal (command+空格輸入Terminal)。

3. 如果你用的是 VSCode編輯器 或 Pycharm,可以直接使用介面下方的Terminal.

pip install pypinyin

2.基本使用

最普通的拼音轉化方法如下:

# Python實用寶典
from pypinyin import pinyin, lazy_pinyin, Style
pinyin('中心')
# [['zhōng'], ['xīn']]

識別多音字:

# Python實用寶典
from pypinyin import pinyin, lazy_pinyin, Style
pinyin('中心', heteronym=True) # 啟用多音字模式
# [['zhōng', 'zhòng'], ['xīn']]

設定輸出風格,只識別首字母:

# Python實用寶典
from pypinyin import pinyin, lazy_pinyin, Style
pinyin('中心', style=Style.FIRST_LETTER) # 設定拼音風格
# [['z'], ['x']]

修改音調輸出位置,在相應字母的後面顯示音調,或者拼音的最後顯示音調:

# Python實用寶典
from pypinyin import pinyin, lazy_pinyin, Style

# TONE2 在相應字母的後面顯示音調
pinyin('中心', style=Style.TONE2, heteronym=True)
# [['zho1ng', 'zho4ng'], ['xi1n']]

# TONE3 拼音的最後顯示音調
pinyin('中心', style=Style.TONE3, heteronym=True)
# [['zhong1', 'zhong4'], ['xin1']]

不考慮多音字的情況:

# Python實用寶典
from pypinyin import pinyin, lazy_pinyin, Style
lazy_pinyin('中心') # 不考慮多音字的情況
# ['zhong', 'xin']

不使用v來代替ü:

# Python實用寶典
from pypinyin import pinyin, lazy_pinyin, Style
lazy_pinyin('戰略', v_to_u=True) # 不使用 v 表示 ü
# ['zhan', 'lüe']

標記輕聲:

# Python實用寶典
from pypinyin import pinyin, lazy_pinyin, Style
# 使用 5 標識輕聲
lazy_pinyin('衣裳', style=Style.TONE3, neutral_tone_with_five=True)
# ['yi1', 'shang5']

使用命令列一鍵識別拼音:

# Python實用寶典
python -m pypinyin 音樂
# yīn yuè

3.高階使用

自定義拼音顯示風格

我們可以通過 register() 來實現自定義拼音風格的需求:

from pypinyin import lazy_pinyin

from pypinyin.style import register

@register('kiss')
def kiss(pinyin, **kwargs):
    return '

IT145.com E-mail:sddin#qq.com