首頁 > 軟體

python正則表達中的re庫常用方法總結

2022-08-29 14:00:03

元字元 :

預定義字元集

我進行組合一些複雜的正規表示式的時候是為了快捷去晚上找一些現成的模式,然後再自己進行修改,變成符合自己需要的一些正規表示式。

import re
 
# 正規表示式中的一些使用的符號
 
# 匹配出現符合條件的 0 次的或者是 多次
 
str1 = 'qwertyuio1ui3oo467j398k'
 
#  關鍵詞: *    下面的句子就是進行匹配 零次 或者是 多次(多個字元) 符合是數位的意思
pattern = re.compile(r'd*')
res = re.findall(pattern, str1)
print(res)
""""
顯示的結果:
['', '', '', '', '', '', '', '', '', '1', '', '', '3', '', '', '467', '', '398', '', '']
"""
# 關鍵詞: +  匹配一次或者是多次的結果
 
pattern = re.compile(r'd+')
res = re.findall(pattern, str1)
print(res)
"""
顯示結果:
['1', '3', '467', '398']
"""
 
# 關鍵詞: ?  匹配0次或者是1次的結果
 
pattern = re.compile(r'd?')
res = re.findall(pattern, str1)
print(res)
"""
['', '', '', '', '', '', '', '', '', '1', 
'', '', '3', '', '', '4', '6', '7', '', 
'3', '9', '8', '', '']
"""

# {m}精確匹配m次  (比如寫進去的3,那麼他就是匹配到是3個數位字串的所有小字串)
pattern = re.compile(r'd{3}')
res = re.findall(pattern, str1)
print(res)
# 結果:['467', '398']
 
# {m, n} 最少匹配m次,最多匹配n次
# 記住在{}裡面是不能隨便加上空格的?
pattern = re.compile(r'd{1,3}')
res = re.findall(pattern, str1)
print(res)
# 結果:['1', '3', '467', '398']

match()函數只檢測 目標字元(串) 是不是在string的開始位置匹配,search()會掃描整個string查詢匹配, match()只有在0位置匹配成功才會有返回,如果不是開始位置匹配成功,match()就會返回None

程式碼解釋:

import re

m = re.match('lsp','hhttlsp')

if m is not None

        print(m.group())

else:

        print('noneFine')

顯示結果:

noneFine

n = re.search('lsp','hhttlsp')

if n is not None:

        print(n.group())

else:

        print(noneFine')

顯示結果:

lsp

import re
n = re.search('lsp','hhttlsp')
if n:
    print(n.group())
else:
    print('noneFine')
# 顯示結果:
# lsp
m = re.match('lsp','hhttlsp')
if m:
    print(m.group())
else:
    print('noneFine')
# 顯示結果:
# noneFine

python的re庫有兩個函數/方法用於實現搜尋和替換功能: sub()和subn().兩者幾乎一樣,都是將某字串中所有匹配正規表示式的部分進行某種形式的替換.用來替換的部分通常是一個字串,但它也可能是一個函數,該函數返回一個用來替換的字串.subn()和 sub()一樣,但subn()還返回一個表示替換的總數,替換後的字串和表示替換總數的數位一起作為一個擁有兩個元素的元組返回.

# 可以使用sub()方法來進行查詢和替換,sub方法的格式為:
# sub(replacement, string[, count=0])
# replacement是被替換成的文字
# string是需要被替換的文字
# count是一個可選引數,指最大被替換的數量
 
# 下面進行將所有的數位給進行替換掉
pattern = re.compile(r'd')
res = re.sub(pattern, '替換掉的數位  ',str1)
print(res)
# 下文結果,為了方便大家看到換了多少個數位,我使用了換行將字串給換行看出有幾次換了數位
"""
qwertyuio替換掉的數位  
ui替換掉的數位  
oo替換掉的數位  
替換掉的數位  
替換掉的數位  
j替換掉的數位  
替換掉的數位  
替換掉的數位  k
"""
# 加上顯示修改了多少次
res = re.subn(pattern, '替換掉的數位  ',str1)
print(res)
"""
結果:
('qwertyuio替換掉的數位 
 ui替換掉的數位  
 oo替換掉的數位 
  替換掉的數位 
   替換掉的數位  
   j替換掉的數位  
   替換掉的數位 
    替換掉的數位  
    k', 8)
"""

re.split(pattern, string, maxsplit=0, flags=0),如果匹配成功,則返回一個列表,否則返回原string列表;

  • 第1個引數:正規表示式
  • 第2個引數:要匹配查詢的原始字串;
  • 第3個引數:可選引數,表示最大的拆分次數,預設為0,表示全部分割;
  • 第4個引數:可選引數,標誌位,用於控制正規表示式的匹配方式,如:是否區分大小寫,多行匹配等等;

特別注意: 此方法並不是完全匹配。它僅僅決定在字串開始的位置是否匹配。所以當pattern結束時若還有剩餘字元,仍然成功。若想進行完全匹配,可以在表示式末尾加上邊界匹配符'$'

str2 = '自然語言處理123機器學習456深度學習'
pattern = re.compile(r'd+')
res = re.split(pattern, str2)
print(res)
# 結果:
# ['自然語言處理', '機器學習', '深度學習']

Python的re模組是第一個提出解決方案的模組:命名捕獲組和命名後向參照。(?P <name> group)將組的匹配捕獲到後向參照“名稱”中。

str2 = '自然語言處理123機器學習456深度學習'
pattern = re.compile(r'(?P<dota>d+)(?P<lsp>D+)')
m = re.search(pattern, str2)
print(m.group('lsp'))
# 結果為:
# 機器學習
str2 = '自然語言處理123機器學習456深度學習'
pattern = re.compile(r'(?P<dota>d+)(?P<lsp>D+)')
m = re.search(pattern, str2)
print(m.group('dota'))
# 結果為:
# 123

進行號碼的篩選,小嚐試:

# 篩選號碼
str3 = 'number  132-3209-*******'
pattern = re.compile(r'(ddd-dd)')
res = re.search(pattern, str3)
print(res.group())
# 顯示結果:
# 132-32

全部程式碼:

# -*- coding:utf-8 -*-
# @Author : DaFuChen
# @File : demo1.py
# @software: PyCharm

import re
 
# 正規表示式中的一些使用的符號
 
# 匹配出現符合條件的 0 次的或者是 多次
 
str1 = 'qwertyuio1ui3oo467j398k'
 
#  關鍵詞: *    下面的句子就是進行匹配 零次 或者是 多次(多個字元) 符合是數位的意思
pattern = re.compile(r'd*')
res = re.findall(pattern, str1)
print(res)
""""
顯示的結果:
['', '', '', '', '', '', '', '', '', '1', '', '', '3', '', '', '467', '', '398', '', '']
"""
 
# 關鍵詞: +  匹配一次或者是多次的結果
 
pattern = re.compile(r'd+')
res = re.findall(pattern, str1)
print(res)
"""
顯示結果:
['1', '3', '467', '398']
"""
 
# 關鍵詞: ?  匹配0次或者是1次的結果
 
pattern = re.compile(r'd?')
res = re.findall(pattern, str1)
print(res)
"""
['', '', '', '', '', '', '', '', '', '1', 
'', '', '3', '', '', '4', '6', '7', '', 
'3', '9', '8', '', '']
"""
# {m}精確匹配m次  (比如寫進去的3,那麼他就是匹配到是3個數位字串的所有小字串)
pattern = re.compile(r'd{3}')
res = re.findall(pattern, str1)
print(res)
# 結果:['467', '398']
 
# {m, n} 最少匹配m次,最多匹配n次
# 記住在{}裡面是不能隨便加上空格的?
pattern = re.compile(r'd{1,3}')
res = re.findall(pattern, str1)
print(res)
# 結果:['1', '3', '467', '398']
 
import re
 
n = re.search('lsp','hhttlsp')
if n:
    print(n.group())
else:
    print('noneFine')
# 顯示結果:
# lsp
 
m = re.match('lsp','hhttlsp')
if m:
    print(m.group())
else:
    print('noneFine')
# 顯示結果:
# noneFine
 
# 可以使用sub()方法來進行查詢和替換,sub方法的格式為:
# sub(replacement, string[, count=0])
# replacement是被替換成的文字
# string是需要被替換的文字
# count是一個可選引數,指最大被替換的數量
 
# 下面進行將所有的數位給進行替換掉
pattern = re.compile(r'd')
res = re.sub(pattern, '替換掉的數位  ',str1)
print(res)
# 下文結果,為了方便大家看到換了多少個數位,我使用了換行將字串給換行看出有幾次換了數位
"""
qwertyuio替換掉的數位  
ui替換掉的數位  
oo替換掉的數位  
替換掉的數位  
替換掉的數位  
j替換掉的數位  
替換掉的數位  
替換掉的數位  k
"""
 
# 加上顯示修改了多少次
res = re.subn(pattern, '替換掉的數位  ',str1)
print(res)
"""
結果:
('qwertyuio替換掉的數位 
 ui替換掉的數位  
 oo替換掉的數位 
  替換掉的數位 
   替換掉的數位  
   j替換掉的數位  
   替換掉的數位 
    替換掉的數位  
    k', 8)
"""
str2 = '自然語言處理123機器學習456深度學習'
pattern = re.compile(r'd+')
res = re.split(pattern, str2)
print(res)
# 結果:
# ['自然語言處理', '機器學習', '深度學習']
str2 = '自然語言處理123機器學習456深度學習'
pattern = re.compile(r'(?P<dota>d+)(?P<lsp>D+)')
m = re.search(pattern, str2)
print(m.group('dota'))
# 結果為:
# 123
 
# 篩選號碼
str3 = 'number  132-3209-*******'
pattern = re.compile(r'(ddd-dd)')
res = re.search(pattern, str3)
print(res.group())
# 顯示結果:
# 132-32

到此這篇關於python正則表達中的re庫常用方法總結的文章就介紹到這了,更多相關python re庫內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com