首頁 > 軟體

python中使用正規表示式的方法詳解

2022-03-29 19:00:53

在python中使用正規表示式,主要通過下面的幾個方法

search(pattern, string, flags=0)

  • 掃描整個string並返回匹配pattern的結果(None或物件)
  • 有匹配的字串的話返回一個物件(包含符合匹配條件的第一個字串),否則返回None
import re
#匯入正則庫

content = 'Hello 1234567 Hello 666'
#要匹配的文字
res = 'Hellos'
#正則字串

result = re.search(res, content)
if result is not None:
    print(result.group())
    #輸出匹配得到的字串 'hello'(返回的得是第一個'hello')
       
print(result.span())
#輸出輸出匹配的範圍(匹配到的字串在原字串中的位置的範圍)

res1 = 'Hellos(d)(d+)'
result = re.search(res1, content)
print(result.group(1))
#group(1)表示匹配到的第一個組(即正則字串中的第一個括號)的內容
print(result.group(2))

findall(pattern, string, flags=0)

  • 掃描整個context並返回匹配res的結果(None或列表)
  • 有匹配的字串的話返回一個列表(符合匹配條件的每個子字串作為它的一個元素),否則返回None
import re

res = 'Hellos'
results = re.findall(res, content)
if results is not None:
   print(results)
   #輸出: ['hello','hello']

res1 = 'Hellos(d)(d+)'
results = re.findall(res1, content)
if result is not None:
    print(results) 
    # 當正則字串中出現括號時,所得到列表的每個元素是元組
    # 每個元組的元素都是依次匹配到的括號內的表示式的結果
    #輸出: [('1','1234567'),('6','666')]

sub(pattern, repl, string, count=0, flags=0)

  • 可以來修改文字
  • 用將用pattern匹配string所得的字串替換成repl
import re

content = '54aK54yr5oiR54ix5L2g'
res = 'd+'
content = re.sub(res, '', content)
print(content)

compile(pattern, flags=0)

將正規表示式res編譯成一個正則物件並返回,以便複用

import re

content1 = '2019-12-15 12:00'
content2 = '2019-12-17 12:55'
content3 = '2019-12-22 13:21'
pattern = re.compile('d{2}:d{2}')
result1 = re.sub(pattern, '', content1)
result2 = re.sub(pattern, '', content2)
result3 = re.sub(pattern, '', content3)
print(result1, result2, result3)

flags的一些常用值

  • re.I 使匹配對大小寫不敏感
  • re.S 使.匹配包括換行符在內的所有字元
import re
re.compile(res, re.I)
#如果res可以匹配大寫字母,那它也可以匹配相應的小寫字母,反之也可

re.compile(res,re.S)
#使res中的'.'字元可以匹配包括換行符在內的所有字元

總結

本篇文章就到這裡了,希望能夠給你帶來幫助,也希望您能夠多多關注it145.com的更多內容!


IT145.com E-mail:sddin#qq.com