首頁 > 軟體

SQL如何使用正規表示式對資料進行過濾

2022-10-02 14:01:40

1、基本字元匹配

資料庫使用正則進行過濾,寫法與like語句非常相似,只需將“like"關鍵字改為"regexp"即可。我們先來看一個最簡單的正則匹配:

select *
from mostimes
where name regexp '666'

分析:這條sql語句表達是欄位中包含"666"即為匹配物件。

正則也可以像like語句那樣任意匹配一個字元:

select *
from mostimes
where name regexp '.66'

分析:這裡使用了正規表示式" .66 “,” . "是正規表示式語言中一個特殊的字元。它表示匹配任意一個字元,因此,566、666、766等都匹配且返回。

2、進行OR匹配

OR匹配與C語言的按位元或很相似,使用" | "符號,表示符號兩邊任意一個串匹配了,即返回。用法如下所示:

select *
from mostimes
where name regexp '666|888'

分析:語句中使用了正規表示式"666|888"。" | "為正規表示式的OR操作符。它表示匹配其中之一,因此name欄位為666和888都匹配並返回。

3、匹配幾個字元之一

顧名思義,該方法是匹配多個字元中的其中一個,用法:

select *
from mostimes
where name regexp '[abc]mos'

分析:使用了正規表示式"[abc]mos"。[abc]定義一組字元,它的意思是匹配a或b或c,因此,amos、bmos和cmos都匹配且返回。

4、匹配範圍

在第3個匹配方法中,我們可以對其進行簡化,當我們需要匹配"[01234567]mos"時,我們還可以使用下面更簡潔的方法:

select *
from mostimes
where name regexp '[0-7]mos'

分析:使用" - "可以簡化這種連續字元型別的集合,此外,[a-z]也適用此方法。

5、匹配特殊字元

在前面的幾種的匹配方式中,我們可以看到,正規表示式語言是由具有特定含義的特殊字元構成的,那如果我們想要匹配那些特殊字元的時候,就會出現sql注入問題,例如我們需要匹配" . “的時候,那麼資料庫就會將” . "當做一個任意萬用字元來匹配,達不到我們期望的值,這個時候我們就需要對其進行跳脫,例:

select *
from mostimes
where name regexp '\.mos'

分析:可以看到,我們在‘.’符號的前面加了" “,加上雙斜杆,資料庫就會把” . "符號當做一個普通符號來匹配,其中還包括|、[]以及迄今為止使用過的其他特殊字元。

如果需要對‘’進行跳脫時,那麼我們就需要使用‘\’

6、匹配字元類

存在找出你自己經常使用的數位、所有字母字元或所有數位字母字元等的匹配。為更方便工作,可以使用預定義的字元集,稱為字元類,具體可以看下錶。

說明
[:alnum:]任意字母和數位(同[a-zA-Z0-9])
[:alpha:]任意字元(同[a-zA-Z])
[:blank:]空格和製表(同[t])
[:cntrl:]ASCII控制字元(ASCII 0到31和127)
[:digit:]任意數位(同[0-9])
[:graph:]與[:print:]相同,但不包括空格
[:lower:]任意小寫字母(同[a-z])
[:print:]任意可列印字元
[:punct:]既不在[:alnum:]又不在[:cntrl:]中的任意字元
[:space:]包括空格在內的任意空白字元(同[fnrtv])
[:upper:]任意大寫字母(同[A-Z])
[:xdigit:]任意十六進位制數位(同[a-fA-F0-9])

例子:

select * 
from mostimes
where name REGEXP '[:alnum:]'

分析:表示匹配任意字母和數位,其他的大家可以試下。

7、匹配多個範例

在我們前面學習的幾種正規表示式中,所有的匹配都是以單次出現進行匹配的。但有時候我們需要對匹配的次數進行更強的控制,這個時候我們就可以使用重複元字元來匹配。看下錶:

元 字 符說 明
*0個或多個匹配
+1個或多個匹配(等於{1,})
?0個或1個匹配(等於{0,1})
{n}指定數目的匹配
{n,}不少於指定數目的匹配
{n,m}匹配數目的範圍(m不超過255)

例子:

select * 
from mostimes
where name REGEXP '[0-9]mostimes?'

分析:"[0-9]"表示匹配任意數位,"mostimes?"匹配mostime和mostimes(s後的?使s可選,因為?匹配它前面的任何字元的0次或1次出現),所以0mostime、1mostimes等都可以匹配。

8、定位符

現在有一個需求,就是需要在串中的指定位置匹配串,但是學的前面那幾種都是在文字內任意位置查詢匹配,那這個時候我們就可以使用定位符來解決。看下錶:

元 字 符說 明
^文字的開始
$文字的結尾
[[:<:]]詞的開始
[[:>:]]詞的結尾

例子:

select * 
from mostimes
where name REGEXP '^[0-9]mos'

分析:" ^ "表示匹配串的開始。所以該語句表示在串開頭進行匹配,1mos、2mos、3mos等可以匹配,a1mos、aa1mos等不可以匹配。

9、like語句與正則

like語句與正則的相類似,但是它們的不同點就是like匹配的是整個串,而正則匹配的是子串,但是可以使用定位符“^”與“$”相結合,達到like語句的效果。

總結

到此這篇關於SQL如何使用正規表示式對資料進行過濾的文章就介紹到這了,更多相關SQL用正則對資料過濾內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com