pythonre正則匹配

發布時間: 2023-05-11 09:55:16

Ⅰ python正則表達式之re.match()

我們在面對生物數據，比如序列信息（比如鹼基序列、氨基酸序列等）的時候，會時常要問，這其中是否包含著且含有多少某種已知的模式，一段DNA中是否包含轉錄起始特徵TATA box、一段RNA中是否包含某種lncRNA、一段肽鏈中是否包含鋅指結構等等；另一方面，我們在操作數據時，會時常遇到諸如把某個字元（對象）換成另一種字元（對象）的替換操作，而其本質還是如何搜索符合某種（替換）模式的對象。

在這些幾乎天天都可以碰到的 模式匹配/搜索問題中，正則表達式就是一把解決問題的利劍！
在Python的re模塊中，常用的有四個方法(match、search、findall、finditer)都可以用於匹配字元串，今天我們先來了解一下re.match()。

re.match()必須從字元串開頭匹配！ match方法嘗試從字元串的起始位置匹配一個模式，如果不是起始位置匹配成功的話，match()就返回none。主要參數如下：

舉個栗子來理解一下它的用法：

運行結果：

從例子中我們可以看出，re.match()方法返回一個匹配的對象，而不是匹配的內容。通過調用span()可以獲得匹配結果的位置。而如果從起始位置開始沒有匹配成功，即便其他部分包含需要匹配的內容，re.match()也會返回None。

一般一個小括弧括起來就是一個捕獲組。我們可以使用group()來提取每組匹配到的字元串。
group()會返回一個包含所有小組字元串的元組，從 0 到所含的小組號。

直接調用groups()則直接返回一個包含所有小組字元串的元組，從 1 到所含的小組號。
再舉一個栗子：

運行結果：

Ⅱ Python常用的正則表達式處理函數詳解

正則表達式是一個特殊的字元序列，用於簡潔表達一組字元串特徵，檢查一個字元串是否與某種模式匹配，使用起來十分方便。

在Python中，我們通過調用re庫來使用re模塊：

import re

下面介紹Python常用的正則表達式處理函數。

re.match函數

re.match 函數從字元串的起始位置匹配正則表達式，返回match對象，如果不是起始位置匹配成功的話，match()就返回None。

re.match(pattern, string, flags=0)

pattern：匹配的正則表達式。

string：待匹配的字元串。

flags：標志位，用於控制正則表達式的匹配方式，如：是否區分大小寫，多行匹配等等。具體參數為：

re.I：忽略大小寫。

re.L：表示特殊字元集 w, W, , B, s, S 依賴於當前環境。

re.M：多行模式。

re.S：即 . ，並且包括換行符在內的任意字元（. 不包括換行符）。

re.U：表示特殊字元集 w, W, , B, d, D, s, S 依賴於 Unicode 字元屬性資料庫。

re.X：為了增加可讀性，忽略空格和 # 後面的注釋。

import re #從起始位置匹配 r1=re.match('abc','abcdefghi') print(r1) #不從起始位置匹配 r2=re.match('def','abcdefghi') print(r2)

運行結果：

其中，span表示匹配成功的整個子串的索引。

使用group(num) 或 groups() 匹配對象函數來獲取匹配表達式。

group(num)：匹配的整個表達式的字元串，group() 可以一次輸入多個組號，這時它將返回一個包含那些組所對應值的元組。

groups()：返回一個包含所有小組字元串的元組，從 1 到所含的小組號。

import re s='This is a demo' r1=re.match(r'(.*) is (.*)',s) r2=re.match(r'(.*) is (.*?)',s) print(r1.group()) print(r1.group(1)) print(r1.group(2)) print(r1.groups()) print() print(r2.group()) print(r2.group(1)) print(r2.group(2)) print(r2.groups())

運行結果：

上述代碼中的(.*)和(.*?)表示正則表達式的貪婪匹配與非貪婪匹配。

re.search函數

re.search函數掃描整個字元串並返回第一個成功的匹配，如果匹配成功則返回match對象，否則返回None。

re.search(pattern, string, flags=0)

pattern：匹配的正則表達式。

string：待匹配的字元串。

flags：標志位，用於控制正則表達式的匹配方式，如：是否區分大小寫，多行匹配等等。

import re #從起始位置匹配 r1=re.search('abc','abcdefghi') print(r1) #不從起始位置匹配 r2=re.search('def','abcdefghi') print(r2)

運行結果：

使用group(num) 或 groups() 匹配對象函數來獲取匹配表達式。

group(num=0)：匹配的整個表達式的字元串，group() 可以一次輸入多個組號，這時它將返回一個包含那些組所對應值的元組。

groups()：返回一個包含所有小組字元串的元組，從 1 到所含的小組號。

import re s='This is a demo' r1=re.search(r'(.*) is (.*)',s) r2=re.search(r'(.*) is (.*?)',s) print(r1.group()) print(r1.group(1)) print(r1.group(2)) print(r1.groups()) print() print(r2.group()) print(r2.group(1)) print(r2.group(2)) print(r2.groups())

運行結果：

從上面不難發現re.match與re.search的區別：re.match只匹配字元串的起始位置，只要起始位置不符合正則表達式就匹配失敗，而re.search是匹配整個字元串，直到找到一個匹配為止。

re.compile 函數

compile 函數用於編譯正則表達式，生成一個正則表達式對象，供 match() 和 search() 這兩個函數使用。

re.compile(pattern[, flags])

pattern：一個字元串形式的正則表達式。

flags：可選，表示匹配模式，比如忽略大小寫，多行模式等。

import re #匹配數字 r=re.compile(r'd+') r1=r.match('This is a demo') r2=r.match('This is 111 and That is 222',0,27) r3=r.match('This is 111 and That is 222',8,27) print(r1) print(r2) print(r3)

運行結果：

findall函數

搜索字元串，以列表形式返回正則表達式匹配的所有子串，如果沒有找到匹配的，則返回空列表。

需要注意的是，match 和 search 是匹配一次，而findall 匹配所有。

findall(string[, pos[, endpos]])

string：待匹配的字元串。

pos：可選參數，指定字元串的起始位置，默認為0。

endpos：可選參數，指定字元串的結束位置，默認為字元串的長度。

import re #匹配數字 r=re.compile(r'd+') r1=r.findall('This is a demo') r2=r.findall('This is 111 and That is 222',0,11) r3=r.findall('This is 111 and That is 222',0,27) print(r1) print(r2) print(r3)

運行結果：

re.finditer函數

和 findall 類似，在字元串中找到正則表達式所匹配的所有子串，並把它們作為一個迭代器返回。

re.finditer(pattern, string, flags=0)

pattern：匹配的正則表達式。

string：待匹配的字元串。

flags：標志位，用於控制正則表達式的匹配方式，如是否區分大小寫，多行匹配等。

import re r=re.finditer(r'd+','This is 111 and That is 222') for i in r: print (i.group())

運行結果：

re.split函數

將一個字元串按照正則表達式匹配的子串進行分割後，以列表形式返回。

re.split(pattern, string[, maxsplit=0, flags=0])

pattern：匹配的正則表達式。

string：待匹配的字元串。

maxsplit：分割次數，maxsplit=1分割一次，默認為0，不限次數。

flags：標志位，用於控制正則表達式的匹配方式，如：是否區分大小寫，多行匹配等。

import re r1=re.split('W+','This is 111 and That is 222') r2=re.split('W+','This is 111 and That is 222',maxsplit=1) r3=re.split('d+','This is 111 and That is 222') r4=re.split('d+','This is 111 and That is 222',maxsplit=1) print(r1) print(r2) print(r3) print(r4)

運行結果：

re.sub函數

re.sub函數用於替換字元串中的匹配項。

re.sub(pattern, repl, string, count=0, flags=0)

pattern：正則中的模式字元串。

repl：替換的字元串，也可為一個函數。

string：要被查找替換的原始字元串。

count：模式匹配後替換的最大次數，默認0表示替換所有的匹配。

import re r='This is 111 and That is 222' # 刪除字元串中的數字 r1=re.sub(r'd+','',r) print(r1) # 刪除非數字的字元串 r2=re.sub(r'D','',r) print(r2)

運行結果：

到此這篇關於Python常用的正則表達式處理函數詳解的文章就介紹到這了，希望大家以後多多支持！

Ⅲ python re 正則匹配某類字元前的所有字元（不包括該類字元）

首先，「匹配除2012這個字元串以外的任意字元?」語義不明，你是想將其從原字元串中刪除還是要匹配2012以外的年份?
姑且認為你的意思是後者，也即在一個特定模式里排除某些匹配的實例。
方法一、先預處理，將要匹配的字元串里的2012替換成不可能出現的字元串，然後再進行匹配處理，最後再將其替換回2012。
方法二、使用不匹配的前向斷言 (?! ...):
import re

s = '....0033 1033 2012 2033 2043 3033.....'
p = re.compile('(?!2012)[0-9]{4}')
for m in re.finditer(p, s):
print m.group()
可以匹配出
0033
1033
2033
2043
3033
而沒有'2012'

Ⅳ 強烈推薦！Python 這個寶藏庫 re 正則匹配

Python 的 re 模塊（Regular Expression 正則表達式）提供各種正則表達式的匹配操作。

在文本解析、復雜字元串分析和信息提取時是一個非常有用的工具 ，下面總結了 re 模塊的常用方法。

d 匹配所有的十進制數字 0-9

D 匹配所有的非數字，包含下劃線

s 匹配所有空白字元（空格、TAB等）

S 匹配所有非空白字元，包含下劃線

w 匹配所有字母、漢字、數字 a-z A-Z 0-9

W 匹配所有非字母、漢字、數字，包含下劃線

備注跡凳：符號.* 貪婪，符號.*? 非貪婪

[abc]：能匹配其中的單個字元

[a-z0-9]：能匹配指定范圍的字元，可取反（在最前面加入^）

[2-9] [1-3]：能夠做組合匹配

4.{ }：用於標記前面的字元出現的頻率，有如下情況：

{n，m}：代表前面字元最少出現n次，最多出現m次

{n，}：代表前面字元最少出現n次，最多不受限制

{，m}：代表前面字元最多出現n次，最少不受限制

{n}：前面的字元必須出現n次

字元串中有反斜杠的，需要對反斜杠做轉義

()：分組字元，可以為匹配到的內容分組，快速獲取到分組中的數據在正則裡面 "()" 代表的是分組的意思，一個括弧代表一個分組，你只能匹配到 "()" 中的內容。

group：用於查看指定分組匹配到的內容

groups：返回一個元組，組內為所有匹配到的內容

groupdict：返回一個字典，包含分組的鍵值對，需要為分組命名

作用：可以將字元串匹配正則表達式的部分割開並返回一個列表

flags定義包括：

re.I：忽略大小寫

re.L：表示特殊字元集 w, W, b, B, s, S 依賴於當前環境

re.M：多行模式

re.S：』.』並且包括換行符在內的任意字元（注意：』.』不包括換行符）

re.U：表示特殊字元集 w, W, b, B, d, D, s, S 依賴於 Unicode 字元屬性資料庫

在 Python 中使用正耐孫則表達式之前，先使用以下命令導入 re 模塊

例如：

『(d)(a)1』表示：匹配第一是數字，第二是字元a，第三 1 必須匹配第一個一樣的數字重復一次姿畝旅，也就是被引用一次。

如「9a9」被匹配，但「9a8」不會被匹配，因為第三位的 1 必須是 9 才可以。

『(d)(a)2』表示：匹配第一個是一個數字，第二個是a，第三個 2 必須是第二組（）中匹配一樣的。

如「8aa」被匹配，但「8ab」，「7a7」不會被匹配，第三位必須是第二組字元的復製版，也是就引用第二組正則的匹配內容。

Ⅳ Python中正則表達式的匹配規則總結

其他關於Python的總結文章請訪問： https://www.jianshu.com/nb/47435944

正則表達式用來匹配字元串，在python中可以使用 re 模塊來完成，本篇做一個對正則表達式的匹配規則的總結

在上述的精確匹配後可以跟上一些符號來進行模糊的匹配：

可以使用中括弧的形式進行范圍匹配，中括弧表達式後邊可以跟上上述模糊匹配的符號來表示數量

多個條件可以 緊跟著寫在同一個中括弧中 ，比如：
[a-zA-Z] ：匹配一個大、小寫字母

Ⅵ python正則表達式匹配

import re
print(re.findall(r"[12|22]+3", "123223"))

Ⅶ 趣玩Python第16關：3個技巧掌握正則

字元串的匹配查詢

Python中的re模塊中的findall函數可以對指定的字元串進行遍歷匹配，如下：

findall(pattern, string, flags=0)

pattern：指定需要匹配的正則表達式。

string：指定待處理的字元串。

flags：指定匹配模式，常用的值可以是re.I、re.M、re.S和re.X。re.I的模式是讓正則表達式對大小寫不敏感;re.M的模式是讓正則表達式可以多行匹配;re.S的模式指明正則符號.可以匹配任意字元，包括換行符 ;re.X模式允許正則表達式可以寫得更加詳細，如多行表示、忽略空白字元、加入注釋等。

字元串的匹配替換

re模塊中的sub函數的功能是替換，類似於字元串的replace方法，該函數根據正則表達式把滿足匹配的內容替換為repl，如下：

sub(pattern, repl, string, count=0, flags=0)

pattern：同findall函數中的pattern。

repl：指定替換成的新值。

string：同findall函數中的string。

count：用於指定最多替換的次數，默認為全部替換。

flags：同findall函數。

字元串的匹配分割

re模塊中的split函數是將字元串按照指定的正則表達式分隔開，類似於字元串的split，如下：

split(pattern, string, maxsplit=0, flags=0)

pattern：同findall函數中的pattern。

maxsplit：用於指定最大分割次數，默認為全部分割。

string：同findall函數中的string。

flags：同findall函數中的flags。

以上就是本次分享的全部內容了，不知大家對我講述的Python正則表達式妙用感覺怎麼樣？

腦筋急轉彎：有人想喝點牛奶解渴，卻一命嗚呼了，為什麼？

Ⅷ Python正則表示式的幾種匹配用法

Python正則表示式的幾種匹配用法

下面列出： 1.測試正則表示式是否匹配字串的全部或部分regex=ur"" #正則表示式
if re.search(regex, subject): do_something()else: do_anotherthing() 2.測試正則表示式是否匹配整個字串 regex=ur"/Z" #正則表示式末尾以/Z結束
if re.match(regex, subject): do_something()else: do_anotherthing() 3.建立一個匹配物件，然後通過該物件獲得匹配細節(Create an object with details about how the regex matches (part of) a string) regex=ur"" #正則表示式
match = re.search(regex, subject)if match: # match start: match.start() # match end (exclusive): atch.end() # matched text: match.group() do_something()else: do_anotherthing() 4.獲取正則表示式所匹配的子串(Get the part of a string matched by the regex) regex=ur"" #正則表示式
match = re.search(regex, subject)if match: result = match.group()else: result ="" 5. 獲取捕獲組所匹配的子串(Get the part of a string matched by a capturing group) regex=ur"" #正則表示式
match = re.search(regex, subject)if match: result = match.group(1)else: result ="" 6. 獲取有名組所匹配的子串(Get the part of a string matched by a named group) regex=ur"" #正則表示式
match = re.search(regex, subject)if match:result = match.group"groupname")else:result = "" 7. 將字串中沒塌所有匹配的子串放入陣列中(Get an array of all regex matches in a string) result = re.findall(regex, subject) 8.遍歷所有匹配的子串(Iterate over all matches in a string) for match in re.finditer(r"<(.*?)/s*.*?1>", subject) # match start: match.start() # match end (exclusive): atch.end() # matched text: match.group() 9.通過正則表示式字串建立一個正則表示式物件(Create an object to use the same regex for many operations) reobj = re.pile(regex) 10.用法1的正則表示式物件版本（use regex object for if/else branch whether (part of) a string can be matched） reobj = re.pile(regex)if reobj.search(subject): do_something()else: do_anotherthing() 11.用法2的正則表示式物件版本（use regex object for if/else branch whether a string can be matched entirely） reobj = re.pile(r"/Z") ＃差旅正則表示式末尾枯慶圓以/Z 結束
if reobj.match(subject): do_something()else: do_anotherthing() 12.建立一個正則表示式物件，然後通過該物件獲得匹配細節（Create an object with details about how the regex object matches (part of) a string） reobj = re.pile(regex) match = reobj.search(subject)if match: # match start: match.start() # match end (exclusive): atch.end() # matched text: match.group() do_something()else: do_anotherthing() 13.用正則表示式物件獲取匹配子串（Use regex object to get the part of a string matched by the regex） reobj = re.pile(regex) match = reobj.search(subject)if match: result = match.group()else: result ="" 14.用正則表示式物件獲取捕獲組所匹配的子串（Use regex object to get the part of a string matched by a capturing group） reobj = re.pile(regex) match = reobj.search(subject)if match: result = match.group(1)else: result ="" 15.用正則表示式物件獲取有名組所匹配的子串（Use regex object to get the part of a string matched by a named group） reobj = re.pile(regex) match = reobj.search(subject)if match: result = match.group("groupname")else: result ="" 16.用正則表示式物件獲取所有匹配子串並放入陣列（Use regex object to get an array of all regex matches in a string） reobj = re.pile(regex) result = reobj.findall(subject) 17.通過正則表示式物件遍歷所有匹配子串（Use regex object to iterate over all matches in a string） reobj = re.pile(regex)for match in reobj.finditer(subject): # match start: match.start() # match end (exclusive): match.end() # matched text: match.group()字串替換 1.替換所有匹配的子串 #用newstring替換subject中所有與正則表示式regex匹配的子串
result = re.sub(regex, newstring, subject) 2.替換所有匹配的子串（使用正則表示式物件） reobj = re.pile(regex) result = reobj.sub(newstring, subject) 字串拆分 1.字串拆分 result = re.split(regex, subject) 2.字串拆分（使用正則表示式物件） reobj = re.pile(regex) result = reobj.split(subject)

兩種：
1.
m = re.match(r'匹配條件', '待匹配內容')
2.
pattern = re.pile(r'匹配條件')m = pattern.match('待匹配內容')

正則表示式簡單的匹配

(=([0-9.]+[,]*)+)

正則表示式的具體用法

這個吧最好找本書看看，一兩句話也說不明白，做驗證啊什麼的用它就行

正則表示式匹配問好星號

在什麼語言中用的？
一般都是前面加個「」反斜杠即 ?
在java中用字串是特殊字元所以String reg="\?"這樣可以匹配一個「?」問號.

java 正則表示式 abcded 匹配b出來

public class FillUtil {
public static void main(String[] args){
String item = "a:b: c:d:e";
Pattern pattern = Pattern.pile("\w:\w?");
Matcher matcher = pattern.matcher(item);
while(matcher.find()){
String find = matcher.group();
String[] finds = find.split(":");
for(String each:finds){
System.out.println(each);
}
System.out.println("_");
}
}
}

以下正則表示式有匹配嗎？

應該沒有吧，把sS都排出了，那不就沒東西了嗎？
注意，[]中的^表示反義。

能匹配以下正則表示式的內容？

什麼都不能匹配。

用python正則表示式匹配java方法定義怎麼寫

1
2
3
4
5
6
7
8
9
10

>>> str_ = 'a100b30 :aa./aaaa. ' # 'str'是內建方法，不宜做變數名
>>> import re
>>> re_str = '.* (.*) '
>>> re_pat = re.pile(re_str)
>>> search_ret = re_pat.search(str_)
>>> if search_ret:
search_ret.groups()

Ⅸ Python正則表達式的幾種匹配方法

1.測試正則表達式是否匹配字元串的全部或部分
regex=ur"" #正則表達式
if re.search(regex, subject):
do_something()
else:
do_anotherthing()

2.測試正則表達式是否匹配整個字元串

regex=ur"/Z" #正則表達式末尾以/Z結束
if re.match(regex, subject):
do_something()
else:
do_anotherthing()

3.創建一個匹配對象，然後通過該對象獲得匹配細節(Create an object with details about how the regex matches (part of) a string)

regex=ur"" #正則表達式
match = re.search(regex, subject)
if match:
# match start: match.start()
# match end (exclusive): atch.end()
# matched text: match.group()
do_something()
else:
do_anotherthing()

4.獲取正則表達式所匹配的子串(Get the part of a string matched by the regex)

regex=ur"" #正則表達式
match = re.search(regex, subject)
if match:
result = match.group()
else:
result = ""

閱讀全文

熱點內容

java返回this 發布：2025-10-20 08:28:16 瀏覽：1089

製作腳本網站發布：2025-10-20 08:17:34 瀏覽：1367

python中的init方法發布：2025-10-20 08:17:33 瀏覽：1051

圖案密碼什麼意思發布：2025-10-20 08:16:56 瀏覽：1228

怎麼清理微信視頻緩存發布：2025-10-20 08:12:37 瀏覽：1095

c語言編譯器怎麼看執行過程發布：2025-10-20 08:00:32 瀏覽：1447

郵箱如何填寫發信伺服器發布：2025-10-20 07:45:27 瀏覽：655

shell腳本入門案例發布：2025-10-20 07:44:45 瀏覽：549

怎麼上傳照片瀏覽上傳發布：2025-10-20 07:44:03 瀏覽：1226

python股票數據獲取發布：2025-10-20 07:39:44 瀏覽：1251

pythonre正則匹配

Python正則表示式的幾種匹配用法

正則表示式 簡單的匹配

正則表示式的具體用法

正則表示式 匹配問好星號

java 正則表示式 abcded 匹配b出來

以下正則表示式有匹配嗎？

能匹配以下正則表示式的內容？

用python正則表示式匹配java方法定義怎麼寫

與pythonre正則匹配相關的資訊

正則表示式簡單的匹配

正則表示式匹配問好星號