python匹配開頭
Ⅰ python 正則表達式,怎樣匹配以某個字元串開頭
碼如下: # -*- coding: cp936 -*-import restring = "xxxxxxxxxxxxxxxxxxxxxxxx entry '某某內容' for aaaaaaaaaaaaaaaaaa"result = re.findall(".*entry(.*)for.*",string)for x in result: print x# '某某內容'正則表達式的用法如下:
Ⅱ Python正則表達式之re.match()
我們在面對生物數據,比如序列信息(比如鹼基序列、氨基酸序列等)的時候, 會時常要問,這其中是否包含著且含有多少某種已知的模式,一段DNA中是否包含轉錄起始特徵TATA box、一段RNA中是否包含某種lncRNA、一段肽鏈中是否包含鋅指結構等等;另一方面,我們在操作數據時,會時常遇到諸如把某個字元(對象)換成另一種字元(對象)的替換操作,而其本質還是如何搜索符合某種(替換)模式的對象。
在這些幾乎天天都可以碰到的 模式匹配/搜索問題中,正則表達式就是一把解決問題的利劍!
在Python的re模塊中,常用的有四個方法(match、search、findall、finditer)都可以用於匹配字元串,今天我們先來了解一下re.match()。
re.match()必須從字元串開頭匹配! match方法嘗試從字元串的起始位置匹配一個模式,如果不是起始位置匹配成功的話,match()就返回none。主要參數如下:
舉個栗子來理解一下它的用法:
運行結果:
從例子中我們可以看出,re.match()方法返回一個匹配的對象,而不是匹配的內容。通過調用span()可以獲得匹配結果的位置。而如果從起始位置開始沒有匹配成功,即便其他部分包含需要匹配的內容,re.match()也會返回None。
一般一個小括弧括起來就是一個捕獲組。我們可以使用group()來提取每組匹配到的字元串。
group()會返回一個包含所有小組字元串的元組,從 0 到 所含的小組號。
直接調用groups()則直接返回一個包含所有小組字元串的元組,從 1 到 所含的小組號。
再舉一個栗子:
運行結果:
Ⅲ python尖號^如何使用
^:按位異或,同一位上不同時為1,相同時為0。參加運算的兩個對象,如果兩個相應位為「異」(值不同),則該位結果為1,否則為0。
因為1的二進制為01,3的二進制為11,所以3&1為2
在正則表達式中,^匹配你要用來查找的字元串的開頭,^p就是指以p開頭的字元串。作為Python的運算符時,^表示bitwiseXOR,在二進制下,0^1=1,0^0=0,1^1=0
Ⅳ python 中[0-9]為什麼代表一位數字
因為字元之間只能是數字。匹配字元串的開頭以數字0-9之間的數字開頭,長度在1-20之間,並且字元只能是數字,並且以數字0-9之間的數字結尾。python是一種面向對象的,互動式的,解釋型的計算機程序設計語言。Python的設計具有高可讀性,它使用英語關鍵詞而非標點符號,語法結構也比其他語言簡單。它的主要功能是一種解釋型語言,因此在使用python時不需要進行編譯。它是非常適合面向對象的的編程,因為它允許類的定義以及組合和繼承。Python支持5種數據類型:1.數字(Numbers)2.字元串(Strings)3.列表(Lists)4.元組(tuples)5.字典(Dictionary)
Ⅳ python正則表達式以數字3開頭的
匹配以數字開頭和結尾的字元串例如:3py3.33py3.33-3在最荒唐的年華里遇見對的你,終究是一個沒有後來的結局。
正則表達式是:^[0-9].*[0-9]$後來回憶起的,不是獲得的榮譽,贏取的掌聲,而是忙到快崩潰還咬牙堅持的日子。
^表示文本開始;$表示文本結束;^a.*b$匹配a開頭,b結束的文本正則表達式,又稱規則表達式。
Ⅵ python的正則表達式
1,正則表達式的一些內容
正則表達式主要是用來匹配文本中需要查找的內容,例如在一片文章中找出電話號碼,就中國的來說11位純數字(不說座機),則使用"d{11}" 意味匹配數字11次,就能准確的查找出文本中的電話號碼. 還有就是在編寫網路爬蟲的時候需要提取很多超鏈接再次進行爬取,使用正則表達式就很方便.直接匹配http開頭就行,當然也可以使用beautifulsoup的select方法.
看下面的程序看看正則表達提取文本中的郵箱:
w 匹配字母,數字,下劃線
+ 匹配1次或者多次
re是正則表達式的工具包,工具包出錯的話在anaconda的命令行輸入"pip install re"安裝,其他的工具包也是如此.
re.compile()中的r示意不是轉義字元,也就是保持後面字元串原樣,findall返回一個列表.下面還有一個版本的程序略有不同.
compile的另一個參數re.IGONORECASE(忽略大小寫),還可以是re.DORALL,多行模式,具體功能也是模糊不清,不過在使用通配符 . 匹配的時候加上re.DOTALL參數能夠匹配換行.如果希望忽略大小寫和多行模式都開啟可以使用re.compile(r'....',re.IGNORECASE|re.DOTALL) .
表達式使用( ),對匹配到的內容分為3組 也就是(w+)出現字母,數字,下劃線一次或多次,這個分組就是下面使用match對象的grou()方法的時候的參數.不給參數和參數0都是得到整個匹配到的內容, 參數1得到第一個括弧匹配到的內容,以此類推參數2和3,如果沒有括弧分組的話使用參數會出現錯誤.
search( )查找和正則式匹配的內容,只匹一次後面的那個找不到.返回一個match對象
w 匹配字母,數字,下劃線
W 匹配字母,數字.下劃線之外的所有字元
d 匹配數字
D 匹配非數字
s 匹配空格,製表符,換行符
S匹配除空格製表符,換行符之外的其他字元
[ .... ]定義自己的匹配,如[aeiouAEIOU ]匹配所有的母音字母,注意不是匹配單詞.
{最少次數,最多次數},例如{3,9} 匹配3-9次,{ ,10}匹配0-10次. 默認為匹配最多次數(貪心匹配),非貪心模式在後面加上問號
? 可選 0次或者1次吧
+匹配1次或多次
*匹配0次或者多次
^ 判斷開頭 ^d 如果待匹配串是數字開頭則返回第一個數字
$判斷結尾 d$ 如果待匹配串是數字結尾則返回最後一個數字
. 通配符,匹配除換行之外的所有字元
d{11} 匹配數字11次
. * 匹配所有字元除 換行
[a-zA-Z0-9._%+-] 小寫和大寫字母、數字、句點、下劃線、百分號、加號或短橫
[a-zA-Z]{2,4} 匹配字母 2 - 4次
Ⅶ python 正則表達式,怎樣匹配以某個字元串開頭,以某個字元串結尾的情況
匹配以某個字元串開頭,以某個字元串結尾的情況的正則表達式:^abc.*?qwe$
Python正則表達式的幾種匹配用法:
1.測試正則表達式是否匹配字元串的全部或部分
regex=ur""#正則表達式
ifre.search(regex,subject):
do_something()
else:
do_anotherthing()
2.測試正則表達式是否匹配整個字元串
regex=ur"/Z"#正則表達式末尾以/Z結束
ifre.match(regex,subject):
do_something()
else:
do_anotherthing()
3.創建一個匹配對象,然後通過該對象獲得匹配細節(Create an object with details about how the regex matches (part of) a string)
regex=ur""#正則表達式
match=re.search(regex,subject)
ifmatch:
# match start:match.start()
# match end(exclusive):atch.end()
# matched text:match.group()
do_something()
else:
do_anotherthing()
4.獲取正則表達式所匹配的子串(Get the part of a string matched by the regex)
regex=ur""#正則表達式
match=re.search(regex,subject)
ifmatch:
result=match.group()
else:
result=""
5. 獲取捕獲組所匹配的子串(Get the part of a string matched by a capturing group)
regex=ur""#正則表達式
match=re.search(regex,subject)
ifmatch:
result=match.group(1)
else:
result=""
6. 獲取有名組所匹配的子串(Get the part of a string matched by a named group)
regex=ur"" #正則表達式
match = re.search(regex, subject)
if match:
result = match.group"groupname")
else:
result = ""
7. 將字元串中所有匹配的子串放入數組中(Get an array of all regex matches in a string)
result=re.findall(regex,subject)
8.遍歷所有匹配的子串(Iterate over all matches in a string)
formatchinre.finditer(r"<(.*?)/s*.*?//1>",subject)
# match start:match.start()
# match end(exclusive):atch.end()
# matched text:match.group()
9.通過正則表達式字元串創建一個正則表達式對象(Create an object to use the same regex for many operations)
reobj=re.compile(regex)
10.用法1的正則表達式對象版本(use regex object for if/else branch whether (part of) a string can be matched)
reobj=re.compile(regex)
ifreobj.search(subject):
do_something()
else:
do_anotherthing()
11.用法2的正則表達式對象版本(use regex object for if/else branch whether a string can be matched entirely)
reobj=re.compile(r"/Z")#正則表達式末尾以/Z 結束
ifreobj.match(subject):
do_something()
else:
do_anotherthing()
12.創建一個正則表達式對象,然後通過該對象獲得匹配細節(Create an object with details about how the regex object matches (part of) a string)
reobj=re.compile(regex)
match=reobj.search(subject)
ifmatch:
# match start:match.start()
# match end(exclusive):atch.end()
# matched text:match.group()
do_something()
else:
do_anotherthing()
13.用正則表達式對象獲取匹配子串(Use regex object to get the part of a string matched by the regex)
reobj=re.compile(regex)
match=reobj.search(subject)
ifmatch:
result=match.group()
else:
result=""
14.用正則表達式對象獲取捕獲組所匹配的子串(Use regex object to get the part of a string matched by a capturing group)
reobj=re.compile(regex)
match=reobj.search(subject)
ifmatch:
result=match.group(1)
else:
result=""
15.用正則表達式對象獲取有名組所匹配的子串(Use regex object to get the part of a string matched by a named group)
reobj=re.compile(regex)
match=reobj.search(subject)
ifmatch:
result=match.group("groupname")
else:
result=""
16.用正則表達式對象獲取所有匹配子串並放入數組(Use regex object to get an array of all regex matches in a string)
reobj=re.compile(regex)
result=reobj.findall(subject)
17.通過正則表達式對象遍歷所有匹配子串(Use regex object to iterate over all matches in a string)
reobj=re.compile(regex)
formatchinreobj.finditer(subject):
# match start:match.start()
# match end(exclusive):match.end()
# matched text:match.group()
Ⅷ python 如何匹配一個字元串是否是以B開頭的
在正則表達式中,使用^匹配字元串的開頭
importre
pattern=re.compile('^B')
aStr='Backbone'
bStr='backbone'
ifpattern.search(aStr):
print'StartwithB'
ifpattern.search(bStr)
print'NotstartwithB'
使用re包的search函數,如果匹配到則返回一個對象,如果沒有比配的則返回None,可以將返回值直接作為if語句判斷的條件。
Ⅸ Python 標准庫模塊 - re
re模塊被稱為正則表達式,其作用為,創建一個「規則表達式」,用於驗證和查找符合規則的文本,廣泛用於各種搜索引擎、賬戶密碼的驗證等。
預定義字元:
d:匹配所有的十進制數字0-9
D:匹配所有的非數字,包含下劃線
s:匹配所有空白字元(空格、TAB等)
S:匹配所有非空白字元,包含下劃線
w:匹配所有字母、漢字、數字a-z A-Z 0-9
W:匹配所有非字母、漢字、數字,包含下劃線
特殊字元:
$:匹配一行的結尾(必須放在正則表達式最後面)
^:匹配一行的開頭(必須放在正則表達式最前面)
*:前面的字元可以出現0次或多次(0~無限)
+:前面的字元可以出現1次或多次(1~無限)
?:變"貪婪模式"為"勉強模式",前面的字元可以出現0次或1次
.:匹配除了換行符" "之外的任意單個字元
|:兩項都進行匹配
[ ]:代表一個集合,有如下三種情況
[abc]:能匹配其中的單個字元
[a-z0-9]:能匹配指定范圍的字元,可取反(在最前面加入^)
[2-9] [1-3]:能夠做組合匹配
{ }:用於標記前面的字元出現的頻率,有如下情況:
{n,m}:代表前面字元最少出現n次,最多出現m次
{n,}:代表前面字元最少出現n次,最多不受限制
{,m}:代表前面字元最多出現n次,最少不受
{n}:前面的字元必須出現n次
Ⅹ python正則表達式,匹配開頭和結尾獲取字元串
importre
A='''/22Q1006NOSIG=<BR/>/23Q1007NOSIG=<BR/>/22Q1006NOSIG=<BR/>'''
reg=re.findall(r'(?:METAR|SPECI)+[^=]+=',A)
print(reg[0])