亚洲综合原千岁中文字幕_国产精品99久久久久久久vr_无码人妻aⅴ一区二区三区浪潮_成人h动漫精品一区二区三

主頁 > 知識庫 > [php]正則表達式的五個成功習慣

[php]正則表達式的五個成功習慣

熱門標簽:荊州智能電銷機器人 地圖標注與公司業(yè)務關系 大學校門地圖標注 平?jīng)龈叩碌貓D標注商戶要收費嗎 廣西智能外呼系統(tǒng)多少錢 外呼系統(tǒng)api對接 銷售電銷機器人詐騙 提高電話機器人接通率 福建微碼電話機器人
正則表達式難于書寫、難于閱讀、難于維護,經(jīng)常錯誤匹配意料不到的文本或者錯過了有效的文本,這些問題都是由正則表達式的表現(xiàn)和能力引起的。每個元字符(metacharacter)的能力和細微差別組合在一起,使得代碼不借助于智力技巧就無法解釋。 
     許多包含一定特性的工具使閱讀和編寫正則表達式變得容易了,但是它們又很不符合習慣。對于很多程序員來說,書寫正則表達式就是一種魔法藝術。他們堅持自己所知道的特征并持有絕對樂觀的態(tài)度。如果你愿意采用本文所探討的五個習慣,你將可以讓你設計的正則表達式經(jīng)受的住反復試驗。 
    本文將使用Perl、PHP和Python語言作為代碼示例,但是本文的建議幾乎適用于任何替換表達式(regex)的執(zhí)行。 

    一、使用空格和注釋 
    對于大部分程序員來說,在一個正則表達式環(huán)境里使用空格和縮進排列都不成問題,如果他們沒有這么做一定會被同行甚至外行人士看笑話。幾乎每個人都知道把代碼擠在一行會難于閱讀、書寫和維護。對于正則表達式又有什么不同呢? 
    大部分替換表達式工具都具有擴展的空格特性,這允許程序員把他們的正則表達式擴展為多行,并在每一行結(jié)尾加上注釋。為什么只有少部分程序員利用這個特性呢?Perl 6的正則表達式默認就是擴展空格的模式。不要再讓語言替你默認擴展空格了,自己主動利用吧。 
    記住擴展空格的竅門之一就是讓正則表達式引擎忽略擴展空格。這樣如果你需要匹配空格,你就不得不明確說明。 
    在Perl語言里面,在正則表達式的結(jié)尾加上x,這樣“m/foo|bar/”變?yōu)槿缦滦问剑?nbsp;
m/ 
  foo 

  bar 
 /x 
    在PHP語言里面,在正則表達式的結(jié)尾加上x,這樣“"/foo|bar/"”變?yōu)槿缦滦问剑?nbsp;
"/ 
  foo 

  bar 
 /x" 
    在Python語言里面,傳遞模式修飾參數(shù)“re.VERBOSE”得到編譯函數(shù)如下: 
pattern = r''' 
 foo 

 bar 
''' 
regex = re.compile(pattern, re.VERBOSE) 
    處理更加復雜的正則表達式時,空格和注釋就更能體現(xiàn)出其重要性。假設下面的正則表達式用于匹配美國的電話號碼: 
\(?\d{3}\)? ?\d{3}[-.]\d{4} 
     這個正則表達式匹配電話號碼如“(314)555-4000”的形式,你認為這個正則表達式是否匹配“314-555-4000”或者“555- 4000”呢?答案是兩種都不匹配。寫上這么一行代碼隱蔽了缺點和設計結(jié)果本身,電話區(qū)號是需要的,但是正則表達式在區(qū)號和前綴之間缺少一個分隔符號的說明。 
    把這一行代碼分成幾行并加上注釋將把缺點暴露無疑,修改起來顯然更容易一些。 
    在Perl語言里面應該是如下形式: 
/   
    \(?     # 可選圓括號 
      \d{3} # 必須的電話區(qū)號 
    \)?     # 可選圓括號 
    [-\s.]? # 分隔符號可以是破折號、空格或者句點 
      \d{3} # 三位數(shù)前綴 
    [-.]    # 另一個分隔符號 
      \d{4} # 四位數(shù)電話號碼 
/x 
    改寫過的正則表達式現(xiàn)在在電話區(qū)號后有一個可選擇的分隔符號,這樣它應該是匹配“314-555-4000”的,然而電話區(qū)號還是必須的。另一個程序員如果需要把電話區(qū)號變?yōu)榭蛇x項則可以迅速看出它現(xiàn)在不是可選的,一個小小的改動就可以解決這個問題。 

    二、書寫測試 
    一共有三個層次的測試,每一層為你的代碼加上一層可靠性。首先,你需要認真想想你需要匹配什么代碼以及你是否能夠處理錯誤匹配。其次,你需要利用數(shù)據(jù)實例來測試正則表達式。最后,你需要正式通過一個測試小組的測試。 
     決定匹配什么其實就是在匹配錯誤結(jié)果和錯過正確結(jié)果之間尋求一個平衡點。如果你的正則表達式過于嚴格,它將會錯過一些正確匹配;如果它過于寬松,它將會產(chǎn)生一個錯誤匹配。一旦某個正則表達式發(fā)放到實際代碼當中,你可能不會兩者都注意到。考慮一下上面電話號碼的例子,它將會匹配“800-555-4000  = -5355”。錯誤的匹配其實很難發(fā)現(xiàn),所以提前規(guī)劃做好測試是很重要的。 
    還是使用電話號碼的例子,如果你在Web表單里面確認一個電話號碼,你可能只要滿足于任何格式的十位數(shù)字。但是,如果你想從大量文本里面分離電話號碼,你可能需要很認證的排除不符合要求的錯誤匹配。 
    在考慮你想匹配的數(shù)據(jù)的時候,寫下一些案例情況。針對案例情況寫下一些代碼來測試你的正則表達式。任何復雜的正則表達式都最好寫個小程序測試一下,可以采用下面的具體形式。 
    在Perl語言里面: 
#!/usr/bin/perl 

my @tests = ( "314-555-4000", 
              "800-555-4400", 
       "(314)555-4000", 
              "314.555.4000", 
              "555-4000", 
              "aasdklfjklas", 
              "1234-123-12345"           
            ); 

foreach my $test (@tests) { 
    if ( $test =~ m/ 
                   \(?     # 可選圓括號 
                     \d{3} # 必須的電話區(qū)號 
                   \)?     # 可選圓括號 
                   [-\s.]? # 分隔符號可以是破折號、空格或者句點 
                     \d{3} # 三位數(shù)前綴 
                   [-\s.]  # 另一個分隔符號 
                     \d{4} # 四位數(shù)電話號碼 
                   /x ) { 
        print "Matched on $test\n"; 
     } 
     else { 
        print "Failed match on $test\n"; 
     } 


    在PHP語言里面: 
?php 
$tests = array( "314-555-4000", 
           "800-555-4400", 
           "(314)555-4000", 
           "314.555.4000", 
           "555-4000", 
           "aasdklfjklas", 
           "1234-123-12345" 
          ); 

$regex = "/ 
            \(?     # 可選圓括號 
              \d{3} # 必須的電話區(qū)號 
            \)?     # 可選圓括號 
            [-\s.]? # 分隔符號可以是破折號、空格或者句點 
              \d{3} # 三位數(shù)前綴 
            [-\s.]  # 另一個分隔符號 
              \d{4} # 四位數(shù)電話號碼 
           /x"; 

foreach ($tests as $test) { 
    if (preg_match($regex, $test)) {  
        echo "Matched on $testbr />;"; 
    } 
    else { 
        echo "Failed match on $testbr />;"; 
     } 

?>; 

        在Python語言里面: 
import re 

tests = ["314-555-4000", 
         "800-555-4400", 
         "(314)555-4000", 
         "314.555.4000", 
         "555-4000", 
         "aasdklfjklas", 
         "1234-123-12345"         
        ] 

pattern = r''' 
\(?                 # 可選圓括號 
              \d{3} # 必須的電話區(qū)號 
            \)?     # 可選圓括號 
            [-\s.]? # 分隔符號可以是破折號、空格或者句點 
              \d{3} # 三位數(shù)前綴 
            [-\s.]  # 另一個分隔符號 
              \d{4} # 四位數(shù)電話號碼 
           ''' 

regex = re.compile( pattern, re.VERBOSE ) 

for test in tests: 
    if regex.match(test): 
        print "Matched on", test, "\n" 
    else: 
        print "Failed match on", test, "\n" 

    運行測試代碼將會發(fā)現(xiàn)另一個問題:它匹配“1234-123-12345”。 
     理論上,你需要整合整個程序所有的測試到一個測試小組里面。即使你現(xiàn)在還沒有測試小組,你的正則表達式測試也會是一個小組的良好基礎,現(xiàn)在正是開始創(chuàng)建的好機會。即使現(xiàn)在還不是創(chuàng)建的合適時間,你也應該在每次修改以后運行測試一下正則表達式。這里花費一小段時間將會減少你很多麻煩事。 

    三、為交替操作分組 
    交替操作符號(|)的優(yōu)先級很低,這意味著它經(jīng)常交替超過程序員所設計的那樣。比如,從文本里面抽取Email地址的正則表達式可能如下: 
^CC:|To:(.*) 
    上面的嘗試是不正確的,但是這個bug往往不被注意。上面代碼的意圖是找到“CC:”或者“To:”開始的文本,然后在這一行的后面部分提取Email地址。 
     不幸的是,如果某一行中間出現(xiàn)“To:”,那么這個正則表達式將捕獲不到任何以“CC:”開始的一行,而是抽取幾個隨機的文本。坦白的說,正則表達式匹配 “CC:”開始的一行,但是什么都捕獲不到;或者匹配任何包含“To:”的一行,但是把這行的剩余文本都捕獲了。通常情況下,這個正則表達式會捕獲大量 Email地址,所有沒有人會注意這個bug。 
    如果要符合實際意圖,那么你應該加入括號說明清楚,正則表達式如下: 
(^CC:)|(To:(.*)) 
    如果真正意圖是捕獲以“CC:”或者“To:”開始的文本行的剩余部分,那么正確的正則表達式如下: 
^(CC:|To:)(.*) 
    這是一個普遍的不完全匹配的bug,如果你養(yǎng)成為交替操作分組的習慣,你就會避免這個錯誤。 

    四、使用寬松數(shù)量詞 
    很多程序員避免使用寬松數(shù)量詞比如“*?”、“+?”和“??”,即使它們會使這個表達式易于書寫和理解。 
     寬松數(shù)量詞可以盡可能少的匹配文本,這樣有助于完全匹配的成功。如果你寫了“foo(.*?)bar”,那么數(shù)量詞將在第一次遇到“bar”時就停止匹配,而不是在最后一次。如果你希望從“foo###bar+++bar”中捕獲“###”,這一點就很重要。一個嚴格數(shù)量詞將捕獲“###bar++ +”。 
    假設你要從HTML文件里面捕獲所有電話號碼,你可能會使用我們上文討論過的電話號碼正則表達式的例子。但是,如果你知道所有電話號碼都在一個表格的第一列里面,你可以使用寬松數(shù)量詞寫出更簡單的正則表達式: 
tr>;td>;(.+?)td>; 
    很多剛起步的程序員不使用寬松數(shù)量詞來否定特定種類。他們能寫出下面的代碼: 
tr>;td>;([^>;]+)/td>; 
    這種情況下它可以正常運行,但是如果你想捕獲的文本包含有你分隔的公共字符(這種情況下比如/td>;),這將會帶來很大麻煩。如果你使用了寬松數(shù)量詞,你只要花上很少的時間組裝字符種類就能產(chǎn)生新的正則表達式。 
    在你知道你要捕獲文本的環(huán)境結(jié)構(gòu)時,寬松數(shù)量詞是具有很大價值的。 

    五、利用可用分界符 
    Perl 和PHP語言常常使用左斜線(/)來標志一個正則表達式的開頭和結(jié)尾,Python語言使用一組引號來標志開頭和結(jié)尾。如果在Perl和PHP中堅持使用左斜線,你將要避免表達式中的任何斜線;如果在Python中使用引號,你將要避免使用反斜線(\)。選擇不同的分界符或引號可以允許你避免一半的正則表達式。這將使得表達式易于閱讀,減少由于忘記避免符號而潛在的bug。 
    Perl和PHP語言允許使用任何非數(shù)字和空格字符作為分界符。如果你切換到一個新的分界符,在匹配URL或HTML標志(如“http://”或“br/>;”)時,你就可以避免漏掉左斜線了。 
    例如,“/http:\/\/(\S)*/”可以寫為“#http://(\S)*#”。 
    通用分界符是“#”、“!”和“|”。如果你要使用方括號、尖括號或者花括號,只要保持前后配對出現(xiàn)就可以了。下面就是一些通用分界符的示例: 
#…# !…! {…} s|…|…| (Perl only) s[…][…] (Perl only) s…>;/…/ (Perl only)  
     在Python中,正則表達式首先會被當作一個字符串。如果你使用引號作為分界符,你將漏掉所有反斜線。但是你可以使用“r''”字符串避免這個問題。如果針對“re.VERBOSE”選項使用三個連續(xù)單引號,它將允許你包含換行。例如 regex = "(\\w+)(\\d+)"可以寫出下面的形式: 
regex = r''' 
           (\w+) 
           (\d+) 
         ''' 

    小結(jié):本文的建議主要著眼于正則表達式的可讀性,在開發(fā)中養(yǎng)成這些習慣,你將會更加清晰的考慮設計和表達式的結(jié)構(gòu),這將有助于減少bug和代碼的維護,如果你自己就是這個代碼的維護者你將倍感輕松。 

您可能感興趣的文章:
  • PHP大神的十大優(yōu)良習慣
  • php代碼書寫習慣優(yōu)化小結(jié)
  • 編寫安全 PHP應用程序的七個習慣深入分析
  • 國外PHP程序員的13個好習慣小結(jié)
  • 在PHP中養(yǎng)成7個面向?qū)ο蟮暮昧晳T
  • PHP 引用是個壞習慣
  • 在PHP中養(yǎng)成7個面向?qū)ο蟮暮昧晳T
  • PHP 編程的 5個良好習慣
  • 10條PHP編程習慣助你找工作
  • PHP編程一定要改掉的5個不良習慣

標簽:黔東 衡陽 婁底 海南 德陽 邯鄲 內(nèi)江 樂山

巨人網(wǎng)絡通訊聲明:本文標題《[php]正則表達式的五個成功習慣》,本文關鍵詞  php,正則,表達式,的,五個,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權(quán)與本站無關。
  • 相關文章
  • 下面列出與本文章《[php]正則表達式的五個成功習慣》相關的同類信息!
  • 本頁收集關于[php]正則表達式的五個成功習慣的相關信息資訊供網(wǎng)民參考!
  • 推薦文章
    四虎久久精品国产| 亚洲天堂免费| 国产一区二区福利久久| 日本在线不卡视频| 99色视频| 精品视频免费在线| 91麻豆tv| 精品国产一区二区三区久久久蜜臀 | 欧美另类videosbestsex久久 | 免费一级片在线观看| 久久精品大片| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 沈樵在线观看福利| 亚洲天堂在线播放| 欧美大片a一级毛片视频| 91麻豆国产福利精品| 午夜久久网| 国产一区精品| 四虎久久影院| 精品久久久久久影院免费| 四虎论坛| 国产91精品系列在线观看| 一级女人毛片人一女人| 久久99爰这里有精品国产| 国产成+人+综合+亚洲不卡| 亚洲天堂在线播放| 可以免费看毛片的网站| 国产视频在线免费观看| 精品在线观看一区| 国产不卡在线看| 日本免费区| 99色播| 久久久成人影院| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 国产亚洲精品aaa大片| 国产视频在线免费观看| 亚飞与亚基在线观看| 九九精品久久| 国产一级生活片| 可以免费看污视频的网站| 日韩中文字幕在线播放| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 午夜在线观看视频免费 成人| 韩国三级一区| 成人免费观看男女羞羞视频| 久久久成人影院| 高清一级片| 亚洲第一页乱| 国产一区二区精品久久| 美女免费毛片| 天天做日日爱夜夜爽| 精品视频在线观看免费| 日韩一级黄色大片| 欧美另类videosbestsex视频| 99久久精品费精品国产一区二区| 午夜在线影院| 久久99欧美| 国产不卡在线看| 99久久精品国产免费| 国产一区精品| 黄视频网站免费看| 日韩在线观看视频免费| 日韩免费在线视频| 日本在线不卡视频| 黄视频网站免费看| 日本伦理网站| 欧美国产日韩在线| 你懂的日韩| 精品国产一区二区三区久久久狼| 色综合久久天天综线观看| 日本特黄一级| 国产视频久久久| 日韩中文字幕一区| 国产原创中文字幕| 国产视频网站在线观看| 欧美激情一区二区三区视频高清 | 日本在线www| 国产不卡高清在线观看视频 | 国产伦理精品| 国产综合91天堂亚洲国产| 国产视频在线免费观看| 欧美激情一区二区三区视频高清 | 亚欧成人乱码一区二区| 欧美激情在线精品video| 国产91丝袜在线播放0| 久久99这里只有精品国产| 午夜久久网| 欧美一区二区三区在线观看| 99热精品一区| 99色视频| 日本免费乱理伦片在线观看2018| 九九久久99综合一区二区| 一级毛片视频播放| 黄视频网站在线免费观看| 久久国产精品自由自在| 91麻豆精品国产自产在线观看一区| 毛片的网站| 国产美女在线观看| 国产美女在线观看| 国产极品白嫩美女在线观看看| 黄视频网站免费观看| 日本免费区| 久草免费资源| 九九精品在线| 国产视频久久久| 91麻豆精品国产自产在线| 日本在线www| 黄视频网站免费看| 久久国产一久久高清| 99久久精品费精品国产一区二区| 国产一区二区精品| 国产一区精品| 久久99中文字幕久久| 日本免费乱理伦片在线观看2018| 亚洲精品中文字幕久久久久久| 日韩专区第一页| 99久久精品国产国产毛片| 国产伦精品一区三区视频| 亚洲精品久久久中文字| 欧美a级片免费看| 欧美18性精品| 一级毛片看真人在线视频| 亚洲天堂在线播放| 精品视频一区二区| 国产一区二区精品久久| 欧美国产日韩精品| 国产精品免费精品自在线观看| 欧美1区2区3区| 久久国产影院| 国产亚洲精品成人a在线| 国产91丝袜高跟系列| 久久99中文字幕久久| 欧美大片毛片aaa免费看| 成人a大片高清在线观看| 久久99中文字幕| 国产一区二区精品在线观看| 久久精品道一区二区三区| 亚洲 国产精品 日韩| 99久久精品国产麻豆| 国产一区二区精品久久| 黄色短视频网站| 成人免费观看男女羞羞视频| 国产网站免费观看| 日日夜夜婷婷| 免费毛片播放| 国产视频一区在线| 国产网站免费视频| 高清一级毛片一本到免费观看| 国产网站免费观看| 亚洲精品中文一区不卡| 国产麻豆精品| 国产国产人免费视频成69堂| 免费国产一级特黄aa大片在线| 日本特黄特黄aaaaa大片| 久久福利影视| 美女免费精品高清毛片在线视| 精品视频在线观看免费| 欧美1区| 久久久久久久久综合影视网| 日韩中文字幕在线播放| 久久久久久久免费视频| 国产综合成人观看在线| 日本免费乱人伦在线观看| 国产精品1024永久免费视频| 国产网站在线| 欧美激情一区二区三区在线| 精品视频在线观看视频免费视频| 一 级 黄 中国色 片| 一级女性全黄久久生活片| 亚洲第一页乱| 久久精品大片| 99久久视频| 国产伦精品一区二区三区在线观看| 成人影院一区二区三区| 成人免费观看男女羞羞视频| 日韩av片免费播放| 欧美激情一区二区三区视频| 日韩专区一区| 中文字幕一区二区三区 精品| 黄视频网站在线看| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 成人在免费观看视频国产| 91麻豆爱豆果冻天美星空| 国产亚洲精品aaa大片| 国产成人精品综合在线| 黄视频网站免费看| 久久精品免视看国产明星| 欧美另类videosbestsex久久 | 天天做日日爱| 欧美激情在线精品video| 国产综合91天堂亚洲国产| 可以免费在线看黄的网站| 欧美激情在线精品video| 韩国毛片基地| 亚洲天堂免费| 二级特黄绝大片免费视频大片| 欧美一级视频高清片| 四虎久久影院| 香蕉视频亚洲一级| 免费国产在线视频|