本文共 1312 字,大约阅读时间需要 4 分钟。
import reprint('\ a:{}个字符,\\a:{}个字符'.format(len('\ a'),len('\a')))#结果: \ a:3个字符,\a:1个字符match1 = re.findall('\\\\','\ a')match2 = re.findall('\\\\','\a')match3 = re.findall('\\a','\a')print(match1,match2,match3)print(match1[0],match3[0])#结果: ['\\'] [] ['\x07']#结果: \ match4 = re.findall(r'\\','\ a')match5 = re.findall(r'\\','\a')match6 = re.findall(r'\a','\a')print(match4,match5,match6)#结果: ['\\'] [] ['\x07']
第一段:在字符串中,\a为一个字符,\空格为两个字符。
第二段:在字符串中,无法搜索出\a字符中单独的反斜杠\,需要整体字符搜索。当需要搜索单独的一个反斜杠\时,需要使用两个\来搜索,即使用一个转义符\来表示反斜杠本身,re中pattern则要写为'\\\\'或r'\\'。
第三段:r'\'相当于'\\',同理r'\\'相当于"\\\\"。
参考:
\
If you’re not using a raw string to express the pattern, remember that Python also uses the backslash as an escape sequence in string literals; if the escape sequence isn’t recognized by Python’s parser, the backslash and subsequent character are included in the resulting string. However, if Python would recognize the resulting sequence, the backslash should be repeated twice. This is complicated and hard to understand, so it’s highly recommended that you use raw strings for all but the simplest expressions.
如果你没有使用原始字符串来表达模式,请记住Python也使用反斜杠作为字符串文字中的转义序列; 如果Python的解析器无法识别转义序列,则反斜杠和后续字符将包含在结果字符串中。但是,如果Python识别出结果序列,则反斜杠应重复两次。这很复杂且难以理解,因此强烈建议您使用原始字符串,除了最简单的表达式。
转载于:https://blog.51cto.com/13562190/2382343