Python 正则表达式：split

作用：用正则表达式的字符分割字符串，正则的字符会被抛弃。

本文以提取URL的地址与参数为例，介绍re模块的split的用法: 返回值 -> 列表

复杂匹配 = re.compile(正则表达式): 将正则表达式实例化

re.split（要匹配的字符串）: 从字符串开头开始匹配，寻找完整个字符串后，将结果以列表返回

简单匹配 = re.split(正则表达式，要匹配的原字符串）: 从字符串开头开始匹配，寻找完整个字符串后，将结果以列表返回

re.split(pattern, string, maxsplit=0, flags=0),如果匹配成功，则返回一个列表，否则返回原string列表；
第一个参数：正则表达式
第二个参数：要匹配查找的原始字符串；
第三个参数：可选参数，表示最大的拆分次数，默认为0，表示全部分割；
第四个参数：可选参数，标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等；
需要特别注意的是，这个方法并不是完全匹配。它仅仅决定在字符串开始的位置是否匹配。所以当pattern结束时若还有剩余字符，仍然视为成功。想要完全匹配，可以在表达式末尾加上边界匹配符‘$’
例如： re.split(‘z’, ‘p.python.p’)返回值为[‘p.python.p’]； #失败返回原string列表
re.split(‘p’, ‘p.python.p’)返回值为[”, ‘.’, ‘ython.’, ”] #成功返回新列表

Post Views: 65