Python 正则表达式:split

作用:用正则表达式的字符分割字符串,正则的字符会被抛弃。

本文以 提取URL的地址与参数 为例,介绍re模块的split的用法: 返回值 -> 列表

复杂匹配 = re.compile(正则表达式): 将正则表达式实例化

+

re.split(要匹配的字符串): 从字符串开头 开始匹配,寻找完整个字符串后,将结果以 列表 返回

 

简单匹配 =  re.split(正则表达式, 要匹配的原字符串): 从字符串开头 开始匹配,寻找完整个字符串后,将结果以 列表 返回

 

  1. re.split(pattern, string, maxsplit=0, flags=0),如果匹配成功,则返回一个列表,否则返回原string列表;
  2. 第一个参数:正则表达式
  3. 第二个参数:要匹配查找的原始字符串;
  4. 第三个参数:可选参数,表示最大的拆分次数,默认为0,表示全部分割;
  5. 第四个参数:可选参数,标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等;
  6. 需要特别注意的是,这个方法并不是完全匹配。它仅仅决定在字符串开始的位置是否匹配。所以当pattern结束时若还有剩余字符,仍然视为成功。想要完全匹配,可以在表达式末尾加上边界匹配符‘$’
  7. 例如: re.split(‘z’, ‘p.python.p’)返回值为[‘p.python.p’];  #失败返回原string列表
  8.        re.split(‘p’, ‘p.python.p’)返回值为[‘.’‘ython.’]   #成功返回新列表