51Testing软件测试论坛

 找回密码
 (注-册)加入51Testing

QQ登录

只需一步,快速开始

微信登录,快人一步

查看: 499|回复: 0
打印 上一主题 下一主题

测试大神手把手带你玩转Python正则表达式

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2022-10-20 17:21:47 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 草帽路飞UU 于 2022-10-20 17:23 编辑

01
概念


如果要处理的文件比较简单,直接使用字符串匹配就可以了,如下:





那么使用字符串匹配的python代码:



def find_start_re(fname):
    f = open(fname,'r')
    for line in f:
        if line.startswith('re'):
            print(line)
    f.close()

find_start_re('re.txt')

执行结果:
单个处理数据和文本,效率不高,不适合数据量大的场景,正则表达式可以解决处理数据量大的情况。

正则表达式概念:
  • 使用单个字符串来描述匹配一系列符合某个句法规则的字符串


  • 是对字符串操作的一种逻辑公式


  • 应用场景:处理文本和数据


  • 正则表达式过程:依次拿出表达式和文本中的字符比较,如果每一个字符都能匹配,则匹配成功,否则匹配失败





02
re


模块re使用的过程:


使用举例:
1.


2.

3.匹配时忽略大小写,增加re.I

4.正则表达式语法



  • *的用法:


+的用法:匹配合理的变量名(必须以‘_’或者字母开头)


?用法:匹配0-99的数字


{m}/{m,n}的用法:匹配合理的126邮箱(@126.com之前是6到10位字符)


*?/+?/??的用法:


5、正则表达式进行边界匹配

6、正则表达式进行分组匹配

| 的用法:匹配0-99的数字

(ab)的用法:

\<number>的用法:处理xml文件时会经常用到 <book>python</book>
(?P<name>)、(?P=name)的用法:


03
re的其他方法



因为re模块的match方法是从头开始匹配的,当需要匹配字符串中的子串的时候就不好用了。



search方法:

匹配字符串中的数字 'study python = 1000'


findall方法:


sub方法:

参数repl有两种方式,一种是本身就是字符串,一种是函数,取函数返回的字符串


split用法:













本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?(注-册)加入51Testing

x
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏
回复

使用道具 举报

本版积分规则

关闭

站长推荐上一条 /1 下一条

小黑屋|手机版|Archiver|51Testing软件测试网 ( 沪ICP备05003035号 关于我们

GMT+8, 2024-5-12 16:48 , Processed in 0.067186 second(s), 24 queries .

Powered by Discuz! X3.2

© 2001-2024 Comsenz Inc.

快速回复 返回顶部 返回列表