学的是b站的课程(千锋教育),跟老师写程序,不是自创的代码!
今天是学Python的第22天,学的内容是正则表达式,明天会出一篇详细实例介绍。电脑刚修好!开学了,时间不多,写得不多,见谅。
目录
1. 正则表达式简介
(1).语法
(2).简介
(3).特点
(4).使用场景
2. 导入概念
3. 解析代码
4.正则的基本语法
(1).查找函数
(1).re.match( )
(2).re.search( )
(2).拆分
(3).替换
(4).匹配中文
总结
1. 正则表达式简介
(1).语法
这里是部分,详细版在后面会出.
(2).简介
是一个特殊的字符序列,计算机科学中的一个概念,主要用来检索\替换那些符合某个模式的文本。在python中使用正则表达式,借助的是re模块,通过re模块可以实现正则表达式的绝大多数的功能。正则表达式在文本处理中扮演着至关重要的角色。它就像是一把神奇的钥匙,可以打开复杂文本数据中的秘密之门。它拥有自己独特的语法和处理引擎,虽然在效率上可能不如一些字符串自带的方法,但在功能的强大性上无可比拟。
(3).特点
1.灵活性\功能性\逻辑性非常强
2.可以使用极简单的方式达到字符串的复杂控制.
(4).使用场景
爬虫
验证手机号,身份证号,邮箱等
数据分析的数据清洗或整理
2. 导入概念
要求:封装一个功能,判断用户输入的手机号码是否合法.
普通方法
正则表达式方法
3. 解析代码
re.search(r"^1\d{10}$",checkPhone)
首先,^ 表示的是正则表达式的开始,\d表示0-9之间的数字,{10}表示重复10次,$表示正则表达式的结束,checkPhone表示被正则表达式检测的变量。结果是一个布尔类型,所以可以用if语句进行检测.
4.正则的基本语法
(1).查找函数
(1).re.match( )
语法:匹配字符串是否以指定的正则内容开头,匹配成功返回对象,匹配失败返回None。
第一个参数:正则表达式;
第二个参数:要验证的字符;
第三个参数:可选参数,正则表达式的修饰符.
只能匹配数字开头的,同时也不能匹配到非数字后面的数字!
(2).re.search( )
语法:匹配字符串中是否包含指定的内容,匹配成功返回对象,匹配失败返回None.
可以匹配非数字开头的,但不能匹配到非数字后面的数字!
(2).拆分
语法:re.spilt(正则表达式,"要处理的数据")
(3).替换
语法:re.sub(正则表达式,替换后的内容,要替换的字符串)
(4).匹配中文
语法:最常见的,定义chinese=“[\u4e00-\u9fa5]+]”
自我理解:在这文章只是对正则表达式的一篇简单的介绍入门而已,后面会写一篇文章来介绍不同的正则表达式的使用方法。正则表达式是一篇特别难的知识点,它的应用范围很广,而且它的代码只有在特定的环境中才会很好的被理解。
我们后面写爬虫的时候会继续讲解正则表达式,学好正则表达式对后面的爬虫的理解也很有帮助。
总结
这是我今天学Python的自我想法和对其的理解,有不对的地方请同志们多多包涵,谢谢观看!