python爬虫lxml xpath测试

xpath测试1:
main.py

"""=== coding: UTF8 ==="""
from lxml import etreexml = """
<book><id>1</id><name>春风</name><price>1.56</price><nick>万里</nick><author><nick id="10086">周大庆</nick><nick id="10010">黄天山</nick><nick class="joy">周谈浩</nick><div><nick>嘟嘟</nick></div><span><nick>珊瑚</nick></span></author>
</book>
""""""
========================================
主函数功能测试
========================================
"""
if __name__ == '__main__':tree = etree.XML(xml)# result = tree.xpath("/book")  # /表示层级关系,第一个/是根节点# result = tree.xpath("/book/name/text()")  # text()拿文本# result = tree.xpath("/book/author//nick/text()")  # //后代result = tree.xpath("/book/author/*/nick/text()")  # *任意的节点,通配符print(result)

xpath测试2:
test.html

<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><title>测试</title>
</head>
<body><ul><li><a href="http://www.baidu.com">百度</a></li><li><a href="http://www.google.com">谷歌</a></li><li><a href="http://www.sogou.com">搜狗</a></li></ul><ol><li><a href="feiji">飞机</a></li><li><a href="dapao">大炮</a></li><li><a href="huoche">火车</a></li></ol><div class="job">高凡尔</div><div class="common">刘珂</div>
</body>
</html>

main.py

"""=== coding: UTF8 ==="""
from lxml import etree"""
========================================
主函数功能测试
========================================
"""
if __name__ == '__main__':parser = etree.HTMLParser(encoding='utf-8')tree = etree.parse("test.html", parser=parser)# result = tree.xpath("/html")  # /表示层级关系,第一个/是根节点# result = tree.xpath("/html/body/ul/li/a/text()")  # text()拿文本# result = tree.xpath("/html/body/ul/li[1]/a/text()")  # xpath的顺序是从1开始数的,[]表示索引# result = tree.xpath("/html/body/ol/li/a[@href='dapao']/text()")  # @xxx=xxx表示属性的筛选# print(result)ol_li_list = tree.xpath("/html/body/ol/li")for li in ol_li_list:# 从每一个li中提取到文字信息result = li.xpath("./a/text()")  # 在li中继续查找,相对查找print(result)result = li.xpath("./a/@href")  # 拿到属性值: @属性print(result)print(tree.xpath("/html/body/ul/li/a/@href"))print(tree.xpath("/html/body/div[1]/text()"))print(tree.xpath("/html/body/ol/li/a/text()"))

关注公众号,获取更多资料
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/36020.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mysql练习题1

学生表 Student create table Student(Sid varchar(6), Sname varchar(10), Sage datetime, Ssex varchar(10)); insert into Student values(01 , 赵雷 , 1990-01-01 , 男); insert into Student values(02 , 钱电 , 1990-12-21 , 男); insert into Student values(03 , 孙风…

高视医疗更新招股书:年营收13亿 OrbiMed是股东

雷递网 雷建平 6月1日报道 高视医疗日前再次冲刺港交所&#xff0c;准备在香港上市。 高视医疗是一家眼科医疗器械供应商&#xff0c;业务覆盖眼科设备及耗材的研发、生产、销售及技术服务领域。 高视医疗旗下人工晶体及电生理产品已销往70多个国家和地区&#xff0c;同时公司与…

Linux Debian利用Dockefile将Python的py文件项目代码打包为Docker Podman镜像

1.创建PyCharm工程 使用PyCharm创建testHelloWorld工程&#xff0c;如下图所示&#xff1a; 2.选择本项目下的Python解释器 通过File -> Setting…选择解释器为本工程下的Python解释器。 【备注&#xff1a;一定要将项目python环境依赖存至本项目下&#xff0c;默认依赖本…

基于ThinkPHP的图书馆管理系统 毕业设计-附源码311833

图书馆管理系统的设计与实现 摘 要 大数据时代下&#xff0c;数据呈爆炸式地增长。为了迎合信息化时代的潮流和信息化安全的要求&#xff0c;利用互联网服务于其他行业&#xff0c;促进生产&#xff0c;已经是成为一种势不可挡的趋势。在图书馆的要求下&#xff0c;开发一款整体…

广和通携手联发科技正式发布基于MediaTek T830 平台5G模组FG370的可快速落地FWA解决方案

2月28日&#xff0c;全球领先的物联网无线通信解决方案和无线通信模组提供商广和通正式宣布&#xff1a;新一代5G模组FG370已率先实现量产&#xff0c;并于2023世界移动通信大会&#xff08;MWC Barcelona 2023&#xff09;期间携手联发科技正式发布基于FG370的FWA解决方案&…

中科创达:汽车智能化浪潮下的leader or follower?

点击上方蓝色字体&#xff0c;关注我们&#xff01; 7月9日中科创达发布上半年业绩预告后&#xff0c;10-11日连续两个涨停。同样是涨停&#xff0c;10日是一字板&#xff0c;而11日却拉出一条长长的下影线&#xff0c;随后股价开始转头向下&#xff0c;结束了5月底以来的涨势。…

广和通基于联发科技 T830平台的5G模组FG370率先通过CE认证测试

11月&#xff0c;广和通5G模组FG370率先通过CE认证测试&#xff0c;进而可用于无线宽带终端部署。5G模组FG370于9月启动研发&#xff0c;并于10月正式发布&#xff0c;随后仅短短一个月&#xff0c;便通过CE认证测试。至此&#xff0c;广和通5G模组FG370已进入工程送样阶段&…

高通再次「押宝」中科创达,挑战智能驾驶软硬件全栈方案

随着英伟达、地平线在中国市场刮起智能驾驶计算平台的「市场替代战」&#xff0c;作为后来者的高通&#xff0c;也坐不住了。这家全球移动芯片巨头此前在中国市场仅拿到了长城的智能驾驶定点。 目前&#xff0c;英伟达在中国市场已经拿到了蔚来、理想、小鹏、上汽、比亚迪等客户…

中科创达的吸引力法则:一万名工程师青睐的组织管理模式

作为管理计算机硬件和软件资源的中枢&#xff0c;操作系统的存在使得用户能够灵活、高效地使用计算机。进入智能时代&#xff0c;中科创达不仅成为了全球领先的智能操作系统产品和技术提供商&#xff0c;更重要的是&#xff0c;作为创新型企业&#xff0c;它也蜕变成了一个优秀…

[转]QNX系统-基于高通骁龙SA8155平台,中科创达发布智能驾驶舱3.0解决方案

如果你认为本系列文章对你有所帮助&#xff0c;请大家有钱的捧个钱场&#xff0c;点击此处赞助&#xff0c;赞助额0.1元起步&#xff0c;多少随意 声明&#xff1a;本文只用于个人学习交流&#xff0c;若不慎造成侵权&#xff0c;请及时联系我&#xff0c;立即予以改正 锋影 …

中科创达面试题

java的数据类型 基本数据类型&#xff1a; byte 1个字节 -2^7~2^7-1 0 8 bit Byte short 2个字节 -2^15~2^15-1 0 16 bit Short int (默认int ) 4个字节 有符号-2^31~2^31-1 无符号 0~ 2^31-1 0 32 bit Integer long 8个字节 -2^63~2^63-1 0.0L 64 bit…

广和通携手中国联通研究院、中科创达现网验证全球首例5G模组端到端多切片方案

当前5G处于规模发展的关键时期&#xff0c;5G行业模组成熟发展是推进5G规模应用的关键环节。目前5G模组价格仍然较高&#xff0c;行业需求较为碎片化&#xff0c;且5G最具特色的功能5G网络切片尚未在行业模组上探索出成熟端到端解决方案&#xff0c;因此亟需推动国产5G模组芯片…

以智能视觉驱动智慧出行,看中科创达如何持续深耕汽车市场

当前&#xff0c;360全景环视&#xff08;AVM&#xff09;正在往丰富的ADAS功能、透明底盘功能、不同等级的自动泊车功能等领域拓展&#xff0c;全景环视市场的多元化增长路径已经全面开启。 高工智能汽车研究院监测数据显示&#xff0c;2022年1-9月中国市场&#xff08;不含进…

中科创达怎么样?科技实力来说话

中科创达怎么样&#xff1f;靠谱得让人安心&#xff0c;这家公司作为全球领先的智能操作系统产品及技术供应商&#xff0c;有着从操作系统&#xff0c;中间件&#xff0c;硬件驱动到上层应用全面的技术体系、丰富的研发经验、强而有力的技术开发服务能力及众多自有知识产权&…

还在为找不到工作发愁吗?这个方法会对你有帮助,用过的人都说好

一个企业待久了&#xff0c;就连老员工也想换个工作&#xff0c;给自己一个新的环境&#xff0c;新的经历。但是辞职了后&#xff0c;却又怕找不到工作&#xff0c;迷茫彷徨不知所措。 职场中&#xff0c;找工作的人大都把希望寄托在招聘网上&#xff0c;登录某招聘网&#xf…

互联网公司测试组长/leader/经理如何面试社招测试工程师

1.你为什么选择软件测试行业 因为之前有了解软件测试这个行业&#xff0c;觉得他的发展前景很好。 2.根据你以前的工作经验描述一下软件开发、测试过程&#xff0c;由那些角色负责&#xff0c;你做什么 要有架构师、开发经理、测试经理、程序员、测试员。我在里面主要是负责…

【业务数据分析】——常见业务指标

&#x1f935;‍♂️ 个人主页&#xff1a;Lingxw_w的个人主页 ✍&#x1f3fb;作者简介&#xff1a;计算机科学与技术研究生在读 &#x1f40b; 希望大家多多支持&#xff0c;我们一起进步&#xff01;&#x1f604; 如果文章对你有帮助的话&#xff0c; 欢迎评论 &#x1f4a…

李彦宏再提“车水马龙”,百度文心一言进展神速

5月18日天津举办的第七届世界智能大会上&#xff0c;百度创始人、董事长兼CEO李彦宏发表了题为《大模型改变人工智能》的演讲。在解释什么是“生成式AI”的时候&#xff0c;这位一向谦卑儒雅的科技大佬笑着玩起了梗&#xff0c;“比如给我画一幅车水马龙的图片”。 上网冲浪的…

学物理赶不上计算机,高二上学期物理为何这么难?

高二上学期物理为何这么难&#xff1f; (文/王尚)家长咨询&#xff1a;王老师您好&#xff0c;我家孩子是女孩&#xff0c;刚上高二。她的物理并不是强项&#xff0c;不过还凑合&#xff1b;高一结束时&#xff0c;其实我原来打算想让她读文科的&#xff0c;后来因为她们学校理…

第二证券|医药板块短期轮动加快 机构看好后市机会

作为现在商场行情继续性最强的职业板块&#xff0c;医药股昨日早盘呈现回调&#xff0c;午后继续反弹&#xff0c;体现出较强的承接动能。机构以为&#xff0c;本轮新冠医治概念主线行情或仍将延续&#xff0c;但个股或将继续分解。 在本轮反弹行情中&#xff0c;医药板块表现较…