爬取股票信息(股票代码+价格)

用到的两个网站分别东方财富网和老虎社区

思路为先从东方财富网获取股票列表,列表包含所有的股票名称和代码。然后再根据股票代码从老虎社区获取到个股的价格信息。

直接上代码:

import requests
from bs4 import BeautifulSoup
import re# 获得HTML页面
def getHTMLpages(url):try:r = requests.get(url, timeout=30)r.raise_for_status()r.encoding = r.apparent_encodingreturn r.textexcept:return ""# 将股票信息存入列表
def getSharelist(ulis, html):soup = BeautifulSoup(html, "html.parser")tags = soup.find_all('a', target="_blank") # a标签的target属性值为"_blank"# print(tags)for tag in tags:str1 = tag.attrs['href']  # 获得链接信息# print(type(str1))# print(str1)match = re.search(r's[hz]\d{6}', str1)  # 从链接中找到股票代码if match:  # 必须加判断,因为有的链接不符合,这样的话正则表达式匹配不到,match.group(0)就是空的,会报错TypeError# print(match.group(0))ulis.append(match.group(0))else:continue# 将个股信息存入文件
def getShareinfo(url, count):html = getHTMLpages(url)soup = BeautifulSoup(html, "html.parser")names = soup.find('h1', attrs={'class': 'name'})  #股票名称price = soup.find('span', attrs={'class': 'latest'})  # 个股价格# print(tags.attrs['class'])if names:  # 必须加判断,因为有的查询不到TestDict = {}# print(names.text) # 打印标签内的内容TestDict[names.text] = price.text# print(price.text)# 将股票信息追加写入到股票信息.txt中with open("D:\VscodePy\pytest\股票信息.txt", "a", encoding='utf-8') as f:f.write('\n' + str(TestDict))f.close()print("当前进度: {:.2f}%\n".format(count * 100 / len(ulis)), end="")# 主函数
if __name__ == "__main__":ulis = []count = 1url1 = "http://quote.eastmoney.com/stock_list.html"html = getHTMLpages(url1)# with open("D:\VscodePy\pytest\sharehtml1.txt", "w", encoding='utf-8') as f:#     f.write(html)#     f.close()# with open('D:\VscodePy\pytest\sharehtml1.txt', 'r', encoding='utf-8') as f:#     sss = f.read()#     getSharelist(ulis, sss)#     f.close()# print(ulis)getSharelist(ulis, html)print("数据共有{}条\n".format(len(ulis)))url2 = "https://www.laohu8.com/stock/"for i in range(len(ulis)):code = re.search(r'\d{6}', ulis[i])url = url2 + code.group(0)getShareinfo(url, count)count += 1

输出结果为:

共有4792条数据,有些股票是停牌状态,但是是JS动态加载出来的,使用这个方法只能爬取静态页面,如何爬取动态页面后面更新会补上。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/62966.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

哪些日本人看来很普通的日文词汇,在我们眼里会很高大上?

小幽香 ,よろしく~ AhCrazyWomenHere、赫尔曼.哈里、Mikkeli Matlock 等人赞同 心象風景(しんしょうふうけい) 指非写实的,却在人脑海中浮现,被描述或被记忆的风景。(红A:Unlimited blade wor…

用AI处理Excel,提升工作效率(建议收藏)

准备 开始课程之前我们需要准备一些数据,用于后面的操作案例。在这儿,我们就借助New Bing生成一些数据。生成数据时候,我是用的Prompt为: 我给你一个标题,请给我20组数据"姓名 基本工资 满勤奖励 绩效奖金 总工…

第77篇一对多之稳定性研究(二)之学生发消息报错及array_unshift

关键词:一对多稳定性研究, 学生发消息报错,array_unshift 一、一对多稳定性研究 1.1 测试平台--本地服务器运行平台 老师端:带老师名字 https://localhost:9101/demos/index.html?roomid888&t600&&teaNameMobile莫言 学生一&#xff1…

chatgpt赋能python:Python网络摄像头:使用Python编写网络摄像头应用程序的最佳实践

Python网络摄像头:使用Python编写网络摄像头应用程序的最佳实践 Python是一种高级编程语言,被广泛应用于各种领域,包括网络摄像头。Python的简单易用和强大的功能使其成为网络摄像头应用程序的最佳选择。在本文中,我们将介绍Pyth…

避坑14_此浏览器或应用可能不安全。了解详情请尝试使用其他浏览器。

一、问题 登录谷歌浏览器同步数据时,显示如下错误: 此浏览器或应用可能不安全。请尝试使用其他浏览器。如果您使用的是受支持的浏览器,可以重新尝试登录。 二、解决方法 关闭chrome(最好重启电脑) 打开chrome文件所…

从知识直播和创新活动中,看搜狐的内容“新”路

5月17日,2023搜狐科技峰会顺利闭幕。 本次峰会讨论的内容前瞻且丰满。分享内容涵盖前沿科学突破,宇宙文明、天文卫星、人类永生,到展望人类未来,核聚变、6G通信、脑机接口,再到通用人工智能时代启幕下的行业变革&…

QQ 用 Electron 重构后,终实现 Linux、macOS、Windows 三端架构统一!

整理 | 苏宓 出品 | CSDN(ID:CSDNnews) 经过 24 年的更迭,国民应用 QQ 已成为 80/90 后的回忆,00 后的主战场。而今,因为 QQ 一个最新版本的发布,吸引了不分年龄层次的技术人的目光。 7 月 3 日…

蓝鸟没了?马斯克官宣推特蓝鸟改为上帝X

#AI情报 定了!今晚马斯克会将推特会改名为X,X logo将于今晚发布! X.com已经指向了twitter.com。7月24日早,马斯克在社交媒体推特上发布帖子称,用户现在登录X.com就能指向推特网站,也依然保留twitter.com域…

亚马逊云科技推出大语言模型和生成式AI新服务

采用机器学习新范式赋能业务的不断探索已经播种了几十年。但随着充足可伸缩算力的就位、海量数据的爆炸、以及机器学习技术的快速进步,各行各业的客户开始对业务进行重塑。最近,像ChatGPT这样的生成式AI应用引起了广泛的关注,引发了诸多想象。…

亚马逊云科技为客户的创新开辟出全新的途径

2022年12月,AI创业公司OpenAI推出了聊天机器人ChatGPT。作为生成式AI在文本领域的实际应用之一,ChatGPT的问世距今不过百天而已,却已经火爆了全球。 一时间,大量的企业投入到生成式AI领域,大有“任彼桑田变沧海&#x…

通过FinalShell连接AWS的EC2服务器

今天通过AWS的EC2服务器,搭建了一下ChatGPT的服务,体验了一把,通过FinalShell连接AWS的EC2服务器遇到了一个问题,记录一下。 小插曲:(ChatGPT的服务后续将集成到“韭盾”公众号合“安前码后”公众号&#…

九龙证券|多巨头竞相布局这个热门赛道,机构一致看好的概念股

华为高阶智能驾驭体系ADS 2.0版本发布。 早前,华为在2023华为智能轿车解决方案发布会上,发布了高阶智能驾驭体系 ADS 2.0。新体系将由 AITO 问界 M5 高阶智能驾驭版首发,并已适配阿维塔 11 全系列以及极狐阿尔法 S 全新 Hi 版等车型。 最近&…

学习效率翻倍,用ChatGPT来学习SQL数据分析

本文将介绍使用ChatGPT来学习SQL,以及如何使用这个神奇的工具来提高我们的SQL技能。 微信搜索关注《Python学研大本营》,加入读者群,分享更多精彩 图片来自微软设计器标题 ChatGPT可以做很多很酷的事情。其中之一就是写代码。用户只需要给出正…

短视频剪辑怎么做?4步教你快速入门

最近看到很多小伙伴在问,做短视频自媒体需要具备哪些技能?要准备什么工具?今天就给大家盘点一下,短视频剪辑怎么做,怎样才能快速入门: 01 剪辑软件 入门级别:入门级别的软件首推爱剪辑&#xf…

短视频剪辑自学小技巧,掌握并运用,让你的短视频火起来

短视频剪辑自学小技巧,掌握并运用,让你的短视频火起来 短视频的火爆大家都是有目共睹的,虽然有很多人对于短视频持有怀疑态度,认为短视频很容易浪费光阴,但是不得不承认的是,短视频仍旧是很多人在闲暇时间…

短视频剪辑,超简单的教程

视频如何剪辑,有没有好用的一些技巧呢?今天小编给大家分享一个新的剪辑技巧,它支持多段视频的同时剪辑,下面一起来试试吧。 准备素材 将需要剪辑的多段短视频、音频、图片等等都保存在同一个文件夹之中 选择剪辑方案 运行【媒体梦…

博士申请 | 英国格拉斯哥大学赵德宗教授课题组招收无人驾驶方向全奖博士生...

合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 格拉斯哥大学 格拉斯哥大学肇建于 1451 年,英国顶尖学府,位于苏格兰…

“真正的”欧洲杯,鸡冻不鸡冻?

刚巧一位铁瓷,前段时间聊起来,打算现场看欧洲杯的事情,众所周知,欧洲杯可以说是除了世界杯外,足球领域水平最高的国家队赛事,2020年欧洲杯将在明年6月、7月举行,与2016欧洲杯采用相同的赛制&…

格拉斯哥大学毕设:多水下潜行器的仿真,引导和控制

前言 写在前面,这是格大的工学院的一个毕设题目。课题要求对多个AUV进行编队控制,完成一个假定的任务,期间涉及的技术首先是对单个AUV的控制器设计,路径规划设计,其次是考虑编队控制,需要设计编队策略。 …

快讯 | 整数智能携手格拉斯哥大学举办AI圆桌分享会

算法、算力和数据作为人工智能发展的三大支柱,而获取高质量的数据已经成为人工智能工程化进程中的难题。 如何能够寻找到与算法训练完美适配的数据集,在数据生产过程中有哪些常见的痛点?5月12日,由整数智能与格拉斯哥大学合作举办…