爬取股票的历史数据(个股)

股票的历史数据爬取

爬取网易财经的个股历史数据
爬取链接:http://quotes.money.163.com/trade/lsjysj_000001.html?
在这里插入图片描述

先爬取股票的对应的代码

爬取股票代码的网站
https://www.banban.cn/gupiao/list_sh.html

代码

import requests,pymysql,re,datetime
import pandas as pd
from bs4 import BeautifulSoup
from sqlalchemy import create_engine
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from time import sleep
#1.创建Chrome浏览器对象,这会在电脑上在打开一个浏览器窗口   
headers={
'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.193 Safari/537.36'
}
def DownStockCode():print('开始获取上证、深证股票代码')count = 0stockcodeList=[]urlList = ['https://www.banban.cn/gupiao/list_sh.html','https://www.banban.cn/gupiao/list_sz.html']for url in urlList:res = requests.get(url=url,headers=headers)bs_res = BeautifulSoup(res.text,'html.parser')stocklist=bs_res.find('div',id='ctrlfscont').find_all('li')for stock in stocklist:stockhref=stock.find('a')['href']list_stockhref=stockhref.strip().split('/')stock_code=list_stockhref[2]stockcodeList.append(stock_code)count += 1print('当前已获取{}只股票代码'.format(count),end='\r')print('已获取所有上证、深证股票代码:{}个'.format(count))return stockcodeList 

在这里插入图片描述

然后循环模拟下载数据的过程
在这里插入图片描述

全部代码(运用到selenium)

之前没有解决的问题是chrome会弹窗出来,隐藏浏览器

#隐藏浏览器
chrome_options = Options()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')
#隐藏浏览器

新代码

import requests,pymysql,re,datetime
import pandas as pd
from bs4 import BeautifulSoup
from sqlalchemy import create_engine
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from time import sleep
from selenium.webdriver.chrome.options import Options
from PIL import Image,ImageEnhance
#1.创建Chrome浏览器对象,这会在电脑上在打开一个浏览器窗口   
headers={
'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.193 Safari/537.36'
}
def DownStockCode():print('开始获取上证、深证股票代码')count = 0stockcodeList=[]urlList = ['https://www.banban.cn/gupiao/list_sh.html','https://www.banban.cn/gupiao/list_sz.html']for url in urlList:res = requests.get(url=url,headers=headers)bs_res = BeautifulSoup(res.text,'html.parser')stocklist=bs_res.find('div',id='ctrlfscont').find_all('li')for stock in stocklist:stockhref=stock.find('a')['href']list_stockhref=stockhref.strip().split('/')stock_code=list_stockhref[2]stockcodeList.append(stock_code)count += 1print('当前已获取{}只股票代码'.format(count),end='\r')print('已获取所有上证、深证股票代码:{}个'.format(count))return stockcodeList 
all_code = DownStockCode()
#隐藏浏览器
chrome_options = Options()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')
#隐藏浏览器
browser = webdriver.Chrome(chrome_options=chrome_options)#声明浏览器chrome_options.add_experimental_option('excludeSwitches', ['enable-automation'])
chrome_options.add_argument('user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.104 Safari/537.36')
#chrome_options.add_argument("--headless")
#browser = webdriver.Chrome(options=chrome_options) for i in all_code:
#2.通过浏览器向服务器发送URL请求try:browser = webdriver.Chrome(options=chrome_options) browser.get("http://quotes.money.163.com/trade/lsjysj_"+i+".html?")sleep(5)#3.刷新浏览器#定位按钮并点击
#4.设置浏览器的大小browser.set_window_size(1400,800)browser.find_element_by_xpath('//*[@id="downloadData"]').click()browser.find_element_by_xpath('/html/body/div[2]/div[5]/div[2]/form/div[3]/a[1]').click()sleep(2)browser.quit()except:continue

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/72775.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机技能高考600分,高三一模成绩530高考能上600分吗

有可能。很多地方在高三为了督促同学复习不松懈,一模二模的考试往往试题难度会比高考更高!同时模拟考也往往不像高考评分那么工整、有详尽的步骤分,这就导致了学生考分的偏低。三模的试卷由于接近高考了,学生的状态好了&#xff0…

参加物理竞赛就是偏科严重?今天说说参加物理竞赛的好处和坏处!

前段时间,质心姐姐跟一些朋友聊起了竞赛这个话题。发现好多人都不知道竞赛能保送清北这个东东,或者就是略知一二~这让质心姐姐想来写一篇关于参加物理竞赛好处和坏处的文章。 先说说好处: 可以通过参加物理竞赛保送清北一般参加物理竞赛的流…

计算机竞赛满分学霸,数学英语满分!物理竞赛银牌!广西学霸杨晨煜730分的好成绩是怎样炼成的?...

6月23日中午, 2019年广西高考成绩出炉!考生可以通过电话、短信、网站查询成绩 来,大家呼吸一下, 肃穆的一刻又来了 让各位家长和学生关注的 除了高考分数线 莫过于是谁的成绩能领跑全广西 南宁二中男生杨晨煜取得好成绩 (其中数学…

AP物理12近两年真题及知识点分布

2022年AP物理1和物理2的考试已经告一段落,CB官网也第一时间更新了这两个科目的北美FRQ真题。随着世界大部分地区恢复线下教学,本次考试也恢复到了传统的纸笔模式。然而,鉴于国内疫情形势严峻复杂,大陆部分地区都在近期宣布取消AP大…

2021高考理综单科成绩查询,2021全国各省市高考总分及各科分数 分值是多少

2021年高考7月7日至9日举行,全国大部分地区使用全国卷,江苏等地自主命题,上海、浙江、山东、海南等属于高考改革地区,不分文理。下面是2021全国各省市高考总分及各科分数,高考前可能会有微调,具体分数请以考…

NOC2021年测试卷1

一、单项选择题(共15题,每题3分,共45分) 1.下列应用不能体现人工智能技术的是()。 A、使用语音输入法输入文字B、使用OCR软件从图像中识别汉字C、某软件支持在线中英文互译D、某网站自动统计歌曲下载次数2.点击绿旗执行图中的脚本,若角色的坐标为 (25, 20) ,则说出的内…

高一物理题整理

1 船过河问题 【分析及解答】 这个题的关键是如何理解船的速度,题目假设船的速度是不变的,也就是一直是 v 2 v_2 v2​。 列方程如下: { 120 v 1 ∗ 10 d v 2 ∗ 10 d v 2 sin ⁡ θ ∗ 12.5 v 1 v 2 cos ⁡ θ \left\{\begin{array}{l} …

chatgpt赋能python:Python获取QQ群成员的方法及注意事项

Python获取QQ群成员的方法及注意事项 如果你是一名新手开发者,或者是有多年开发经验的python工程师,但是想进一步深入学习python,那么这篇文章就是为你量身定做的。今天我们将会讨论如何使用Python获取QQ群成员,并且分析一些需要…

LLT-发现股市中的“大浪”

引言: 股市中小的波动经常干扰股票投资人对大趋势的判断,倘若股市的波动同信号波动类似,那是不是可以用处理信号的方式处理股票波动发现大的波动呢?我们知道通信领域在处理信号波动时也常会遇到被噪音干扰的问题,这些噪…

盘点为下个牛市做准备的10个新Layer1

牛市的高光项目,往往都诞生于上一轮熊市。 作者:Azuma;编辑:郝方舟 出品 | Odaily星球日报(ID:o-daily) Crypto 世界对周期性循环并不陌生,自比特币诞生以来,这个行业已经…

用Python分析微博股市热度和A股走势的关联

摘要 俗话说:牛市在静悄悄中开启,在狂热中结束。在牛市开始时往往已经经过了数年的熊市,市场内大部分股票跌跌不休,市场投资者逐渐不在关注股市,在股市无人问津的时候,股票的估值达到了很低的水平&#xf…

Ubuntu输入密码登陆不了仍跳回到登录界面

现象:在Ubuntu登陆界面输入密码之后,黑屏一闪并且出现了check battery state之类的文字之后,又跳转到登录界面。 原因:主目录下的.Xauthority文件拥有者变成了root,从而以用户登陆的时候无法都取.Xauthority文件。 说…

管理后台,登录后回到登陆前的页面(比如地址栏输入页面地址但是还没登录会回到登录页面,登录后回到这个页面)

首先应该在路由守卫那里应该把这个地址存起来。 我在项目中用的是在路由守卫那里把地址用localstorage存起来。 详细代码如下: router.beforeEach((to, from, next) > { let permission {} let role JSON.parse(localStorage.getItem(‘role’)); for (let k…

登录页面成功

1.首先我们把跳转到页面登录成功的js链接拉进来,然后建立个外部CSS我们用来写页面样式,并且拉进我们的页面当中。 2.然后开始搭建页面我们需要到的有登录页面名称,用户名文本框以及密码文本框,还有一个登录按钮,每个文…

谷歌 Alpha 家族再添“猛将”:AlphaDev 重磅亮相,打破多年计算瓶颈,新排序算法提速 70%!...

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 本周四,DeepMind 在著名学术刊物 Nature 上,发表了其最新研究成果:一个名为 AlphaDev 的 AI 系统。 从名字上便可以看出,AlphaDev 与 AlphaGo、AlphaFo…

【Pytorch基础教程36】基于Ernie预训练模型和Bert的新闻分类

文章目录 一、新闻分类任务1.1 中文数据集1.2 数据特点1.3 跑起代码 二、 预训练语言模型ERNIE2.1 ERNIE模型结构2.2 bert模型结构 三、项目代码1. bert模型2. ERNIE预训练模型 Reference 一、新闻分类任务 1.1 中文数据集 从THUCNews中抽取了20万条新闻标题,已上…

马斯克入驻推特造成大恐慌!这俩戏精还冒充被裁员工,外媒全被耍了

【导读】马斯克进驻推特后,又是审查代码,又是疑似将灭霸式裁员,人心惶惶之际,这两位戏精也出动了。 最近,马院士进驻推特的事儿可是闹得人仰马翻,鸡犬不宁。 上周四,马斯克抱着水槽走进大楼&a…

为什么程序员很难找到合适的另一半?

虽然现在社会很多人说程序员收入高,是体制外是最好的男友,可是程序员不是总被说成情商低、不懂浪漫吗? 找到合适的另一半,这个难度超过西天取经。指不定你要和九九八十一个妹子错过去,当然对于女生也没那么容易&#x…

佳缘男的计算机软件出差,交友我在世纪佳缘认识了一个男人,今年32岁,通信接近一个月,觉得 爱问知识人...

2006-06-29 16:46:27 见一面也好,见了你就断了对他的念头。也就不用这么高分问我们这个无聊的问题了。 哈哈 全部 2006-06-29 16:46:27 2006-06-29 16:04:28 外表是一方面的内容。但是要有深层次的了解才知道你们是否会适合在一起。 全部 2006-06-29 16:04:28 2006-…

有一种男人叫“程序员”,遇到就嫁了吧!

都说程序改变世界,那程序又是出自谁手呢,自然是程序员了。 全民编程时代,家里没有个会写程序的人,可怎么办啊?所以,今天就给妹纸们推荐一款性价比极高的老公候选人—程序员。 首先,程序员收入高…