爬取链家网房价数据

感觉最近做的东西好菜~~随便了。
在这里插入图片描述

import requests
from lxml import etree
import csvheaders = {'Referer': 'https://zs.fang.lianjia.com/loupan/nht1pg1/','User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36',
}fp = open('D://链家房价数据.csv','wt',newline='',encoding='utf8')
writer = csv.writer(fp)
writer.writerow(('楼盘名', '地址', '房间格式', '房间面积', '价格', '起价', '优点'))def get_html(url):try:response = requests.get(url, headers=headers)if response.status_code == 200:return response.content.decode('utf8')else:print('1')return Noneexcept:print('2')return Nonedef get_info(html):selector = etree.HTML(html)li_list = selector.xpath('//li[contains(@class, "resblock-list")]/div[@class="resblock-desc-wrapper"]')for li in li_list:try:name = li.xpath("div[@class='resblock-name']/a[@class='name ']/text()")[0]adress_1 = li.xpath("div[@class='resblock-location']/span[1]/text()")[0]adress_2 = li.xpath("div[@class='resblock-location']/span[2]/text()")[0]adress_3 = li.xpath("div[@class='resblock-location']/a/text()")[0]adress = adress_1 + '/' + adress_2 + '/' + adress_3how_many_1 = li.xpath("a[@class='resblock-room']/span[1]/text()")[0]how_many_2 = li.xpath("a[@class='resblock-room']/span[2]/text()")if how_many_2:how_many_1 = how_many_1 + '/' + how_many_2[0]else:passminaji = li.xpath("div[@class='resblock-area']/span/text()")[0]price = li.xpath("div[@class='resblock-price']/div[@class='main-price']/span[@class='number']/text()")[0]price += '元/平(均价)'qijia = li.xpath("div[@class='resblock-price']/div[@class='second']/text()")[0]advantge = li.xpath("div[@class='resblock-tag']//text()")mylist = []for i in advantge:j = i.strip()if len(j) == 0:continueelse:mylist.append(j)real_advantge = ','.join(mylist)x = [name, adress, how_many_1, minaji, price, qijia, real_advantge]print(x)writer.writerow(x)except:passif __name__ == '__main__':urls = ['https://zs.fang.lianjia.com/loupan/nht1pg{}/'.format(i) for i in range(1,19)]for url in urls:html = get_html(url)get_info(html)

结果
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/27318.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python爬取全国房价并分析

使用方法程序原理 数据来源数据爬取 mac下mysql安装&使用&创建库和表网站爬取分析网站数据抓取代码基础 数据分析 我相信国内房价一直都是苦逼程序员比较关注的事情,我也非常关注全国部分地区的房价,因此我最原始的需求就是想看看全国都哪些地方…

爬虫 58同城房价信息 高德的接口进行房价地图绘制

爬虫部分 // An highlighted block def main():base_url1 https://hz.58.com/xinfang/loupan/all/pbase_url2 /?PGTID0d0091a8-0004-f055-d9b7-c447c3e1c187&ClickID1date_list []for i in range(1,34):html ask_url(base_url1str(i)base_url2)bs BeautifulSoup(htm…

安居客西安房源爬取 + pyecharts 数据展示

第一步是数据爬取: import xlwt from bs4 import BeautifulSoup from selenium import webdriver import time,random from selenium.webdriver import ChromeOptionsdef main():baseurl "https://xa.fang.anjuke.com/loupan/all/p"datalist getData(b…

看我如何抓取最新房价数据

经过前几年一轮房价大涨,到现在因为国家大力调控等原因,市场已经褪去热度,正在慢慢变得稳定,价格也相较最高时下降了些。那现在房价到底怎样?接下来又会是怎样的发展的趋势?这里我们就可以通过 Python 把最…

python爬取上海链家网二手房数据

1、数据爬取说明 1.1 爬取目的 一个朋友在学习自考,作业是爬取数据进行数据分析,正好最近我在学习python,所以他委托我帮他完成这一工作 1.2使用模块 requests进行网络请求、bs4进行数据解析、xlwt进行excel表格存储 2、网页结构分析 2.…

购房选址分析之上海市

一日不见,如隔三秋。快过年了,凌晨GIS给大家拜个早年,提前祝大家新年快乐,牛气冲天! 上期我们用矢量分析中的缓冲区分析和叠加分析的方法对长沙市的购房选址方面的问题进行了探讨,得到了许多小伙伴的回应&a…

链家全国房价数据分析 : 数据分析及可视化

相关文章:链家全国房价数据分析 : 数据获取 上一回我们提到了用爬虫爬取链家的新楼盘和二手房数据信息,这回我们来看看如何对他们进行分析。 新楼盘数据分析 因为我们爬的时候是一个个城市爬的,现在我们要把他们合在一起&#x…

大数据统计租房市场现状(上海篇)

对某方面有统计需求的同学可以留言哟~O(∩_∩)O~!!! 数据下载时间:20170620 房间均价:为了对比1房,2房,3房哪个比较划算引入的概念。一条出租信息中,平均每个房间的价格&#xff0c…

链家全国房价数据分析 : 数据获取

最近一直在看论文,也有很久没有coding了,感觉对爬虫的技术有些生疏,我觉得即使现在手头没有在做这方面的东西,经常爬点对技术保鲜还是很重要的。所以这次我打算爬链家的房价数据,目的主要是对爬虫和Python的东西作一个…

上海二手房网站

文章目录 简介git总体架构开发目录 简介 业务目标:实现上海二手房全量数据动态更新、统计、汇总展示,了解二手房变化趋势。 技术目标:前端到后端技术的demo。前身:租房网站。毕业2年需求变更:租房->买房… git 前…

上海的二手房价有所下跌,现在你们的工资够买间厕所了吗?Python帮你分析上海的二手房价

前言 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。 作者:林小呆 仪表板展示 项目背景 去面试的时候被问上海二手房的一些情况,作为一个土著,我只知道上海这个区…

上海二手房价数据分析

目的:本篇给大家介绍一个数据分析的初级项目,目的是通过项目了解如何使用Python进行简单的数据分析。 数据源:博主通过爬虫采集的安X客上海二手房数据,由于能力问题,只获取了2160条数据。 数据初探 首先导入要使用的科学计算包numpy,pandas,可视化matplotlib,seaborn im…

NBA球员投篮数据可视化

最近看了公众号「Crossin的编程教室」的一篇文章。 是有关于NBA球员出手数据的可视化案例,原文链接如下。 个人感觉比较有趣,所以想着自己也来实现一波。 总体上来说差不多,可能就是美观点吧... / 01 / 篮球场 从网上找的篮球场尺寸图&#x…

利用Python进行NBA比赛数据分析

利用Python进行NBA比赛数据分析 一、实验介绍 1.1 内容简介 不知道你是否朋友圈被刷屏过nba的某场比赛进度或者结果?或者你就是一个nba狂热粉,比赛中的每个进球,抢断或是逆转压哨球都能让你热血沸腾。除去观赏精彩的比赛过程,我们…

2021年常规赛NBA球员数据分析

项目介绍: 1、数据来源: 1)数据来源腾讯体育NBA数据,爬虫解析三个JS网页解析获得数据,共有150个球员和22个指标,整理后数据最终如下图格式 2)球队队徽来自网络 3)球队地理位置的经…

kaggle:NBA球员投篮数据分析与可视化(一)

作为数据科学领域的金字招牌,kaggle已成为世界上最受欢迎的数据科学竞赛平台。在kaggle上,每个竞赛题下都藏匿着大批来自世界各地并且身怀绝技的数据科学家。作为一种众包模式,kaggle通过收取部分佣金将企业的数据挖掘问题发布在平台上并设立…

实例:【基于机器学习的NBA球员信息数据分析与可视化】

文章目录 一、项目任务二、代码实现及分析1. 导入模块2. 导入文件并对文件信息进行整体探测3. 数据预处理3.1 查看数据集信息3.2 数据清洗与转换3.3 数据去重 4. 数据可视化4.1 数据相关性4.2 球员数据分析 5. 基于逻辑回归的球员分类5.1 数据重定义5.2 划分数据集与验证集5.3 …

利用Python预测NBA比赛结果

关注「实验楼」,每天分享一个项目教程 NBA总决赛正在火热上演,而有数据的地方就有预测,本教程就教你使用Python预测NBA比赛的结果。 正文共:3240 字 预计阅读时间:8 分钟‍ 一、实验介绍 1.1 内容简介 不知道你是否…

PayPal,Stripe,Square轮询支付系统

轮询展示 展示我们轮询的页面 轮询套餐 根据不同的用户和需求,可以选择不同的套餐 普通版 1500元 1年 1个用户 支持Paypal/Stripe 不限制A站个数 不限制B站个数 不限制提交模式 订单管理 物流管理 风控管理 必要的网站数据处理 24小时远程协助 开始…