爬虫与DataFrame对象小小结合

爬虫与DataFrame对象小小结合

news/2024/12/23 19:58:38/文章来源:https://blog.csdn.net/2303_80857229/article/details/136598288

import pandas as pd
import requests
from lxml import etree
#数据请求
url="https://www.maigoo.com/brand/list_1715.html"
headers={'User-Agent':''}
#数据响应
res=requests.get(url,headers=headers)
tree = etree.HTML(res.text)
#数据解析
title=tree.xpath('.//div[@class="info"]/a/text()')
company=tree.xpath('.//div[@class="info"]//span//text()')
company=" ".join(company).replace('(', '').replace(')', '')#获取数据，进行简单的处理，转成列表类型暂存数据。
company=company.split('  ')
content=tree.xpath('.//div[@class="rongyu dhidden2 c888"]/text()')
adress=tree.xpath('.//div[@class="brandlogo"]/a/@href')
picture=tree.xpath('.//div[@class="brandlogo"]//img/@src')
#数据保存
for i in title,content,adress,picture:data = pd.DataFrame([title,company,content,adress,picture],index=['title','company','content','adress','picture'])
print(data.T)

---如有侵权，请即使联系。谢谢~

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/275710.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

金现代产品方案部部长王宁，将出席“ISIG-低代码/零代码技术与应用发展峰会”

金现代产品方案部部长王宁，将出席“ISIG-低代码/零代码技术与应用发展峰会”

3月16日，第四届「ISIG中国产业智能大会」将在上海中庚聚龙酒店拉开序幕。本届大会由苏州市金融科技协会指导，企智未来科技（LowCode低码时代、RPA中国、AIGC开放社区）主办。大会旨在聚合每一位产业成员的力量，深入探索低…

阅读更多...

冥想与AI：打造定制的放松体验

冥想与AI：打造定制的放松体验

如今，在浏览网页或社交网络时，您似乎很难对一条条心理健康信息无动于衷。遇到这种情况的可不只是您。当今不断变化的时代给人们平添压力，企业纷纷利用智能技术满足人们的减压需求，让人们的生活多一些平和从容。冥想就是一种练习呼…

阅读更多...

计算机缺失vcruntime140_1.dll文件如何修复？解析5种修复方法

计算机缺失vcruntime140_1.dll文件如何修复？解析5种修复方法

其实大部分人在使用计算机的过程中，我们常常遇到各种问题，比如程序无法执行、文件无法打开等等。其中，找不到vcruntime140_1.dll无法执行这个问题是比较常见的。那么，我们该如何解决这个问题呢？本文将详细介绍几种简…

阅读更多...

day3 菜品

day3 菜品

文章目录公众字段填充1. 自定义注解标识需要用的方法定义注解定义枚举 2. 自定义类拦截用了上面注释的方法3. 在方法上使用注解获取yml自定义数据生成 UUID.randomUUID().toString()文件上传到本地七牛云 oss https://developer.qiniu.com/kodo/1239/java#server-upload本地文…

阅读更多...

excel批量数据导入时用poi将数据转化成指定实体工具类

excel批量数据导入时用poi将数据转化成指定实体工具类

1.实现目标 excel进行批量数据导入时，将批量数据转化成指定的实体集合用于数据操作，实现思路：使用注解将属性与表格中的标题进行同名绑定来赋值。 2.代码实现 2.1 目录截图如下 2.2 代码实现 package poi.constants;/*** description: 用…

阅读更多...

SEO优化的特点及其重要性（提升网站排名和流量）

SEO优化的特点及其重要性（提升网站排名和流量）

随着互联网的发展，网站竞争日益激烈，如何让自己的网站在众多同类网站中脱颖而出？SEO优化成为了现代网站经营不可或缺的一部分。本文将为您介绍SEO优化的特点和重要性，以及如何利用SEO技巧提升网站的排名和流量。一：S…

阅读更多...

3d场景重建图像渲染 | 神经辐射场NeRF（Neural Radiance Fields）

3d场景重建图像渲染 | 神经辐射场NeRF（Neural Radiance Fields）

神经辐射场NeRF（Neural Radiance Fields） 概念 NeRF（Neural Radiance Fields，神经辐射场）是一种用于3D场景重建和图像渲染的深度学习方法。它由Ben Mildenhall等人在2020年的论文《NeRF: Representing Scenes as Neur…

阅读更多...

matplotlib-柱状图

matplotlib-柱状图

日期：2024.03.14 内容：将matplotlib的常用方法做一个记录，方便后续查找。 # from matplotlib import pyplot as plt# 设置画布大小 plt.figure(figsize(20,8),dpi 300)# 全局设置中文字体 plt.rcParams[font.sans-serif] [Simhei]# 绘制三…

阅读更多...

【深度学习实践】HaGRID，YOLOv5，手势识别项目，目标检测实践项目

【深度学习实践】HaGRID，YOLOv5，手势识别项目，目标检测实践项目

文章目录数据集介绍下载数据集将数据集转换为yolo绘制几张图片看看数据样子思考类别是否转换下载yolov5修改数据集样式以符合yolov5创建 dataset.yaml训练参数开始训练训练分析推理模型转换onnx重训一个yolov5s后记数据集介绍 https://github.com/hukenovs/hagrid HaGRID&a…

阅读更多...

可视化Relay IR

可视化Relay IR

目标为Relay IR生成图片形式的计算图。实现方式使用RelayVisualizer可视化Relay，RelayVisualizer定义了一组接口（包括渲染器、解析器）将IRModule可视化为节点和边，并且提供了默认解析器和渲染器。首先需要安装依赖&#x…

阅读更多...

可视化表单流程编辑器为啥好用？

可视化表单流程编辑器为啥好用？

想要提升办公率、提高数据资源的利用率，可以采用可视化表单流程编辑器的优势特点，实现心中愿望。伴随着社会的进步和发展，提质增效的办公效果一直都是很多职场办公团队的发展需求，作为低代码技术平台服务商，流辰信息团…

阅读更多...

（黑马出品_05）SpringCloud+RabbitMQ+Docker+Redis+搜索+分布式

（黑马出品_05）SpringCloud+RabbitMQ+Docker+Redis+搜索+分布式

（黑马出品_05）SpringCloudRabbitMQDockerRedis搜索分布式微服务技术分布式搜索今日目标1.初识elasticsearch1.1.了解ES1.1.1.elasticsearch的作用1.1.2.ELK技术栈1.1.3.elasticsearch和lucene1.1.4.为什么不是其他搜索技…

阅读更多...

【李沐论文精读】CLIP改进工作串讲精读

【李沐论文精读】CLIP改进工作串讲精读

参考：CLIP改进工作串讲（上）、CLIP改进工作串讲（下）、李沐精读系列、CLIP 改进工作串讲（上）笔记由于是论文串讲，所以每个链接放在每一个小节里。 CLIP的应用如下： 回顾&a…

阅读更多...

计算机设计大赛目标检测-行人车辆检测流量计数

计算机设计大赛目标检测-行人车辆检测流量计数

文章目录前言1\. 目标检测概况1.1 什么是目标检测？1.2 发展阶段 2\. 行人检测2.1 行人检测简介2.2 行人检测技术难点2.3 行人检测实现效果2.4 关键代码-训练过程最后前言 🔥 优质竞赛项目系列，今天要分享的是行人车辆目标检测计数系统 …

阅读更多...

【C++练级之路】【Lv.13】多态（你真的了解虚函数和虚函数表吗？）

【C++练级之路】【Lv.13】多态（你真的了解虚函数和虚函数表吗？）

快乐的流畅：个人主页个人专栏：《C语言》《数据结构世界》《进击的C》远方有一堆篝火，在为久候之人燃烧！ 文章目录一、虚函数与重写1.1 虚函数1.2 虚函数的重写1.3 重写的特例1.4 final和override（C11）1.…

阅读更多...

JsonCreator注解InvalidDefinitionException报错解决

JsonCreator注解InvalidDefinitionException报错解决

"stack_trace": "c.f.j.d.e.InvalidDefinitionException: More than one argument (#0 and left as delegating for Creator [constructor for (

阅读更多...

【刷题节】美团2024年春招第一场笔试【技术】

【刷题节】美团2024年春招第一场笔试【技术】

1.小美的平衡矩阵 import java.util.Scanner;public class Main {public static void main(String[] args) {Scanner scanner new Scanner(System.in);int n scanner.nextInt();int[][] nums new int[n][n], sum new int[n][n];char[] chars;for (int i 0; i < n; i) {…

阅读更多...

宏任务及微任务

宏任务及微任务

js有一个基于事件循环的并发模型，事件循环负责执行代码、收集和处理事件，以及执行队列中的子任务。js是单线程的（某一刻只能执行一行代码），为了让耗时带啊不阻塞其他代码运行，设计了事件循环模型。事件循环…

阅读更多...

java中使用rabbitmq

java中使用rabbitmq

文章目录前言一、引入和配置1.引入2.配置二、使用1.队列2.发布/订阅2.1 fanout(广播)2.2 direct(Routing/路由)2.3 Topics(主题)2.4 Headers 总结前言 mq常用于业务解耦、流量削峰和异步通信,rabbitmq是使用范围较广,比较稳定的一款开源产品,接下来我们使用springboot的sta…

阅读更多...

ElasticSearch学习篇10_Lucene数据存储之BKD动态磁盘树

ElasticSearch学习篇10_Lucene数据存储之BKD动态磁盘树

前言基础的数据结构如二叉树衍生的的平衡二叉搜索树通过左旋右旋调整树的平衡维护数据，靠着二分算法能满足一维度数据的logN时间复杂度的近似搜索。对于大规模多维度数据近似搜索，Lucene采用一种BKD结构，该结构能很好的空间利用率和性能。 …

阅读更多...

最新文章

推荐文章