亚马逊爬虫(Amazonbot)IP地址,真实采集数据

 一、数据来源:

1、这批亚马逊爬虫(Amazonbot)IP来源于尚贤达猎头公司网站采集数据;

2、数据采集时间段:2023年10月-2024年7月;

3、判断标准:主要根据用户代理是否包含“Amazonbot”和IP核实。

二、亚马逊爬虫(Amazonbot)主要有4个用户代理

序号用户代理(UserAgebt)
1Mozilla/5.0+(Macintosh;+Intel+Mac+OS+X+10_10_1)+AppleWebKit/600.2.5+(KHTML,+like+Gecko)+Version/8.0.2+Safari/600.2.5+(Amazonbot/0.1;++https://developer.amazon.com/support/amazonbot)
2Mozilla/5.0+(Macintosh;+Intel+Mac+OS+X+10_10_1)+AppleWebKit/600.2.5+(KHTML,+like+Gecko)+Safari/600.2.5+(Amazonbot/0.1;++https://developer.amazon.com/support/amazonbot)
3Mozilla/5.0+(Macintosh;+Intel+Mac+OS+X+10_10_1)+AppleWebKit/600.2.5+(KHTML,+like+Gecko)+Version/8.0.2+Safari/600.2.5+(Amazonbot/0.1;++https://developer.amazon.com/support/amazonbot)+WebOne/0.12.0.0

三、亚马逊爬虫(Amazonbot)IP地址:

107.180.112.120172.70.34.182172.71.190.94
116.202.114.170172.70.34.213172.71.194.75
116.202.238.183172.70.34.63172.71.222.147
116.202.238.184172.70.34.82172.71.222.167
116.202.238.188172.70.35.110172.71.222.236
132.148.120.131172.70.35.114172.71.222.48
136.0.111.243172.70.35.121172.71.222.66
139.162.59.178172.70.35.77172.71.222.84
142.171.178.55172.70.35.82172.71.222.87
144.217.215.90172.70.38.10172.71.223.166
148.135.83.86172.70.38.113172.71.223.17
158.69.170.92172.70.38.118172.71.223.185
161.97.174.214172.70.38.124172.71.223.28
162.0.217.123172.70.38.126172.71.223.35
162.158.78.102172.70.38.127172.71.223.36
162.158.78.32172.70.38.176172.71.223.63
162.158.78.64172.70.38.177172.71.223.77
162.158.79.167172.70.38.182182.50.135.77
162.158.79.183172.70.38.188183.157.160.84
167.99.38.231172.70.38.197185.165.46.140
172.105.212.14172.70.38.211185.50.71.199
172.70.134.120172.70.38.215185.57.242.32
172.70.134.122172.70.38.217185.57.242.41
172.70.134.130172.70.38.32192.3.12.183
172.70.134.146172.70.39.160194.233.72.170
172.70.134.212172.70.39.164195.201.34.52
172.70.134.47172.70.39.169195.90.215.186
172.70.134.90172.70.39.170198.2.253.78
172.70.135.225172.70.39.177210.158.71.88
172.70.174.112172.70.39.19211.62.57.46
172.70.174.15172.70.39.20723.101.10.141
172.70.174.171172.70.39.5223.22.35.162
172.70.174.186172.70.42.11823.224.102.175
172.70.174.254172.70.42.133.224.220.101
172.70.174.26172.70.42.18135.163.208.129
172.70.174.29172.70.42.19545.32.76.94
172.70.174.80172.70.42.19951.79.117.220
172.70.175.122172.70.42.21952.70.240.171
172.70.175.124172.70.42.5361.160.247.8
172.70.175.127172.70.42.6261.164.42.140
172.70.175.18172.70.42.8166.96.183.55
172.70.175.200172.70.42.974.208.124.146
172.70.175.201172.70.42.9274.208.57.233
172.70.175.215172.70.43.1074.208.59.24
172.70.175.54172.70.43.10875.87.100.223
172.70.175.89172.70.43.12377.48.21.22
172.70.175.93172.70.43.1385.10.214.210
172.70.175.94172.70.43.20891.134.247.202
172.70.34.143172.70.43.6391.134.248.245
172.70.34.172172.71.190.178

四、亚马逊爬虫(Amazonbot)的一些特点:

1、对网站没什么危害,但抓取网站频繁,对资源消耗较大,如果不做境外业务,可能通过防火墙阻止。

五、EXECL格式数据下载

点击进入下载页面

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/388749.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Simulink|基于粒子群算法的永磁同步电机多参数辨识

目录 主要内容 模型研究 结果一览 下载链接 主要内容 仿真程序参考文献《改进粒子群算法的永磁同步电机多参数辨识》,采用粒子群算法与simulink模型结合的方式,对永磁同步电机进行多参数辨识。程序以定子绕组电阻、d轴电感、q轴电感和永磁…

吴恩达老师机器学习-ex3

使用逻辑回归 导入库,因为这次的数据是mat文件,需要使用scipy库中的loadmat进行读取数据。 通过对数据类型的分析,发现是字典类型,查看该字典的键,可以发现又X,y等关键字。 import numpy as np import m…

memos content too long

搜到 issue 已经支持 https://github.com/usememos/memos/issues/3262 实际配置在页面上下面路径

排序算法:堆排序,golang实现

目录 前言 堆排序 代码示例 1. 算法包 2. 堆排序代码 3. 模拟程序 4. 运行程序 5. 从大到小排序 堆排序的思想 堆排序的实现逻辑 1. 构建最大堆 2. 排序 循环次数测试 假如 10 条数据进行排序 假如 20 条数据进行排序 假如 30 条数据进行排序 假设 5000 条数据…

C# 串口控制 校验

1. 串口控制 using System; using System.IO.Ports; using System.Windows.Forms;namespace 串口控制 {public partial class Form1 : Form{//device1const byte DeviceOpen1 0x01;const byte DeviceClose1 0x81;//device2const byte DeviceOpen2 0x02;const byte DeviceCl…

git 、shell脚本

git 文件版本控制 安装git yum -y install git 创建仓库 将文件提交到暂存 git add . #将暂存区域的文件提交仓库 git commit -m "说明" #推送到远程仓库 git push #获取远程仓库的更新 git pull #克隆远程仓库 git clone #分支,提高代码的灵活性 #检查分…

【C++进阶学习】第十一弹——C++11(上)——右值引用和移动语义

前言: 前面我们已经将C的重点语法讲的大差不差了,但是在C11版本之后,又出来了很多新的语法,其中有一些作用还是非常大的,今天我们就先来学习其中一个很重要的点——右值引用以及它所扩展的移动定义 目录 一、左值引用和…

step:菜单栏静态加载和动态加载

文章目录 文章介绍静态加载动态加载补充材料 文章介绍 对比静态加载和动态加载。 主界面main.qml之前使用的是动态加载,动态加载导致的问题:菜单栏选择界面切换时,之前的界面内容被清空。 修改方法:将动态加载改为静态加载 左边是…

九大原则,轻松构建个人高效SOP

1、原则一、工作汇报SOP SCQA模型(升职加薪的关键!) 清晰定义问题和提出解决方案 类别 关键词 解读 S - Situation 情景 陈述项目背景,目标,愿景 C - Complication 冲突 讲卡点,讲冲突 Q - Question 疑问-问题 这些冲…

MyBatis基础配置

一、M y B a t i s 配 置 文 件 MyBatis配置文件的功能:构建SqlSessionFactory的依据 MyBatis配置文件的意义:MyBatis最为核心的内容,对MyBatis的使用影响很大。 MyBatis配置文件注意事项:配置文件的层次顺序不能颠倒,…

镜像制作和管理

文章目录 一、Docker镜像说明Docker镜像中没有内核为什么没有内核容器中的程序后台运行会导致此容器启动后立即退出镜像的生命周期和制作方式 二、手动构建镜像基于容器手动制作镜像步骤实际操作基于 busybox 制作httpd镜像制作tomcat镜像基于ubuntu的基础镜像手动安装nginx镜像…

Python基础教程(三)类和对象、异常处理和模块

8.类与对象 8.1 面向对象 面向对象的三大基本特征: 封装、继承、多态。 在面向对象编程中,封装(Encapsulation)是一种将数据和操作(方法)组合在一起的机制。通过封装,我们可以隐藏数据的具体实现细节&am…

RuoYi-Vue-Plus (多数据源注解使用、【手动、拦截器】切换数据源)

接上文多数据源配置: RuoYi-Vue-Plus (多数据源配置)-CSDN博客 一、功能演示 代码生成菜单页面, 展示数据源切换 查询主库 查询从库 二、前端传参切换数据源 页面路径: src/views/tool/gen/index.vue 搜索框如下:下面4发送请求时…

技术分享| 前端性能优化——虚拟滚动(Virtual Scroll)

前端遇到大量数据(尤其是大数据表)的DOM 渲染时,通常会卡顿,需要考虑优化性能问题,这里针对DOM 渲染引出“虚拟滚动”方案, 详细请在以下各文章中详细了解: vue插件 vue-virtual-scroll-list解决…

干货满满,从零到一:编程小白如何在大学成为编程大神?

✨✨ 欢迎大家来访Srlua的博文(づ ̄3 ̄)づ╭❤~✨✨ 🌟🌟 欢迎各位亲爱的读者,感谢你们抽出宝贵的时间来阅读我的文章。 我是Srlua小谢,在这里我会分享我的知识和经验。&am…

ClickHouse 24.6 版本发布说明

本文字数:14127;估计阅读时间:36 分钟 作者:ClickHouse team 本文在公众号【ClickHouseInc】首发 又到了发布新版本的时间! 发布概要 本次ClickHouse 24.6 版本包含了23个新功能🎁、24项性能优化&#x1f6…

嵌入式人工智能(39-基于树莓派4B的震动传感器和霍尔传感器)

这两个传感器实验比较简单,也都属于力传感器,就放一起做了。 1、震动传感器 震动传感器是一种用于检测和测量物体震动、振动和冲击的设备。它通常由一个敏感元件和一个信号处理单元组成。敏感元件可以是压电材料、光电材料、加速度传感器等。当物体发生…

【Git】git 从入门到实战系列(一)—— Git 的诞生,Linus 如何在 14 天内编写出 Git?

<> 博客简介&#xff1a;Linux、rtos系统&#xff0c;arm、stm32等芯片&#xff0c;嵌入式高级工程师、面试官、架构师&#xff0c;日常技术干货、个人总结、职场经验分享   <> 公众号&#xff1a;嵌入式技术部落   <> 系列专栏&#xff1a;C/C、Linux、rt…

golang JSON序列化

JSON JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。 易于人阅读和编写。同时也易于机器解析和生成。 它基于JavaScript Programming Language, Standard ECMA-262 3rd Edition - December 1999的一个子集。 json历史 [外链图片转存失败,源站可能有防盗链机…

看不见的硝烟:中国网络安全三十年沉浮史

2022 年 5 月 16 日&#xff0c;俄罗斯黑客组织 KillNet 向包括美国、英国、德国在内 10 个国家的政府正式 “宣战”。 2022 年 4 月 28 日&#xff0c;一则消息刷屏&#xff0c;北京健康宝在使用高峰期间&#xff0c;遭受到境外网络攻击。北京健康宝保障团队进行了及时有效应…