python 闲鱼消息_GitHub - Hatcat123/XianyuSdd: 爬取闲鱼某关键字实时信息,将最新的发送到钉钉群聊。更多我们共同开发的项目(咸鱼反爬更新,只能作为学习使用)...

XianyuSdd

爬取闲鱼某关键字实时信息,将最新的发送到钉钉群聊

写了一个异步爬取闲鱼商品最新信息推送到钉钉

20190425195555.png

图中的需求有两个部分值得学习。

多线程爬取最新关键字的商品信息

python对钉钉的操作

多线程爬取最新关键字的商品信息

这个多线程是依靠关键字的数量,启动线程。比如可以是线程数=关键字的数量/5。具体接口参考github组织中的例子,24小时采集 然后将线程加入到while True中。关键字与价格区间可以在闲鱼接口链接中自定义。

python对钉钉的操作

针对钉钉是一个很好的信息传输方式,钉钉的开发文档详细讲述了如何调用钉钉的api。

注册钉钉账号

手机创建钉钉组织

用自己创建的组织登录桌面版的钉钉应用(要用自己创建组织的钉钉才能登录带有自己权限的管理后台-web端亦是如此)

创建群聊。在群聊中找到机器人,自定义机器人,找到webhook(这便是钉钉的发送信息的api)

虽然没有python版的介绍。可是api是通用的。api介绍也是很丰富。

推荐看下web版的后台管理,这是一个很好的开发场地。

如何知道获取最新的商品数据

使用数据库,将爬取商品的详情链接存储到数据库中,每次判断数据库中是否有此商品链接数据,若存在,便不是最新。若不存在,推送到钉钉群,然后数据插入数据库。

优化数库的存储方式

暂停与开始

这个方面我没有深入思考,简单的把关键字存到数据库中,没一次线程爬取从数据库中读取现有的数据库关键字。

暂停就是数据库中的某个关键字的字段删除。

(这点为了不值得使用吧!)

使用说明

本项目采用异步爬取,对于闲鱼速度快,效率高。

注意事项

钉钉接口每个机器人每分钟只能发送20条信息。次数太多会被限制。一个群聊可以创建6个机器人的webhook。建议将次6条都加入到程序的机器人队列

钉钉接口存在敏感字检测。当爬取的信息触发了阿里系的检测系统,信息不能发送。这里在日志面板给出已经提示。

经过测试100多关键字的爬取效率在8-10s内完成。

给出的关键字描述尽可能精确,避免大范围的搜索。如错误示例:关键字‘空调’ 范围广与‘空调’+品牌 或 ’空调‘+ 功能部件,缩小搜索范围。

程序的爬取频率设定时间尽量多一些。否者爬取的发送信息很多,将导致钉钉接口失效。这里爬取频率代表一个全部爬虫结束到下一次爬虫开始的时间。建议设置为10s左右。将会10秒后进行下一次执行。

发送方式 :1-单文本发送(若消息过多,钉钉接口限制),2-连接文本发送(手机端不支持跳转闲鱼app),3-markdown文本(推荐、将一次爬取的消息汇聚到个文本中,较少钉钉接口压力)

添加关键字:关键字不为空,价格若不填则搜索时为全价。

删除关键字:选中关键字任务,点击删除,确认删除。

单项开启:选中关键字任务,点击开启,任务单独开启

单项关闭:选中关键字任务,点击关闭,任务单独关闭

一键开启:点击一键开启,默认开启全部任务

一键关闭:点击一键关闭,默认关闭全部任务

更新配置:实时更新爬取频率,发送方式

清除缓存:清除缓存文件。软件长时间使用产生大量缓存文件,硬件运行效率下降

清空配置:清除所有配置选项+缓存文件。一般不建议使用

日志文件:输出日志信息

系统日志:输入操作信息

钉钉机器人-添加机器人:添加钉钉机器人的webhook完整链接

钉钉机器人-删除机器人:选中机器人链接,点击删除,删除成功

钉钉机器人-测试机器人:测试插入的webhook是否有效。将发送'欢迎测试闲鱼信息及时推送器-机器人验证'到钉钉群

推荐数据

20190426111615.png

使用方式

后续更新

0x01 搭配mongodb使用,配置服务

mongod.exe --dbpath c:/1

0x02 启动服务

单机exe运行服务

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/35616.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

抓取某鱼数据,看看小姐姐们都在卖什么

因为一直在研究app,所以闲着的时候写了这款软件,晚上不想写代码了,就用程序来看看闲鱼的小姐姐们都在卖什么吧。 关键词: “本人实拍 女” 主要出售物品:电子产品, 衣物, 饰品, 化…

闲鱼app关键词抓包案例,配合frida成功抓包

原文链接:https://blog.csdn.net/weixin_44223957/article/details/128608540 准备工具: 安卓模拟器(任意,需要root)下载教程闲鱼apk(推荐使用7.0以上)下载地址fiddler(抓包工具&a…

获取闲鱼已售商品的价格等信息

很多商家或者卖家,抑或是市场调研人员,对于商品定价问题一直比较纠结。 有朋友也从我这里定制过闲鱼商品在售价格调查系统,但在售商品并不能完整或者直观的反映出市场成交的价格,可以说非常地不客观。 所以,闲下来的时…

品牌策划流程揭秘,如何让你的品牌脱颖而出

品牌策划案是企业塑造品牌形象的依据,一个有依据的品牌策划案给消费者的信息是安全、放心的。一个完整的品牌策划案基本要包括以下几个方面: 1、基础调研与梳理说明 产品:企业产品目录 、产品销售状况、产品研发状况、产品生产状况、产品价…

产品市场营销策划方案与案例PPT模板

一份优秀的市场营销策划PPT对于一个营销人、广告人来说至关重要,自从开始接触营销这一领域,不管是学校的老师还是职场的老板总是在提及一个名词—营销策划,那么一份优秀的营销策划PPT到底应该怎么做呢,可以参考下面的模板 用途&a…

【记录】IOS手机如何配置whistle代理进行抓包?(苹果系列)(安卓应该也是类似处理)

前提:电脑先配置好 whistle。 进行抓包的前提是必须手机电脑在同一局域网啊!!! 第一步: 打开Mac 电脑网络偏好设置,查看当前的 ip 地址。 第二步: 手机设置WiFi 的代理为:192.1…

Java实现双色球玩法

Java实现双色球玩法 玩法说明: 双色球投注区分为红球号码区和蓝球号码区,红球号码范围为01~33,蓝球号码范围为01~16。双色球每期从33个红球中开出6个号码,从16个蓝球中开出1个号码作为中奖号码&#xff0c…

随机生成一注双色球号码 - - (要求同色号码不重复 )

知识点: new Random() . next( 33): 产生一个 0-33 (含0不含33) 的随机数 所以1之后 , 就变成了 1-34( 1 - 33); HashSet集合:存储不重复的元素. add( E element) 往集合中添加指定元素. 增强for循环:因为不能使用索引,所以用增强for循环. /*双色球规则:双色球每…

Java基础~双色球游戏(规则:红色球号码从1--33中选择;蓝色球号码从1--16中选择,每次注投注号码由6个红色球号码和1个蓝色球号码组成)附:运行结果截图

目录 ArrayList.java Ball.java BallColor.java 这是枚举类型 Test1.java 我的主方法文件 运行截图:​编辑 双色球游戏:游戏规则红色球号码从1--33中选择;蓝色球号码从1--16中选择,每注投注号码由6个红色球号码和1个蓝色球号…

C#实现双色球选号

点击查看:C#实现双色球选号 文件大小:1M 操作系统:Windows10旗舰版 开发工具:VS2019 开发语言:.cs

chatgpt赋能python:Python一行滚动显示文字,达到显示效果更佳的方法

Python一行滚动显示文字,达到显示效果更佳的方法 如果你正在寻找一种使你的文字在屏幕上无缝滚动的方法, Python提供了一种简单而有效的解决方案。 本文将介绍如何在Python中一行代码中实现滚动显示文字的功能,以及如何优化滚动效果以获得最…

PCIE扫盲转发-理解

PCIe扫盲系列博文连载目录篇 通过学习PCIE扫描系列文章,结合PCIE3规范深入理解PCIE 硬件时序​​时序解读 PCIE 错误检测重要概念:错误等级检测机制错误优先级 错误源ECRC错误事务错误链路流量控制错误(Link Flow Control Errors&#xff09…

Yolov5部署训练及代码解读

5.Yolov5实操训练(重点) 一、前言 1.集成的资源,包括我自己做成的成品,可以直接train与detect。需要加qq群:938162384 2.本文目的主要是能够让读者复现,直接使用,而且少讲原理。如果想深入了…

深入解读命令执行:基本概念、攻击技术和防范应对

数据来源 部分数据来源:ChatGPT 命令执行简介 01 命令执行漏洞产生原因 命令执行漏洞的产生原因主要是输入验证不严格、代码逻辑错误、应用程序或系统中缺少安全机制等。攻击者可以通过构造特定的输入向应用程序或系统注入恶意代码,从而在受攻击的主…

技术,并不值钱——阿里员工失业记

上一篇:Java危矣! 看到网友分享自己被阿里裁员的经历,挺有感触的,转发给大家—— 01谈话 我的顶头上司已经走了,我坐着,看着对面空空的椅子,有点没缓过神来 离职 只剩下这两个字在我脑袋里不断徘…

20230411笔记-MTK天玑开发者日(北京站)

1. 天玑开发者日“追光 行动”主题 来源:近期搜索Unity比较多,csdn给我发了短信邀请,参加 天玑开发者日-北京站 活动。 消息:百家号 MediaTeK 联发科官宣天玑开发者日,4 月 11 日起召开 2.活动议程 天玑开发者日-追光…

“智能”创造未来:PDU智能化全面提升IDC数据中心用电能效!

一个月前,万众期盼的《流浪地球2》如期上映,无论是剧情还是特效,让广大观众享受到一次久违的来自中国科幻的震撼,时至今日仍是大家茶余饭后津津乐道的热点谈资。说起这部片子里,最让人紧张的部分,还得数为了…

【Zigbee】解密Zigbee地址分配——你需要知道的一切

💖 作者简介:大家好,我是Zeeland,全栈领域优质创作者。📝 CSDN主页:Zeeland🔥📣 我的博客:Zeeland📚 Github主页: Undertone0809 (Zeeland) (github.com)&…

涵子来信——AI的无限未来——谈谈想法

大家好: 这一次,我想要跟大家讲一讲我对AI的看法和未来的展望,谈谈我的想法。 AI(Artificial Intelligence,中文人工智能),是我们生活中处处都可以见到的,小到一个语音助手&#x…

ChatGPT带火的提示工程师,构造自己的提示语

ChatGPT是一个大语言模型,学过全球几乎公开的大部分有效知识库,它什么都懂。 ChatGPT的风靡,爆火了一个年薪百万的提示工程师这个新就业岗位。 提示工程师,也就是AI训练师,即通过与AI交互写出相关提示,以帮…