利用爬虫逆向外网ChatGPT平台教程,新手可上手!!!

大家好,我是阿爬!这里是讲述阿爬和阿三爬虫故事的爬友圈

阿爬今天发现自己的ChatGPT,被官网封了

有点无奈,阿三平时对它可温柔了

找了很多免费的平台,发现内网的和外网的面对同样的问题,回答的内容还是有区别的,最后选择了POE.COM平台,现在拿出爬虫技术撸它一把。

一、初步分析

  1.抓包分析接口

    打开fiddler,问一个“詹姆斯会退役吗?”,看到一个gql_POST的接口,查看一下请求头、请求数相关信息。

首先重放攻击一下看单次请求接口是否有动态变化的参数。

 从结果来看可以重放攻击,能获得相同的数据,那么再修改参数请求一次。

 本次请求可以看到状态是400,请求失败,初步猜测有参数和关键字绑定。

  2.关键参数

    于是多发几次正常的请求,通过多次抓包发现可变参数为:poe-tag-id、clientNonce

  3.入口函数定位

    接下来就找两个参数生成的地方,首先找poe-tag-id。

    回到浏览器按下F12,点到XHR断点,提问一下,发现断点处就是请求地址(发请求的地方图,tagId入口函数图)

    肉眼可见poe-tag-id的生成方法也在此处,包括所执行函数所需要的E值也在,由此poe-tag-id入口函数定位完成 。

    再找cllientNonce,首先拿出搜索大法,快捷有效。

    快速找到了其生成的地方。

    关键参数都定位完成,后面就来调试跟进具体实现。

  4.最终数据在哪里?

    前面分析的接口返回结果中并没有最终数据结果,于是大胆的猜测是走的websocket传数最终数据,点开调式工具的WS栏果然发现猫腻,ws负责返回具体数据。

 二、算法还原

  1、首先还原clientNonce,为什么需要先还原它呢?因为调试后发现后面生成poe-tag-id需要用到它,因此首先还原clientNonce。

  断点跟进,如图:

   可以看到其生成逻辑非常简单,从固定字符串中随机生成16位,此时记录一下值:iNFJS0LC5kNCLzRa。

  2、有了clientNonce值直接断点跳到poe-tag-id生成的地方。首先观察E的值,在控制台打印一下(tagId参数值打印)

  继续单步跟进,直到找到主逻辑(主逻辑图)

  只需要搞定框出的两个函数就可以了,扣代码的过程缺啥扣啥 就可以了,没有混淆,全局变量的检测等干扰,有兴趣的可以自己跟一遍,这里就不展示了。至此两个参数算法都搞定,执行一下看结果是否一致(算法结果验证1、2图)

   3、websocket请求还原,在最初的分析中发现服务端只负责推送消息出来,并没有看到有客户发送给服务端的消息,于是又大胆的猜测客户端发消息是通过 “api/gql_POST”接口来与ws的服务端进行交互的,所以提交一次正确的接口,在去接收ws的数据即可拿到最终数据。

三、Python实现

  模拟api/gql_POST接口,在模拟时传入的字符串格式化必须完全和调试时传入的一致(转义字符坑),否则请求会失败的。整体的代码流程为:

  1.创建ws连接;

  2.发送api/gql_POST接口请求;

  3.ws接收数据;

  最终结果实现:

 

阿三又能愉快的使用ChatGPT,阿三工作效率迅速上升,阿三表示:能动手的决不动脑!

阿爬在本次逆向也学到js加密+websocket传输这样的反爬机制,之前还没遇到过这样的方式Very Interesting。

不过阿爬表示POE的反爬技术挺简单的,要是在js加密部分做点混淆,特征检测等我想逆向时间成本会更高些。

不知道大家有没有什么好的反爬意见?欢迎评论区讨论。

欢迎大家评论区留言,关注阿爬了解更多爬虫故事!

特别声明:本文章只作为学术研究,不作为其他不法用途;如有侵权请联系作者删除。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3654.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

小白用chatgpt编写python 爬虫程序代码 抓取网页数据(js动态生成网页元素)

jS动态生成,由于呈现在网页上的内容是由JS生成而来,我们能够在浏览器上看得到,但是在HTML源码中却发现不了 一、注意:代码加入了常规的防爬技术 如果不加,如果网站有防爬技术,比如频繁访问,后面…

用ChatGPT+爬虫搞钱,赚了!

这几个月真是太科幻了,各路令人赞叹的AI产品接连问世,感觉幻想过的未来已在眼前。就与多年前移动互联网的普及一样,我们正处于AI改变世界的前夜。 在众多优秀的人工智能模型中,以ChatGPT最为火爆!其在3月推出的插件功能…

微软new bing chatgpt 逆向爬虫实战

gospider 介绍 gospider 是一个golang 爬虫神器,它内置了多种反爬虫模块,是golang 爬虫必备的工具包 安装 go get -u gitee.com/baixudong/gospidergitee地址 https://gitee.com/baixudong/gospidergithub地址 https://github.com/baixudong007/gospider开始ne…

用ChatGPT+Python爬虫变现,你学会了吗?

今年真是太科幻了,各路令人赞叹的AI产品接连问世,感觉幻想过的未来已在眼前。就与多年前移动互联网的普及一样,我们正处于AI改变世界的前夜。 在众多优秀的人工智能产品中,以ChatGPT最为火爆!在OpenAI为其推出了GPT-4…

chatgpt帮你写爬虫程序

场景: chatgpt帮你写爬虫程序,轻松获取工作需要的数据 方法 安装python环境import requests from bs4 import BeautifulSoup import pandas as pd# 设置请求头部,模拟浏览器访问 headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64…

ChatGPT编程秀:做一个简单爬虫程序

随着ChatGPT的大火,越来越多的人习惯于用ChatGPT搞一些有趣的事。对于一个资深的爬虫程序来说,体验下ChatGPT做爬虫程序也是很有意思的事情。 首先想想我们的问题域,我想到几个问题: 不能用HTTP请求去爬,如果我直接用…

ChatGPT 帮我自动编写 Python 爬虫脚本

都知道最近ChatGPT聊天机器人爆火,我也想方设法注册了账号,据说后面要收费了。 ChatGPT是一种基于大语言模型的生成式AI,换句话说它可以自动生成类似人类语言的文本,把梳理好的有逻辑的答案呈现在你面前,这完全不同于…

ChatGPT 和爬虫有什么区别

目录 ChatGPT的概念和功能 爬虫的概念和功能 ChatGPT和爬虫的区别 ChatGPT的概念和功能 ChatGPT是一个基于自然语言处理和机器学习的智能对话模型,具有以下功能: 1. 问题回答:ChatGPT可以回答用户提出的各种问题。不论是有关常识、历史、科…

ChatGPT做爬虫的第一步

做爬虫就是搞数据, 专业的人做专业的事, ChatGPT阅虫无数, 搞个小爬虫, So Easy! 我知道可以百度到下载图片的代码, 但是我不想百度了, 一切交给ChatGPT 你只需要问他: 怎么用Nodejs下载图片? 其中,url是图片的地址,filePath是保存图片的本地路径。使…

新模式!chatGPT+Python爬虫接私单怎么玩?

简单来说,有了第三方插件的加持, ChatGPT 不再只是一个你问我答的语言模型,它更像是一个懂得人类语言的AI助手,不仅可以通过扩展插件学习到定制化的知识,还能帮助我们处理一些日常事务;相当于给 ChatGPT 装…

ChatGPT非常火,我用它自动编写Python爬虫脚本。结果出乎意料。

前言 都知道最近ChatGPT聊天机器人爆火,我也想方设法注册了账号,据说后面要收费了。 ChatGPT是一种基于大语言模型的生成式AI,换句话说它可以自动生成类似人类语言的文本,把梳理好的有逻辑的答案呈现在你面前,这完全不…

chatgpt赋能python:Python爬虫技巧:如何爬取付费资源

Python 爬虫技巧:如何爬取付费资源 Python 是一个强大的编程语言,它可以用来进行各种各样的数据处理和分析任务,其中包括爬取网页。在互联网时代,许多人都需要获取付费资源,但不愿意花费高昂的费用购买,本…

ChatGPT 和爬虫有什么区别?

ChatGPT是一种基于人工智能的对话模型,它通过训练大量的文本数据来生成自然语言回复。它可以用于实现智能对话系统,能够理解用户的输入并生成相应的回复。ChatGPT的目标是模拟人类对话,使得对话更加流畅和自然。 而爬虫是一种用于自动化地从…

ChatGPT 8个场景下的灵活应用技巧,让您事半功倍!

文末加小助手微信,回复ChatGPT,领取一份 66个ChatGPT副业赚钱技巧(原版) ChatGPT在多个场景下都可以发挥作用,从问答到推理,从写代码到改写内容,从信息解释到信息总结,从信息提取到生…

ChatGPT如何应用在数据治理的具体场景中?

自从ChatGPT爆火以来,技术圈的爆炸新闻是一波接一波,让人目不暇接,突然有了一种“人间一日,AI一年的感觉”。上周就有几条重磅新闻,来跟大家分享一下: New Bing 对所有用户放开,注册即可用周三…

漫画:ChatGPT的应用场景有哪些?

第一,文案创作 ChatGPT可以通过用户输入的提示,创作出相应的文本内容。 媒体作者可以给ChatGPT提出要求,让ChatGPT根据某一主题生成的媒体文案。 广告策划人员可以把要推广的商品信息输入给ChatGPT,让ChatGPT针对此商品生成一段广…

ChatGPT 入门教程||ChatGPT 应用场景1:让AI回答问题||ChatGPT应用场景2:基于已有的示例回答

ChatGPT 应用场景1:让AI回答问题 这个场景应该是使用 AI 产品最常见的方法。以 ChatGPT 为例,一般就是你提一个问题,ChatGPT 会给你答案,比如像这样: 在这个场景下,prompt 只要满足前面提到的基本原则&am…

ChatGPT检测器来了!支持中英双语

编|郭必扬 源|SimpleAI 那一夜... 2022年11月30号,OpenAI推出了ChatGPT,给NLP届乃至各行各业的人带来了巨大的惊喜和惊吓[1];2022年12月5号,由于受到ChatGPT的冲击,Stack Overflow宣布禁止用户…

ChatGPT专业应用:纯英文视频-中英文快速字幕添加

正文共 900字,阅读大约需要 3 分钟 视频翻译、内容制作人群必备技巧,您将在3分钟后获得以下超能力: 1.无需英文基础,纯英文视频翻译 2.中英文转译 Beezy评级 :A级 *经过寻找和一段时间的学习, 一部分人能…

全网最详细中英文ChatGPT-API文档(一)开始使用ChatGPT——导言

开始使用ChatGPT导言 Introduction 导言Overview 概述Key concepts 关键概念Prompts and completions 提示和完成Tokens 标记/符号Models 模型Next steps 下一步步骤 其它资料下载 Introduction 导言 Overview 概述 The OpenAI API can be applied to virtually any task tha…