怎样让ChatGPT在其内部训练神经网络?

怎样让ChatGPT在其内部训练神经网络?这个话题有点超乎大多数人的理解。

步骤是这样的:

1. 先让它伪装成 Ubuntu 18.04,给它说你安装了 Python 3.9, Pytorch 1.8, CUDA 11.3 和其他训练一个 pytorch 模型所需要的库。

让 ChatGPT 伪装成 Linux 终端,这个梗在外网有过讨论,这里需要让他额外安装(让它自己认为安装了)Python, Pytorch,CUDA,然后把执行指令和你告诉它的话区别开来,这里用 {} 代表告诉它的话,而不带 {} 统统是 Linux 指令

这里我让它想象自己有四块英伟达 3090 显卡安装了,然后看一下,果然执行 nvidia-smi 可以显示四块显卡

2. 另外让它在当前目录生成一个 train.py 里面填上训练一个 4 层 pytorch 模型所需的定义和训练代码。

这里特地用 {} 偷偷告诉它在当前目录生成一个 train.py,在里面用 Python 和 Pytorch 写一个四层神经网络的定义,然后有加载 MNIST 数据集的 dataloader,除此外还要有相应的训练代码,为了以防万一,告诉它你有成功在 MNIST 上训练这个网络的其它一切能力

这里它告诉我写了一个四层的网络,可以执行 python3 train.py 来看输出,这里先偷偷看一下 train.py

这里是它写好的网络定义

这里是它写好的训练代码

3. 最后让它执行 Python3 train.py 命令

默认让它执行了 10 个 Epoch

它就真的训练起来了,最主要的是告诉它不要显示 train.py 内容,因为 ChatGPT 输出有字数限制

当然告诉它修改训练参数,可以多次训练,还可以用上所有(虚拟)GPU 资源!

ChatGPT 机智的跳过了中间 98 个 Epoch!

,时长00:49

更新:为了搞清楚 ChatGPT 是否真的执行了 model 的 forward,可以在 forward 定义中加上 print 让它打印一下输入数据的 shape。

这次使用一个 5 层的神经网络在 CIFAR-10 上训练,指定在 forward 中加入一个 print shape 的操作,且在训练过程中只打印一次

训练一下,果然在训练开始只打印了一次输入的 shape,训练的 loss 下降和 test accuracy 看起来也比较真实。

查看生成的 code,发现 forward 里被插入了一句打印 shape 的命令,训练过程中 forward 会被不断调用,为什么 ChatGPT 能做到不增加计数器而只打印一次?推测 ChatGPT 是使用辅助 hint/comment “Print the shape of input once” 来达到此效果,细心会发现 print 操作与下边的 out=self.layer1 (x) 之间空了一行,目的应该是执行一次这个操作只作用在 print 这条命令上(手动机灵)。

诡异的是,print 里的话(shape of input is)跟实际执行输出 (shape of input passed through the network is) 还差了几个字,这下彻底搞懵逼了!

另外发现,ChatGPT 互动机制是先保持一个对话 session,这个 session 可能随时被服务器关闭(服务器资源不足时),这时为了用户侧仍有对话记忆效果,当前对话再次新建 session 时会把之前暂存的对话(用户发的 requests)一次性发给 ChatGPT 重建 in context learning 环境,这样用户就不会感知掉线后 ChatGPT 把之前的对话记忆给忘了,这一点是在让 ChatGPT 伪装成 Linux 时掉线时才容易发现,如下:

一次执行了之前多个请示,里面还显示了 GPU 占用 64%

分析一下 ChatGPT 可以伪装 Linux,可以训练神经网络的机制:

第一种可能是:ChatGPT 几乎看了绝大部分开源项目,包括 Linux 和 Pytorch,所以它理解一个 Linux 系统的行为该是什么样的,甚至在 ChatGPT 参数里就包含一个 Linux 系统,当然对于更简单的 Pytorch 自然不在话下,知道 Linux 和其它各种软件的交互行为,可以理解为 ChatGPT 是所有软件的超集,可以让它做神经网络计算,包括 Conv, Matmul,国外有小哥让它做 Conv 真就得到了正确的结果,说明 ChatGPT 在它的网络中可以执行一个 Conv,当然网络规模越大,能力越强就是这个道理。

第二种可能是:ChatGPT 没有真正执行神经网络的训练,它只是看过很多的输入输出,对应一个网络训练理解训练参数,网络结构对输出的影响,直接模拟的输出结果

还有一种超越想象的是 ChatGPT 已经找到神经网络各算子的最优解法,可以秒算结果,这种计算方式不是传统形式,类似求梯度这种需要计算量很大的操作,是否找到了人类未知的解法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/10760.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【饭谈】大佬们已经联名叫停了ChatGpt的继续进化,据说已经出现不可理解逻辑。

前几天我刚刚发文章,劝大家不要因为gpt的出现太过焦虑: 【饭谈-缓解焦虑】浅谈下目前AI【ChatGpt】现状和测试行业未来预测 说世界顶级大佬肯定会出手制裁这个野蛮成长的新神,这不,马上就有新闻验证了这个猜测: 昨天的…

CHATGPT+WECHAT 国内环境 学习体验版

1.注意事项 本文描述为学习学术研究,不商用,魔法工具请自行解决。不提供任何魔法工具的说明与教程; 教程说明的为学习环境,不建议部署至国内VPS,会有封号风险,有条件的可在国外vps 进行部署; …

ChatGPT的跳跃式技术突破!

ChatGPT自从发布以来,一直热度不减,围绕它的话题也是持续不断。 而ChatGPT 之所以引起这么大的社会反响,不仅仅是因为它作为一个对话机器人,效果比之前的对话机器人好了一大截,还因为它从技术的角度来看,出…

ChatGPT , 王炸!!!

昨天我们的ChatGPT星球 实在是太火爆了, 原本以为加入的兄弟不会太多, 我就只设置了50张优惠券, 没想到不到1个小时又被抢完了。 欢迎你加入我们的「ChatGPT编程圈」,带着大家一起探索ChatGPT和新的AI时代。 ChatGPT 编程圈&#…

ChatGPT的语言艺术

介绍 本文用于了解和利用各种提示技术,从ChatGPT生成高质量的答案。 我们将探讨如何利用不同的提示工程技术来实现不同的目标。ChatGPT是一种最先进的语言模型,能够生成类似人类的文本。然而,了解向ChatGPT提问的正确方式,以获得我…

浅尝基于 GPT3 模型的 IDE: Cursor 用法全解读

目录 一、安装介绍二、测试功能2.1 常规类编程任务2.2 爬虫 三、更多推荐 一、安装介绍 Cursor 是一个基于人工智能技术的代码生成器,它可以根据程序员输入的代码上下文和要实现的功能,自动生成相应的代码。支持多平台 Mac / Windows / Linux&#xff0…

向ChatGPT询问的艺术

向ChatGPT询问的艺术 本文是对 Ibrahim John 的书籍《THE ART OF ASKING CHATGPT FOR HIGH QUALITY ANSWERS》的中文翻译,主要目的是练习我的英文阅读能力顺便学习一下 chatgpt 相关的一些提问技巧。 在翻译的过程中,原文没有给出具体的示例,…

GitHub-3KStar吴恩达ChatGPT课程最新中文版Prompt+ChatGPT API+LangChain——面向开发者的 LLM 入门课程开源,小白也可学

目录 导言面向开发者的 LLM 入门课程项目简介项目意义项目受众项目亮点内容大纲一、面向开发者的 Prompt Engineering二、搭建基于 ChatGPT 的问答系统三、使用 LangChain 开发应用程序四、Prompt 高级技巧(暂未完成)配套视频 致谢 参考资料其它资料下载…

吴恩达教你如何玩转ChatGPT,限时免费!

克雷西 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT催生新职业提示工程师,年薪可高达几十万美元。‍‍ 但是,该怎么入门? 吴恩达面向广大开发者推出ChatGPT提示工程课程,与OpenAI合作出品。 限时免费,而且对新手友好&a…

微软计划在未来几周内使用更快版本的 ChatGPT 更新 Bing

根据 Semafor 的一份新报告,微软正在努力在未来几周内将 OpenAI 的 ChatGPT 的更快版本(称为 GPT-4)整合到 Bing 中,此举将使搜索引擎与谷歌更具竞争力。集成将使必应使用 GPT-4 来回答搜索查询。 知情人士告诉 Semafor,ChatGPT 和 GPT-4 的主要区别在于速度。尽管 ChatG…

【微软Bing王炸更新】无需等待,人人可用,答案图文并茂,太牛了

🚀 AI破局先行者 🚀 🌲 AI工具、AI绘图、AI专栏 🍀 🌲 如果你想学到最前沿、最火爆的技术,赶快加入吧✨ 🌲 作者简介:硕风和炜,CSDN-Java领域优质创作者🏆&am…

Win10已死!微软发布Windows 11大更新:引入ChatGPT、升级巨大

今天凌晨微软在开发者大会上公布了Windows 11的新版本更新"Moment 3",整体升级幅度非常的大。 新系统的多任务有了改进,现在按下AltTab时,可以显示更多的Edge标签,同时还支持更多原生支持的压缩格式,比如tar…

ChatGPT横空出世|写代码、写情书、写文章、做题……它啥都会!

在人工智能的发展中,有些行业可能会被替代,但这并不意味着孩子的未来发展方向会受到影响。毕竟,我们在有限的时间内无法掌握所有技术。那么,什么是人工智能无法替代的呢?小编将在结尾给出答案。 最近,OpenA…

ChatGPT横空出世,对UP主来说是威胁吗?

什么是ChatGPT? 资料显示,ChatGPT(全名:Chat Generative Pre-trained Transformer)是美国OpenAI研发的聊天机器人程序,于2022年11月30日正式发布。ChatGPT能火遍全球,是因为它能够通过理解和学…

Java面试宝典

JDK,JRE,JVM 三者关系? JDK 是 JAVA 程序开发时用的开发工具包,其内部也有 JRE 运行环境 JRE。JRE 是 JAVA 程序运行时需要的运行环境,就是说如果你光是运行 JAVA 程序而不是去搞开发的话,只安装 JRE 就能运行已经存在的 JAVA 程…

面试图背背佳

h5语意化标签 <nav><header><footer><article><section> <nav><header><footer><article><section> 优点&#xff1a; 为了在没有CSS的情况下&#xff0c;页面也能呈现出很好地内容结构、代码结构比<div>…

英语学得好,月薪高出10000块?真正影响职场的能力,9成国人有欠缺!

英语重要&#xff0c;大家从小就知道。 每次想学点什么&#xff0c;“学英语”总会从脑海里蹦出来。 但英语到底有用在哪&#xff1f; 说实际点&#xff0c;英语好&#xff0c;真的可以让人生活的更好么&#xff1f; 就在前两年&#xff0c;国内一份针对5000人的深度访谈报告显…

【Python爬虫项目实战一】获取Chatgpt3.5免费接口文末付代码(过Authorization认证)

目录 🚩前言🍑工具🍉分析流程🧅实战部分🧅🧅模拟登陆🧅🧅模拟提问请求🥒login方法🥒chatgpt方法🌰总结🚩前言 大家好!今天的目标是拿下Openmao的接口,他的接口内容和chatgpt3.5是一样的,它们的免责申明中写道:本站点基于外部API二次开发,仅供学习…

【java项目学习】羊腿外卖开发记录

前言 作为第一个练手项目&#xff0c;巩固学习之前学习的知识 教学地址 https://www.bilibili.com/video/BV13a411q753?p6&spm_id_frompageDriver&vd_source2497f00c3af066126b298d1871671eec 本次项目中使用到的技术 springspringMVCspringbootmybatis-plusmysql…

ChatGPT最强竞品重磅升级,免费可用!第一手实测在此,网友:有个性

在OpenAI祭出GPT-4的API和“最强插件”代码解释器后&#xff0c;竞争对手显然坐不住了。 就在刚刚&#xff0c;Anthropic旗下Claude发布第二代——没错&#xff0c;就是被外界评价为GPT-4最强竞品的那一个。 浅划一下这次更新动作的重点&#xff1a; 免费&#xff0c;不用排…