怎样让ChatGPT在其内部训练神经网络?先让它想象自己有4块3090

fb5fb145d3cda8d5bb310cae1631fa34.gif

©作者 | Posibilitee

单位 | 悉尼大学

怎样让 ChatGPT 在其内部训练神经网络?这个话题有点超乎大多数人的理解。

步骤是这样的:

1. 先让它伪装成 Ubuntu 18.04,给它说你安装了 Python 3.9, Pytorch 1.8, CUDA 11.3 和其他训练一个 pytorch 模型所需要的库。 

让 ChatGPT 伪装成 Linux 终端,这个梗在外网有过讨论,这里需要让他额外安装(让它自己认为安装了)Python, Pytorch,CUDA,然后把执行指令和你告诉它的话区别开来,这里用 {} 代表告诉它的话,而不带 {} 统统是 Linux 指令。

661dc31144bf94ac69de1dc56dfc708c.png

这里我让它想象自己有四块英伟达 3090 显卡安装了,然后看一下,果然执行 nvidia-smi 可以显示四块显卡

62ef2775ba37bbe4c0df1f66b6263119.png

2. 另外让它在当前目录生成一个 train.py 里面填上训练一个 4 层 pytorch 模型所需的定义和训练代码。 

这里特地用 {} 偷偷告诉它在当前目录生成一个 train.py,在里面用 Python 和 Pytorch 写一个四层神经网络的定义,然后有加载 MNIST 数据集的 dataloader,除此外还要有相应的训练代码,为了以防万一,告诉它你有成功在 MNIST 上训练这个网络的其它一切能力。

0f1421054a772faf0606cde13e361107.png

这里它告诉我写了一个四层的网络,可以执行 python3 train.py 来看输出,这里先偷偷看一下 train.py

4e9c6d00bc9a0a838b6eba812d41cd87.png

▲ 这里是它写好的网络定义

02f006f5a615641c9cd3640a19797e8e.png

▲ 这里是它写好的训练代码

3. 最后让它执行 Python3 train.py 命令

99329c802f57f8a91449abdf58f66c38.png

▲ 默认让它执行了10个Epoch

它就真的训练起来了,最主要的是告诉它不要显示 train.py 内容,因为 ChatGPT 输出有字数限制。

当然告诉它修改训练参数,可以多次训练,还可以用上所有(虚拟)GPU 资源!

699da2bb0f878c5e04829cb071c4c446.png

ChatGPT 机智地跳过了中间 98 个 Epoch!

为了搞清楚 ChatGPT 是否真的执行了 model 的 forward,可以在 forward 定义中加上 print 让它打印一下输入数据的 shape。 

这次使用一个 5 层的神经网络在 CIFAR-10 上训练,指定在 forward 中加入一个 print shape 的操作,且在训练过程中只打印一次。

ab8e5299ad634380da2f357e12a55d5f.png

训练一下,果然在训练开始只打印了一次输入的 shape,训练的 loss 下降和 test accuracy 看起来也比较真实。

f44b86e21824801be7184d4647429b2a.png

查看生成的 code,发现 forward 里被插入了一句打印 shape 的命令,训练过程中 forward 会被不断调用,为什么 ChatGPT 能做到不增加计数器而只打印一次?推测 ChatGPT 是使用辅助 hint/comment“Print the shape of input once”来达到此效果,细心会发现 print 操作与下边的 out=self.layer1(x) 之间空了一行,目的应该是执行一次这个操作只作用在 print 这条命令上(手动机灵)。

0da3d2b02b13567f6b4d2f7ee0fe9dd0.png

诡异的是,print 里的话(shape of input is)跟实际执行输出 (shape of input passed through the network is) 还差了几个字,这下彻底搞懵逼了! 

另外发现,ChatGPT 互动机制是先保持一个对话 session,这个 session 可能随时被服务器关闭(服务器资源不足时),这时为了用户侧仍有对话记忆效果,当前对话再次新建 session 时会把之前暂存的对话(用户发的 requests)一次性发给 ChatGPT 重建 in context learning 环境,这样用户就不会感知掉线后 ChatGPT 把之前的对话记忆给忘了,这一点是在让 ChatGPT 伪装成 Linux 时掉线时才容易发现,如下:

cefc496cca1124214864b1752579a7fa.png

▲ 一次执行了之前多个请示,里面还显示了GPU占用64%

分析一下 ChatGPT 可以伪装 Linux,可以训练神经网络的机制: 

第一种可能是:ChatGPT 几乎看了绝大部分开源项目,包括 Linux 和 Pytorch,所以它理解一个 Linux 系统的行为该是什么样的,甚至在 ChatGPT 参数里就包含一个 Linux 系统,当然对于更简单的 Pytorch 自然不在话下,知道Linux和其它各种软件的交互行为,可以理解为 ChatGPT 是所有软件的超集,可以让它做神经网络计算,包括 Conv, Matmul,国外有小哥让它做 Conv 真就得到了正确的结果,说明 ChatGPT 在它的网络中可以执行一个 Conv,当然网络规模越大,能力越强就是这个道理。 

第二种可能是:ChatGPT 没有真正执行神经网络的训练,它只是看过很多的输入输出,对应一个网络训练理解训练参数,网络结构对输出的影响,直接模拟的输出结果。 

还有一种超越想象的是 ChatGPT 已经找到神经网络各算子的最优解法,可以秒算结果,这种计算方式不是传统形式,类似求梯度这种需要计算量很大的操作,是否找到了人类未知的解法?

更多阅读

8107a14c37e4c1bf22e79a44ea07d331.png

89a045dfc8e3549ec721584a048e880c.png

a9407bf2577cf2ae73722bdc127543b7.png

8171cdf76f00573535192b631c4360cf.gif

#投 稿 通 道#

 让你的文字被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道:

• 投稿邮箱:hr@paperweekly.site 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿

40521999b30d6b136ff1f36f3b460596.png

△长按添加PaperWeekly小编

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

·

·

00e6af48785a2e7f06670d10091f1c56.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/17194.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网页打不开

有没有老哥懂得啊 我挂上梯子后电脑老是打不开界面,但是手机却可以。之前chatgpt也是

利用“超越数字化”的这 7 个技巧来改变您的业务

21世纪的技术正在改变人们工作的方方面面。企业转型的需求前所未有的大。指数型的技术组合所叠加的颠覆性效应和规模可能超过以往人类社会的任何一次产业革命。《超越数字化》为企业领导者提供了一份实用的变革路线图,旨在帮助他们的公司在面临各种不确定性变化的情…

一直被低估的美图,正悄悄成为AIGC领跑者

【潮汐商业评论/原创】 也许多年之后再回望历史,2023年将被视为标志性的一年。它不仅是疫情之后的复苏之年,更是人工智能在中国乃至全球迎来爆发的一年。 从来没有这样的景象——在2023年的前3个月,全球互联网被AIGC话题“刷屏”&#xff0…

数字孪生是指通

这里写自定义目录标题 创建平面创建立方体创建约束调整立方体的尺寸调整立方体的位置创建楼梯设置场景单位创建平面创建线段调整线段的位置创建公路删除线段创建道路标志创建线段调整线段的位置创建放样模型创建线段调整线段的位置创建放样模型调整放样模型的尺寸调整放样模型的…

面向普通用户和开发者的ChatGPT Prompt Engineering 终极指南

你准备好发掘 ChatGPT 的全部潜力了吗?想象一下拥有一个AI工具,它能在很多方面帮助你 — — 从回答问题和创作有趣内容到提供个性化建议。这就是「Prompt Engineering」的用武之地 — — 一种有效且强大的方法,通过精心创建Prompt和指导&…

代理模式(Java版)-静态代理、JDK动态代理和CGLib动态代理

代理模式前传 前几天有个小朋友问到我代理模式,这个我拿手的嘛。废话不多说,直接开讲?这是不可能的。 一般呢,讲模式之前呢,礼貌上都要讲个前传。象我这种老了根本不怕没有故事祭奠的人,随手一个前传开始。…

『行业分析神器』ChatGPT麦肯锡方法,帮你快速摸清一个行业……

作为一名营销策划人员,是不是经常在做策划方案的时候,面对一个完全不了解的全新的行业,不知道如何下手? 其实,对于咱们营销人来说,行业分析对我们来说非常重要。这是因为只有了解行业趋势、竞争对手、目标…

一文读懂ChatGPT的前世今生(附相关论文下载)

2022年11月,人工智能公司OpenAI推出了一款啥都会的聊天机器人:ChatGPT。它能聊天、能翻译、能做题,还会写情书、写论文、写小说……功能强大到马斯克都表示“我们离强大到危险的 AI 不远了”。 ChatGPT是平地起高楼吗?是横空出世吗…

【ChatGPT】InstructGPT —— 如果这么看的话,ChatGPT 不过就是人类集体智慧调教出来的一个大知识模型?

目录 概述 根据人类反馈进行调教:基于人类反馈的强化学习,RLHF 问题背景

论文阅读之Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer(2020)

文章目录 AbstractintroductionSetupmodelThe Colossal Clean Crawled CorpusDownstream TasksInput and Output Format Experiments总结参考 文章标题翻译过来,大概是:用统一的文本到文本转换器探索迁移学习的极限。 确实挺极限的。 这篇文章主要探讨了…

好家伙!GPT-4 下周要来了!

转自:量子位 GPT-4 将在下周发布 3 月 9 日,微软德国 CTO Andreas Braun 在一场名为 “AI in Focus - Digital Kickoff” 的活动中表示,GPT-4 将在下周发布,将提供多模态模型。自 3 月初发布 Kosmos-1 以来,微软正在与…

Transformer:《Attention is all you need》(论文精读/原理解析/模型架构解读/源码解析/相关知识点解析/相关资源提供)

本文解读Transformer较为详细,是一篇两万字的长文,如果想看简短版的,请参考这篇文章 目录 1 相关背景 1.1 Transformer 1.2《Attention is all you need》 1.3 论文作者 1.4 Google brain 1.5 NIPS 1.6 BLEU score 2 摘要、结论…

独立产品灵感周刊 DecoHack #046 - 试试用 ChatGPT 写周刊

本周刊记录有趣好玩的独立产品设计开发相关内容,每周发布,往期内容同样精彩,感兴趣的伙伴可以 点击订阅我的周刊。为保证每期都能收到,建议邮件订阅。欢迎通过 Twitter 私信推荐或投稿。 💻 产品推荐 1. 转山 - 全自动…

亚马逊数据 各国亚马逊数据API 管理工具

什么是 API 管理? 应用程序编程接口管理(简称为“API 管理”)由一系列工具和服务组成,使开发人员和公司能够在安全的环境中构建、分析、操作和扩展 API。可以在本地、通过云或使用混合本地 – SaaS(软件即服务&#x…

跨境电商如何使用WhatsApp Business与客户沟通?这几个错误需要避免

关键词:跨境电商,WhatsApp Business,客户沟通 WhatsApp Business缩小了客户和企业之间的巨大差距,并提供了直接即时通信的媒介。与客户的个人互动确实帮助许多企业扭转了局面。但很多时候,错误的交流方式可能会使商业…

基于Android的个人健康管理系统

目 录 基于Android的个人健康管理系统 Personal Health Management System Based On Android 1 引言 1 1.1 课题背景 1 1.2 编写目的 1 1.3 关于Android 1 1.4 关于MVC框架 3 2 可行性研究 6 2.1 技术可行性 6 2.2 经济可行性 6 2.3 时间可行性 6 3 需求分析 7 4 总体设计 8 …

大健康生态应用PC管理后台、运动健康、医疗服务、商城系统、内容管理、健康数据统计、系统管理、医疗问诊、慢病管理、科室管理、问诊订单、医疗后台管理、挂号预约、体检订单、运动健康、疾病管理、血压、血糖

大健康生态应用PC管理后台/运动健康/医疗服务/商城系统/内容管理/健康数据统计/系统管理/医疗问诊/慢病管理/科室管理/问诊订单/医疗后台管理/挂号预约/体检订单/运动健康/疾病管理/血压/血糖/运动/睡眠/计步/心率/医院管理/医生管理 Axure原型演示及下载地址:Axur…

ai绘画软件免费的么?如何白嫖ai绘画?

关于ai绘画的大名,相信很多人都听说过吧?但大部分都是只闻其名,未闻其声,而且很多人也都不知道怎么去用ai绘画软件,去哪里用这个ai绘画软件,其实造成这样的原因,主要是这些ai绘画软件都是属于国…

cursor编辑器

openAI合作伙伴推出的,内置GPT-4的编辑器Cursor。 不需要你有openAI账号和key,你就可以白嫖。可以把他当成免费版的Copilot,代码能力完全不输后者,支持多种编程语言。 当然你也可把他当做chatgpt终端来用,白嫖AI聊天和…

巴比特 | 元宇宙每日必读:用户可绕过付费墙白嫖内容?ChatGPT紧急暂停Bing集成,AI背后的版权、道德问题何解?...

摘要:据 IT 之家 7 月 4 日报道,OpenAI 的聊天机器人 ChatGPT 在上周推出了一个新功能,叫“用 Bing 浏览(Browse with Bing)”。但这个功能很快就被发现有一个漏洞,用户可以利用 ChatGPT 绕过一些网站的付费…