用ChatGPT写神经网络:一字不改,结果竟然很好用

b794a1f27c6c6ec8d881edaacd0f8e22.jpeg

机器之心报道

AI 写 AI,来得比预料中更快一些。

自从去年底推出以来,对话式 AI 模型 ChatGPT 火遍了整个社区。

ChatGPT 的确是一个了不起的工具,就像一个「潘多拉魔盒」。一旦找到正确的打开方式,你或许会发现,自己再也离不开它了。

作为一个全能选手,人们给 ChatGPT 提出的要求五花八门,有人用它写论文,有人让它陪聊,这些都是常见的玩法。脑洞再打开一点,既然 ChatGPT 是 AI 中的「王者」,那它会不会写一个 AI?

近日,一位机器学习领域的博主突发奇想,他决定让 ChatGPT 构建一个神经网络,使用 Keras 解决 MNIST 问题。

MNIST 算是机器学习领域的经典问题。即使这个手写数字数据集逐渐淡出了计算机视觉领域,但它的纪念意义仍然不可忽视,很多人入门深度学习的第一个数据集、验证算法的第一个实验都是 MNIST。

0900d04e7e6afc6d29f511937cf3982d.png

话不多说,想到了就开工。作者直接让 ChatGPT 写了一段代码,看上去完美无缺,甚至不需要更改任何内容。

2924ca6ba21d0cc4f3f5e366e119e624.png

这是一个很好的开始。

ChatGPT 选择了分类交叉熵作为损失函数。作者提出重写分类交叉熵这部分代码,ChatGPT 将其替换为稀疏分类交叉熵,更新之后的代码仍能 Work。可以发现,新的损失函数放弃了标签的分类转换。

e372259e880e5354874c7d45ef6519cf.png

ChatGPT 生成的代码使用了全连接层,但作者想使用卷积层。因此,ChatGPT 按照指示修改了代码,并添加了一个 Conv2D 和一个最大池化层(MaxPooling layer)。

d66667cc7bebcd9aa460d36e39c560f4.png

然后来到了评估最终模型阶段,作者让 ChatGPT 使用测试集编写代码。

b6936eccbfd87fcddb206dddf2439cbf.png

结果看起来很棒,而且 ChatGPT 的每一次回复都带有完整的解释。比如在这次评估中,它这样解释:

「评估」方法将测试数据和测试标签作为参数,并返回模型编译(此处为准确率)期间指定的损失和度量。上面的代码片段输出了测试的准确率,这应该可以让你了解到模型对新数据的概括性。‍

模型在训练期间使用了整个测试集作为验证数据。然后,作者让 ChatGPT 将其更改为训练数据的 20%。

126074fe32e4d832c4a2e1c9552a4ed8.png

此外,作者还想要更小的 batch 并运行更少 epoch 的代码。虽然这一步未必要用到 ChatGPT,但他不想在不更新 ChatGPT 上下文的情况下更改代码。

所以这项任务还是落在了 ChatGPT 头上:

cbdab6cf528ab9cbc374a1ced5061e78.png

接下来,作者打算绘制训练过程中的训练和测试损失图。ChatGPT 的建议是:需要更改适合模型的 line 以捕获其结果值。

310fcdbc8c6c6a8b1d35d479a1acfa2f.png

106a48d0007c7993e2ad7d45e65de846.png

为了展示数据集中的一些示例,作者让 ChatGPT 编写代码来输出图像和标签的组合。这些输出的代码也很完美,附有 20 张图片的合集。

ada935a13401d0cba77403502b03a464.png

80eea27dbd4e197f150574c9b209eb62.png

构建模型时,查看其结构也是必要的。如果用这个问题去问 ChatGPT ,回复是:

0ceca3500dc76ca60f93c343f1c4f7b1.png

ChatGPT 给出的是关于模型的总结:

3cc59c349161c4cba4b8c23eaae40e9d.png

模型的总结很有用,但作者更想看到显示模型结构的图。所以继续问:

3b52d0e43786ab04785bbb1afd21ab56.png

a848e6b04b000efd260d36d7de81286e.png

结果是满意的,最后就是准备部署这个模型了,让 ChatGPT 将模型保存到磁盘吧:

bb87237a4f6ba68563d6b90714f2c391.png

现在,作者想创建一个使用保存的模型进行预测的类。这是 prompt 很有趣,解决方案也很完美。

ef74919b7c8b71dc15c2bbc155bd5437.png

现在编写一个示例,使用预测器的类来预测 10 个随机图像的标签:

a963f6be1c7a2c2c9a403f0dac6b7a62.png

为了完成这个,作者让 ChatGPT 展示了一个混淆矩阵:

9ddefd9eacc75e916973389a5b7feead.png

该说不说,ChatGPT 使用的样式还真挺好看。

765a9554321f7454ab5e7deffb9a68ab.png

完成所有试验后,作者将所有 ChatGPT 生成的代码公布了出来,你也可以上手试试:

地址:https://colab.research.google.com/drive/1JX1AVIfGtIlnLGqgHrK6WPylPhZvu9qe?usp=sharing

 

9560fdfe69bdb52fb670875ca44004d8.jpeg

 
 
 
 
往期精彩回顾适合初学者入门人工智能的路线及资料下载(图文+视频)机器学习入门系列下载机器学习及深度学习笔记等资料打印《统计学习方法》的代码复现专辑机器学习交流qq群955171419,加入微信群请扫码

整理不易,三连

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/11929.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【原创】理解ChatGPT之机器学习入门

想要连贯学习本内容请阅读之前文章: 【原创】AIGC之 ChatGPT 高级使用技巧 【原创】AIGC之主流产品介绍 AIGC是什么 AIGC - AI Generated Content (AI生成内容),对应我们的过去的主要是 UGC(User Generated Content&…

小狐狸ChatGPT付费创作系统1.8.6独立版 + H5端 + 小程序最新前端 安装升级教程

小狐狸GPT付费体验系统最新版系统是一款基于ThinkPHP框架开发的AI问答小程序,是基于国外很火的ChatGPT进行开发的Ai智能问答小程序。播播资源网整体测试下来非常完美,可以说小狐狸GPT目前国内最好的一款的ChatGPT对接OpenAI 软件系统。 --------------…

小狐狸ChatGPT付费创作系统1.92独立版 + H5端 + 小程序前端+新增AI绘画功能 系统源码体验安装教程

小狐狸GPT付费体验系统最新版系统是一款基于ThinkPHP框架开发的AI问答小程序,是基于国外很火的ChatGPT进行开发的Ai智能问答小程序。播播资源网针对源码整体测试下来非常完美,可以说小狐狸GPT目前国内最好的一款的ChatGPT对接OpenAI 软件系统。 ------…

离职腾讯,总得说点什么吧

(永久免费,扫码加入) 转自:公子龙 大家好,我是菜哥! 程序员是一个流动性很大的职业,经常会有新面孔的到来,也经常会有老面孔的离开,有主动离开的,也有被动离职…

科技云报道:大模型时代,SaaS元年才真的到来了?

科技云报道原创。 ChatGPT席卷全球后,如果有人问AI大模型影响最大的会是哪个行业?SaaS领域肯定是不二之选。 目前全球各大科技公司已宣称要用大模型触及、整合所有产品。 其中,微软率先为其办公家族装配上了各类copilot,开发者…

通向AGI之路:大型语言模型(LLM)技术精要

原文:通向AGI之路:大型语言模型(LLM)技术精要|AGI|LLM|GPT|NLP|模型|技术|数据|-健康界 ChatGPT出现后惊喜或惊醒了很多人。惊喜是因为没想到大型语言模型(LLM,Large Language Model)效果能好成这样&#…

后GPT 3.0时代,主流大模型技术精要详解,走向AGI之路的大门已开

转载自 | 机器之心 来源 | 知乎 作者 | 张俊林 洋洋洒洒近三万字,中国中文信息学会理事、中科院软件所博士、新浪微博机器学习团队新技术研发负责人的张俊林回顾了大型语言模型(LLM)的发展历程、技术迭代更新以及未来走向等方方面面的内容&…

通向 AGI 之路:大型语言模型(LLM)技术精要

来源:AI科技评论 作者:张俊林 本文经授权转载自知乎:https://zhuanlan.zhihu.com/p/597586623?utm_campaignshareopn&utm_mediumsocial&utm_oi37478916423680&utm_psn1595705313004679168&utm_sourcewechat_timeline&s_…

由ChatGPT反思大语言模型(LLM)的技术精要

人工智能与算法学习 作者:张俊林, 编辑:夕小瑶的卖萌屋 导读:ChatGPT出现后惊喜或惊醒了很多人。惊喜是因为没想到大型语言模型(LLM,Large Language Model)效果能好成这样;惊醒是顿悟到我们对…

ChatGPT大模型用于刑侦破案只能是虚构故事吗?AI大模型企业服务趋势探讨(一)...

故事开始了。 一阵疼痛痉挛,脚下地面渐渐返潮,他知道又要下雨了。 刑警老周摸索着爬到台阶的高处,等待老城区电子工厂夜班的收工铃声。素来挡风的夹克挡不住湿冷刺骨的潮气。这股子潮气里还不时翻滚浓烈的腐败腥臭。 一阵嘈杂,路灯…

36k字长文讲述由ChatGPT反思大语言模型的技术精要

文|张俊林 源|知乎张俊林 导读:ChatGPT出现后惊喜或惊醒了很多人。惊喜是因为没想到大型语言模型(LLM,Large Language Model)效果能好成这样;惊醒是顿悟到我们对LLM的认知及发展理念&#xff0c…

张俊林:万字长文讲述由ChatGPT反思大语言模型的技术精要

每天给你送来NLP技术干货! 作者:张俊林 新浪微博 新技术研发负责人 来源:知乎张俊林 排版:DataFunTalk 导读:ChatGPT出现后惊喜或惊醒了很多人。惊喜是因为没想到大型语言模型(LLM,Large Language Model&am…

ChatGPT大模型用于刑侦破案只能是虚构故事吗?AI大模型企业服务趋势探讨(一)

故事开始了。 一阵疼痛痉挛,脚下地面渐渐返潮,他知道又要下雨了。 刑警老周摸索着爬到台阶的高处,等待老城区电子工厂夜班的收工铃声。素来挡风的夹克挡不住湿冷刺骨的潮气。这股子潮气里还不时翻滚浓烈的腐败腥臭。 一阵嘈杂,…

ChatGPT快速入门

1. :介绍ChatGPT的背景、目的、特点和优势,让读者对ChatGPT有一个初步的了解。 ChatGPT简介 ChatGPT是一种基于自然语言处理技术的智能对话系统,旨在为用户提供更加智能、便捷、高效的交流体验。ChatGPT的背景是人工智能技术的快速发展和智能…

通过阿里云函数计算解决ChatGPT API的调用问题

ChatGPT系列文章 与其被ChatGPT取代,不如征服ChatGPT,做它的主人! 文章目录 ChatGPT系列文章前言命令行部署准备工作 两行命令实现部署应用中心部署使用代理访问API总结 前言 自2022年11月30日 OpenAI 发布 ChatGPT 以来,虽然时有…

AI各种模型的聊天机器人的接入聊天平台(服务器和本地搭建)

探索ChatGPT,协助工作学习创作。公众号「阿杰与AI」回复AI,加入社群,一同探讨,一同成长,比他人更进一步。 我们一起维护一个完全免费开源知识库。 1.AI、OpenAI、MidJourney发展史2.ChatGPT们对今后社会生活的影响3.目…

开源一键拥有你自己的ChatGPT+Midjourney网页服务,用不用是另一回事,先收藏!

功能支持 原ChatGPT-Next-Web所有功能 midjourney imgine 想象 midjourney upscale 放大 midjourney variation 变幻 midjourney describe 识图 midjourney blend 混图 midjourney 垫图 绘图进度百分比、实时图像显示 自身支持midjourney-api 参数说明 MIDJOURNEY_PROXY_URL …

中科院基于gpt的学术优化网站搭建教程

我使用的python为3.10版本,编译器为pycharm,浏览器为火狐 我们进入github找到中科院提供的资源: https://github.com/binary-husky/chatgpt_academic 其中有关于ChatGPT学术优化的安装步骤,使用教程,我没有用Git下载&a…

快速使用ChatGpt Web Server

快速使用ChatGpt Web Server ChatGpt Web Server是使用Blazor Server模式部署的一个服务,所有的逻辑和代码执行都会在服务器执行,然后通过SignalR传输到前端渲染。通过这样模式,我们部署ChatGpt Web Server只需要新加坡服务器,不需…

一、海外服务器租赁方案及配置与登录

1、为什么要租赁海外服务器 ChatGPT是能听懂人话的人工智能,能够模拟人类的思考和表达,图灵测试对它来说是小儿科了。它的出现标志着人工智能技术在自然语言处理和智能对话系统领域的重大进展和突破,其历史意义,业界认为不亚于互联网和个人电脑的诞生。它虽然可以被全世…