漫画科普ChatGPT:绝不欺负文科生

图文原创:亲爱的数据

你所热爱的,都值得拥有一个名字。

世界上里程碑式计算机,问世之时大多拥有自己的名字。

我认为,假如计算机的诞生是元年,下一个元年将会是“奇点”。

不是比特币,不是虚拟现实,不是AIGC(用人工智能技术来生成内容)。这些只是过程。

当然,过程足够重要,也要有名字。

很多人看到GPT-2,GPT-3, Switch Transformer,DALL·E 2 ,Codex,LaMDA,就头晕,看不懂。

它们都是模型的名字。以它们在信息技术发展史上的地位,高低得整个名字。

模型里有什么?

模型中的运算形式设计,和运算所需要的参数,都是模型的一部分。

近几年,大模型发展的有声有色,一个做得比一个大。

参数数量是模型大小的重要指标,但不是唯一指标。运算量也是指标之一。同样的参数量,你设计的运算的形式不同,计算量也不同。

运算形式设计是人类脑力精华。

参数,你可以简单理解为机器部件,部件越多,体量越大。但不见得部件越多,机器就越好,模型也一样。

参数量很直观,一度“参数比大小”成了关键。

2020年5月,GPT-3有1750亿参数。比它的兄弟GPT-1和GPT-2强大的多。GPT-3 发布仅几个月后,谷歌大脑团队就发布了Swin Transformer,参数量是GPT-3的9倍。

但是“比大小”不是目的,“效果好”才是目的。

这些“配有姓名”的大模型,规模很关键,但是创新更关键。

贾扬清说,不是别人做出大模型之后,简单跟进说“我们可以做得更大”,更重要的是,在前人基础上,做更多创新成果。

OpenAI也只是一家搞AI创业的“小公司”,在“转身”成为公司之前,是一家公益性质的科研实验室。

公司虽小,愿景却大:“让人工智能有益于全人类”。

从此,OpenAI他们矢志不渝地朝着通用人工智能(AGI)的方向不断尝试。

AGI是最有抱负的科技方向之一,拥抱AGI必须让机器展示出人类所拥有的各项智能,亲情,爱情,友情。

但怎么前往AGI,人类毫无头绪,也有人说,毫无希望。

情况就是这么一个情况。

把模型做大是不是通向人工智能的路?谁也不知道。

但是模型大了,效果确实好了。大模型的竞争从寥寥到陷入忙碌, 比方法,比技巧,比谁有效。

2022年3月,InstructGPT,加入了人类的评价和反馈数据,效果也很好。

参数降到了13亿,小也可以很能打。

Instruct的中文有吩咐,指令之意,就是说,按照人类的指示行事。

讲到InstructGPT,距离ChatGPT也不远了。

ChatGPT也按指令行事,方式是通过问答。

大模型超级难做,消耗无数系统工程师和算法工程师的智慧和精力,是个系统工程,而今看来,国之重器,毫不为过。

这擎天玩意让缺乏创新的模型看起来像夜市地摊上粗糙的塑料玩具。

这种规模的模型,用“做出来”这个动词已经不合适了,与其说是“开发”,不如说是“组织开发”。

为此OpenAI配套了上游数据团队,和下游芯片“大军”。

据 InstructGPT 的技术博客,从事高质量数据收集、挖掘、清理、增强等方面的工作的人数,从40人增加到1000人。数据团队有技术含量,收入可观,说是一家科创板上市公司也不过分。

作为ChatGPT的数据公司,那怕轮次融资,投资人会爱极了。

为了开发一个模型,配套一家上市公司,真是妙。

这还没有完。

芯片方面,据谭老师截获了一个信息:

“OpenAI公司为训练ChatGPT用了10万块英伟达A100的GPU。”

我也问了一个业内顶级大佬,他亦认为合理。

且不说价钱,而这一型号的高端GPU已经被美国限制,国内买不到了。

ChatGPT背后的一些信息来自InstructGPT的学术论文。

InstructGPT的核心思路由之前两条研究线路所带来。

也就是说,装在ChatGPT弹匣里的银色子弹中,一颗叫“自然语言理解的大语言模型 LLM”,一颗叫“带人类反馈的强化学习 RLHF”。

贾扬清的解释是,这一系列大预语言模型多少都采取了不带太强结构的统计方法:“根据周边的词语来预测中间的词语”,或者“根据前面的文字来生成后面的词语”。

当然,还有一些银弹叫,“外人不知道”。

叹服ChatGPT前沿科研的能力之余,思考它如何从一个科研成果变成人见人爱的科技产品?

OpenAI此前所推出了一种产品试用机制,用了两个工具。工具一Playground,工具二GPT-3 API。API必须要代码调用接口,并不是人人都可以轻而易举体验它的能力。

虽然GPT-3 API已经非常简单,代码复制粘贴也能试一下。

贾扬清认为,这种产品试用让产品和市场在做小范围的磨合,尝鲜者虽少,但本质上,产品试用为后续的科研带来了大量的数据输入。

科研没有停止,科研在不断走向产品。

计算机领域有一个短语叫做 “human in the loop”,有人翻译成“人机交互”,并没有揭示核心。也有人翻译成“人机回环”。

贾扬清的解释是,将一篇科研文章变成一个软件原型(prototype)。再将用户的体验、数据的回流、标注、再训练这个闭环做得非常精准。ChatGPT 在这一个领域中体现出了高超能力。

科技产品可以粗糙,也可以精美。

ChatGPT的科研背景非常强,满身都是商业机密的ChatGPT,虽然公布出来的技术大家都懂,但是为什么他们的效果这么好?

OpenAI团队做出来一个目前为止最接近AGI的东西,似乎证明了通用人工智能是存在的。

无论是不是,它离我们想象中的AI越来越近了。

(完)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/5573.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

为什么说 ChatGPT 引爆第四次工业革命?

如果看不懂当下,请回忆历史,因为曾经发生过。 如果忘记了历史,请看看当下,因为历史正在重演。 我问佛:何为对的人? 佛说:一见你 ,就笑的人;一见,你就笑的人&a…

ChatGPT为我们带来了什么?

近两周,AI频频占据头条。 “用三秒完成我一天的活。”ChatGPT为中国众多的小型、产业链分布绵长的跨境电商企业降低了获得定制化方案的成本。许多商家相信,ChatGPT还能处理大量的财务报表和数据分析模型,这也广大跨境电商不需要再花钱聘请外…

利用 ChatGPT 解决某些网站文章不允许复制粘贴的限制

如下图所示,假设我想把这段文字复制下来,但是在浏览器里点击右键,会遇到 禁止转载的错误提示,此时 Ctrl C 也不工作。 可以在 Chrome 开发者工具里,切换到 Element 图标,把想要复制粘贴的文字对应的 elemen…

ChatGPT能为ERP带来什么改变

ChatGPT是什么 几十年来,企业资源规划 (ERP) 系统一直是许多企业的支柱。企业通过ERP来完成业务数据的采集、归纳、整理,生成反映业务状况的各式经营报表。但是它也是一项需要投入巨大的人力资源和硬件设备的项目,比如ERP基础数据的录入&…

为什么ChatGPT用Python实现?

可能你不知道, ChatGPT这个网站的后端居然是用Python实现的。 在一些人眼里,Python只能用来写写脚本、搞搞爬虫、做些小项目之类的,其实这是对Python的最大偏见。 因为Python早就被证明可以应用在大型项目中,特别是国外很多明星…

ChatGPT为什么那么火?

ChatGPT自推出以来,因其多样化的玩法,受到了世界各地互联网爱好者的热捧。打开 Google 关键字分析工具,我们可以看到,美国地区的ChatGPT 词条月搜索量已经达到 36 万次,热度持续不减。根据最新的消息,微软将…

反其道而行,大学教授鼓励学生用 ChatGPT 写论文

整理 | 屠敏 责编 | 张红月 出品 | CSDN(ID:CSDNnews) 新 AI 工具 ChatGPT 的到来,正在教育圈呈现出冰火两重天的态势,教授们几家欢喜几家愁。 这不近日,来自宾夕法尼亚大学沃顿商学院的一位专门研究创…

ChatGPT团队揭秘:3清华、1北大、1华科

Datawhale分享 分析:ChatGPT团队,来源:AIGC开放社区 Aminer和智谱研究发布了《ChatGPT团队背景研究》报告,深度揭示了这款火爆全球应用的背后团队的总体人员架构。 调查发现,ChatGPT团队只有87人,其显著特…

ChatGPT 团队阵容揭秘:3清华、1北大、1华科

程序员的成长之路 互联网/程序员/技术/资料共享 关注 阅读本文大概需要 3.5 分钟。 来自:Aminer和智谱研究 Aminer和智谱研究发布了《ChatGPT团队背景研究》报告,深度揭示了这款火爆全球应用的背后团队的总体人员架构。 调查发现,ChatGPT团队…

用ChatGPT写论文,震惊了!

当代研究生内卷现状—— 每天在实验室熬到半夜鸡叫,but,该有的实验数据一个也没得。 为了准备组会前一天呕心沥血搞ppt,but,老师的一句论文进度怎么样,瞬间颤抖。 那个总是抓住空隙打游戏的学弟发了一篇一作二区&#…

什么?还能让ChatGPT自己给自己写提示(Prompt)?

作者:ChenZhen 博客地址:https://www.chenzhen.space/🌐 版权:本文为博主 ChenZhen 的原创文章,本文版权归作者所有,转载请附上原文出处链接及本声明。📝 如果对你有帮助,请给一个小…

算法趣题-Q37

一、问题描述 二、问题分析 一开始,我使用了贪心的方式(也在C/C实现中,是错的),认为短视能够获得好的结果,运行结果确实是13步最少,但是路径却不是数组路径,debug发现在0开始的贪心路…

一些通过数学分析解决的算法题汇总

写在前面 如果觉得写得好,或者有所帮助,记得点个关注和点个赞,不胜感激! 我发现最近经常会遇到一些需要通过数学分析去解决的问题,做的时候想着各种方法,然后看到题解,发现可以用数学分析的方式…

演示求解中学数学题(Mathematica)

#高二解析几何题# 在[-3,4]区间上动曲线2x^24xc跟曲线1/3x^3x^2x有两个公共点,求c的取值范围. (现在高中的数学题难度已经算是高了;需要高等数学知识了) 直接求解: ClearAll["Global*"]; xmin -4; xmax 5; ymin -15; ymax 50; \ xnum 4; ynum 2; v Table[Ma…

算法-数学题

目录 50. Pow(x, n)54. 螺旋矩阵剑指 Offer 10- I. 斐波那契数列169. 多数元素剑指 Offer 39. 数组中出现次数超过一半的数字 191. 位1的个数剑指 Offer 15. 二进制中1的个数剑指 Offer 56 - I. 数组中数字出现的次数剑指 Offer 56 - II. 数组中数字出现的次数 II剑指 Offer 58…

文心一言 VS chatgpt (15)-- 算法导论3.2 4~5题

四、函数 ⌈ lg ⁡ n ⌉ ! \lceil \lg n \rceil ! ⌈lgn⌉! 多项式有界吗?函数 ⌈ lg ⁡ lg ⁡ n ⌉ ! \lceil \lg \lg n \rceil ! ⌈lglgn⌉! 多项式有界吗? 文心一言: chatgpt: 对于第一个问题,函数 ⌈ lg ⁡ n…

让Chatgpt帮你出Python练习题

最近发现Chatgpt有一个很棒的功能,感觉是让培训机构失业呀。 你可以让Chatgpt出Python练习题,能涵盖任意的知识点,对于初学者来说简直是福音。 Chatgpt在编程上面的对话能力是好于其他场景的,因为编程是机器语言,cha…

chatgpt赋能python:用Python计算数学题,速度快效果好!

用Python计算数学题,速度快效果好! 在现代化的信息时代,计算机已经成为了我们生活中不可缺少的工具之一。而对于数学爱好者来说,用计算机进行数学计算已经变得非常普遍,因为使用计算机能够快速解决数学难题&#xff0…

MJ基础入门之注册:超详细注册 Midjourney 及使用方法

如何注册并使用 Midjourney Midjourney是一款优秀的AI图像生成工具,它的综合能力十分强大且易于上手。使用Midjourney,您可以在一分钟内生成4张图像,这是非常快的。不仅如此,国外的很多图像创作者都在使用Midjourney,并…

Claude的奇妙之旅:一起探索人工智能的无限可能

是一款由Anthropic公司开发的人工智能应用,可以在Slack中使用。可以理解和生成自然语言,帮助用户完成各种任务,如写小说、编写代码、解释概念等。的特点是: - 是免费的,不需要申请或下载,只需要在Slack中添…