吴恩达ChatGPT课爆火:AI放弃了倒写单词,但理解了整个世界

明敏 杨净 发自 凹非寺
量子位 | 公众号 QbitAI

没想到时至今日,ChatGPT竟还会犯低级错误?

吴恩达大神最新开课就指出来了:

ChatGPT不会反转单词!

比如让它反转下lollipop这个词,输出是pilollol,完全混乱。

08de2d3c9f670f0427200bed2043981a.jpeg

哦豁,这确实有点大跌眼镜啊。

以至于听课网友在Reddit上发帖后,立马引来大量围观,帖子热度火速冲到6k

b50ad81d5fa78a192e114cf14c23e8ba.png

而且这不是偶然bug,网友们发现ChatGPT确实无法完成这个任务,我们亲测结果也同样如此。

9b991afd2207986fc7c2de988d9faa7d.png

afb31f300e419fa862e998370b27a314.png
实测ChatGPT(GPT-3.5)

甚至包括Bard、Bing、文心一言在内等一众产品都不行。

0cc5f4a3c558a8f0e7319ba43690fc5d.png
实测Bard

0efa1eb0009b0f56d21cb9ac0fc63d88.png
实测文心一言

还有人紧跟着吐槽, ChatGPT在处理这些简单的单词任务就是很糟糕。

比如玩此前曾爆火的文字游戏Wordle简直就是一场灾难,从来没有做对过。

89828bef67b0d30ff10f50c416242874.png

诶?这到底是为啥?

关键在于token

之所以有这样的现象,关键在于token。token是文本中最常见的字符序列,而大模型都是用token来处理文本。

它可以是整个单词,也可以是单词一个片段。大模型了解这些token之间的统计关系,并且擅长生成下一个token。

因此在处理单词反转这个小任务时,它可能只是将每个token翻转过来,而不是字母。

1a65ed6e075c27bdbd6ff6eebbdb2116.png

这点放在中文语境下体现就更为明显:一个词是一个token,也可能是一个字是一个token。

afcc1c686320185fa013dcdef983b5a3.jpeg

针对开头的例子,有人尝试理解了下ChatGPT的推理过程。

b8227ffdf69d1702189a5dfb79950ea8.png

为了更直观的了解,OpenAI甚至还出了个GPT-3的Tokenizer

561585e645cc71479039608fa273a61d.png

比如像lollipop这个词,GPT-3会将其理解成I、oll、ipop这三个部分。

根据经验总结,也就诞生出这样一些不成文法则。

  • 1个token≈4个英文字符≈四分之三个词;

  • 100个token≈75个单词;

  • 1-2句话≈30个token;

  • 一段话≈100个token,1500个单词≈2048个token;

单词如何划分还取决于语言。此前有人统计过,中文要用的token数是英文数量的1.2到2.7倍

61614be89649e9912a684286b6df5aa0.png

token-to-char(token到单词)比例越高,处理成本也就越高。因此处理中文tokenize要比英文更贵

可以这样理解,token是大模型认识理解人类现实世界的方式。它非常简单,还能大大降低内存和时间复杂度。

但将单词token化存在一个问题,就会使模型很难学习到有意义的输入表示,最直观的表示就是不能理解单词的含义。

当时Transformers有做过相应优化,比如一个复杂、不常见的单词分为一个有意义的token和一个独立token。

就像annoyingly就被分成“annoying”和“ly”,前者保留了其语义,后者则是频繁出现。

这也成就了如今ChatGPT及其他大模型产品的惊艳效果,能很好地理解人类的语言。

至于无法处理单词反转这样一个小任务,自然也有解决之道。

最简单直接的,就是你先自己把单词给分开喽~

cf73ec75e8079fb8abe587679697021c.png

或者也可以让ChatGPT一步一步来,先tokenize每个字母。

5323def73b4f9d57951bd6634281dee6.png

又或者让它写一个反转字母的程序,然后程序的结果对了。(狗头)

3c9de149a3bbc93778e3369b18590729.png

不过也可以使用GPT-4,实测没有这样的问题。

4ff1247cd02c2f933a484c0bfab1767e.jpeg实测GPT-4

总之,token就是AI理解自然语言的基石。

而作为AI理解人类自然语言的桥梁,token的重要性也越来越明显。

它已经成为AI模型性能优劣的关键决定因素,还是大模型的计费标准。

甚至有了token文学

正如前文所言,token能方便模型捕捉到更细粒度的语义信息,如词义、词序、语法结构等。其顺序、位置在序列建模任务(如语言建模、机器翻译、文本生成等)中至关重要。

模型只有在准确了解每个token在序列中的位置和上下文情况,才能更好正确预测内容,给出合理输出。

因此,token的质量、数量对模型效果有直接影响

今年开始,越来越多大模型发布时,都会着重强调token数量,比如谷歌PaLM 2曝光细节中提到,它训练用到了3.6万亿个token。

以及很多行业内大佬也纷纷表示,token真的很关键!

今年从特斯拉跳槽到OpenAI的AI科学家安德烈·卡帕斯(Andrej Karpathy)就曾在演讲中表示:

更多token能让模型更好思考。

508c3fd2eb7baade9ba0b5567e1dc255.png

而且他强调,模型的性能并不只由参数规模来决定。

比如LLaMA的参数规模远小于GPT-3(65B vs 175B),但由于它用更多token进行训练(1.4T vs 300B),所以LLaMA更强大。

debbea13d47eb750637ac9c9c1f95d4c.png

而凭借着对模型性能的直接影响,token还是AI模型的计费标准

以OpenAI的定价标准为例,他们以1K个token为单位进行计费,不同模型、不同类型的token价格不同。

86f96bbfdb56872833d0bdb5841fa1a8.png

总之,踏进AI大模型领域的大门后,就会发现token是绕不开的知识点。

嗯,甚至衍生出了token文学……

6d83278d430c3090da0646c97c04bd99.png

不过值得一提的是,token在中文世界里到底该翻译成啥,现在还没有完全定下来。

直译“令牌”总是有点怪怪的。

GPT-4觉得叫“词元”或“标记”比较好,你觉得呢?

3342c75fbb752c298e9577eb1a625dba.png

参考链接:
[1]https://www.reddit.com/r/ChatGPT/comments/13xxehx/chatgpt_is_unable_to_reverse_words/
[2]https://help.openai.com/en/articles/4936856-what-are-tokens-and-how-to-count-them
[3]https://openai.com/pricing

「AIGC+垂直领域社群」

招募中!

欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群,一起学习、探索、创新AIGC!

请备注您想加入的垂直领域「教育」或「电商零售」,加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。

2fae829d9553a9baa542fd09d4382921.png

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/44494.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

吴恩达ChatGPT《LangChain for LLM Application Development》笔记

基于 LangChain 的 LLM 应用开发 1. 介绍 现在,使用 Prompt 可以快速开发一个应用程序,但是一个应用程序可能需要多次写Prompt,并对 LLM 的输出结果进行解析。因此,需要编写很多胶水代码。 Harrison Chase 创建的 LangChain 框…

国际海运出口的操作流程是怎样的?

国际海运运输因为方便快捷以及运费低等特点,一直以来是大多数外贸企业出口货物物流运输的首选,然而新进入外贸行业的朋友们,对于海运出口流程还不是很了解,今天箱讯小编就为大家来介绍下。 海运出口操作流程如下: 1、…

用Python赚钱的方法有哪些?

很多人想知道用Python赚钱的方法有哪些?Python很容易使用,应用性较强。可以通过使用Python开发小程序、抓取数据、游戏开发、兼职编程老师,发展副业的方式来赚钱。 用Python赚钱的方法: 1、某宝搜python程序      可以到某宝…

学python可以做什么兼职-Python兼职收入过万?用Python做项目真的这么赚钱吗?

今天给大家分享一下2位前辈业余接兼职做的一些Python项目。我在这里想说,无论你是自学还是进培训班,只要把Python学好,钱自然而来。 问:请问用Python可以接哪些兼职的活赚钱? 1兼职费用足够学费生活费 恰巧上学期间接过一些外…

Midjourney指令操作、promt框架、参数设置教程

引言:基于Chatgpt的应用如雨后春笋,这波浪潮正当时。最近在摸索图片生成有价值的应用场景,使用过程中整理了一些指令秘籍,一同分享出来。 1、原理 Midjourney的人工智能绘画技术基于GPT-3.5模型,使用了先进的神经网络…

Python 如何赚钱?学会我交给你的Python赚钱大法,就算是大学生,月入1W外快不在话下。

现在学python的人越来越多了,都说学python赚的钱多,那么问题来了,就是我学完Python赚不到钱怎么办? 或者说找不到Python赚外快的平台或方式,今天小编我分享我的Python赚钱大法,学完月入1W外快不在话下! …

实现财务自由 之 A 股上市公司的年报(年度财报)查阅查看、下载地址、以及下载的方法

实现财务自由 之 A 股上市公司的年报(年度财报)查阅查看、下载地址、以及下载的方法 目录 实现财务自由 之 A 股上市公司的年报(年度财报)查阅查看、下载地址、以及下载的方法 A 股上市公司年报,下载具体方法 1、打…

在 AI 上训练 AI:ChatGPT 上训练另一种机器学习模型

ChatGPT 可以像 Linux 终端一样运行,并在给出以下提示时返回执行结果。下面我来带大家操作起来。 文章目录 终端操作训练机器学习模型镜像演示 终端操作 输入:I want you to act as a Linux terminal. I will type commands and you will reply with wh…

【免费分享】chatgpt打造属于自己的AI口语私教,保姆级教程

随着人工智能技术的不断发展,AI口语学习已经成为了一种趋势。而如何打造一款自己的AI口语私教工具呢?本文将为大家介绍利用chatgpt api、百度翻译、腾讯智聆api、百度语音等技术,打造一款AI口语私教工具的步骤。 一、利用到的技术 1、chatg…

一分钟教会你ai文本工具如何使用

今天我要给大家推荐一些ai文本生成器!你知道吗,ai文本生成器是一个超厉害的东西,它可以帮助我们创作出令人惊叹的文章、故事和甚至是诗歌。不管你是一名作家、学生还是只是想要表达自己的创意,这些工具都会是你的绝佳助手&#xf…

巴比特 | 元宇宙每日必读:多个大模型官宣,马斯克、姚期智、杨立昆等共话AIGC,世界人工智能大会有哪些看点?...

摘要:据钛媒体报道,7月6日,2023世界人工智能大会(WAIC)在上海世博中心正式拉开帷幕。特斯拉CEO埃隆马斯克(Elon Musk),华为轮值董事长胡厚崑,微软全球资深副总裁、微软大…

对话算想未来创始人赵亚雄:希望做“为中国 AI 经济而生的 AWS”

本文约9000字,建议阅读10分钟“全球最聪明的人都在大模型创业,没人会禁受得住它的诱惑。” ChatGPT爆火,引得全世界为之疯狂,恍惚中一夜之间,人人都在讨论ChatGPT,所有大佬和资本纷纷涌进大模型。 上一次如…

真有意思,AI高引论文排行榜:OpenAI和DeepMind未进前十,旷视排第二?

文|丰色 发自 凹非寺源|量子位 哪些机构或国家(地区)发表的AI研究是最具影响力的? 为了弄清这个问题,美国Zeta Alpha平台统计了2020-2022三年之间全世界引用次数前100的AI论文,得出了一些很有意…

【SaaS播客】onboard20. 生成式AI AIGC:硅谷AI大牛、投资人、创业者眼里的机会与挑战

近期IT领域最火热的话题就是AIGC了,可以说是真正出圈了,这个词貌似是百度大力推广的;国际上用得更多的是Generative生成式AI。最近的热点是“真”智能聊天的产品chatGPT。我认为对上层产品而言最关键的是这2个里程碑: 20年中OpenAI推出GPT-3…

新华三眼中的AI天路

ChatGPT的火爆,在全球范围内掀起了新一轮的AI风暴。如今,各行各业都在讨论AI,各个国家都在密集进行新一轮的AI基础设施建设与技术投入。 但眼前的盛景并非突然到来,就拿这一轮大模型热潮来说,谷歌早在2018年底就发布了…

南京标志设计-logo设计(品牌形象核心部分)

标志设计,是表明事物特征的记号——它以单纯、显著、易识别的物象、图形或文字符号为直观语言,除标示什么、代替什么之外,还具有表达意义、情感和指令行动等作用。标志,作为人类直观联系的特殊方式,不但在社会活动与生…

Logo设计

Inkscape设计Logo 我根据自己名字的缩写(XY)设计了一个LOGO 1、添加文本 (1)单击左边工具“A“,在图纸上添加文本框,键盘输入“X”,在上方菜单栏调整自己想要的文本字体和大小(字…

愉快的logo设计

Description K理事长正在思考日本信息学奥林匹克竞赛选手的应援道具的logo问题。某天,K理事长突发奇想,想要设计一个用’J’,’O’,’I’三种文字环形排列的logo,意为希望选手能从JOI中收获快乐的意思。 (注&#xf…

只需轻松点两下,人人都会设计的 Logo 图!

点击上方“杰哥的IT之旅”,选择“置顶公众号” 干货、福利第一时间送达! 大家周末好,今天跟大家分享一些我近期收藏的帮你制作Logo的几个网站,如大家有需要,可通过如下几个网站进行设计制作哦~ 好了,下面直…

html5科技感logo,这些LOGO设计得太巧妙了!

这些创意满满的 LOGO你见过吗? 文章转载自:设计 ID:sheji0123 编辑:darlene7 哈喽大家好,我是设计君! 有时候灵感源自于生活 看下面这组LOGO就知道了 1、简化的鸽子 2、简化的犀牛 3、简化的马 4、还是简化…