吴恩达ChatGPT课爆火

点上方计算机视觉联盟获取更多干货


没想到时至今日,ChatGPT竟还会犯低级错误?

吴恩达大神最新开课就指出来了:

ChatGPT不会反转单词!

比如让它反转下lollipop这个词,输出是pilollol,完全混乱。

f531525f8d00a153b63ab29ff73926e4.jpeg

哦豁,这确实有点大跌眼镜啊。

以至于听课网友在Reddit上发帖后,立马引来大量围观,帖子热度火速冲到6k

959d40ba2b536c3f8f88d01fce119c6e.jpeg

而且这不是偶然bug,网友们发现ChatGPT确实无法完成这个任务,我们亲测结果也同样如此。

10d1a1e08c32f4fb0b21ffbb253986b3.jpeg

a51d60164791acf4c4be82ed165dbced.jpeg 实测ChatGPT(GPT-3.5)

甚至包括Bard、Bing、文心一言在内等一众产品都不行。

89f0e3fcfb80b3a0c42d43b1975e7fbf.jpeg 实测Bard
c516279c855f475f85692bf69cb97eb0.jpeg 实测文心一言

还有人紧跟着吐槽, ChatGPT在处理这些简单的单词任务就是很糟糕。

比如玩此前曾爆火的文字游戏Wordle简直就是一场灾难,从来没有做对过。

959e5ca19be1a6aedc103bc14d1edef6.jpeg

诶?这到底是为啥?

关键在于token

之所以有这样的现象,关键在于token。token是文本中最常见的字符序列,而大模型都是用token来处理文本。

它可以是整个单词,也可以是单词一个片段。大模型了解这些token之间的统计关系,并且擅长生成下一个token。

因此在处理单词反转这个小任务时,它可能只是将每个token翻转过来,而不是字母。

c26b45b677de6fd2dd5ce58b844c800f.jpeg

这点放在中文语境下体现就更为明显:一个词是一个token,也可能是一个字是一个token。

a4e4c7ad2e648aed51f6ea4848cb6057.jpeg

针对开头的例子,有人尝试理解了下ChatGPT的推理过程。

397ebe6f7d9c2bd28687ca7610681824.jpeg

为了更直观的了解,OpenAI甚至还出了个GPT-3的Tokenizer

afe16ce1f3924131ab73497ad352ff60.jpeg

比如像lollipop这个词,GPT-3会将其理解成I、oll、ipop这三个部分。

根据经验总结,也就诞生出这样一些不成文法则。

  • 1个token≈4个英文字符≈四分之三个词;

  • 100个token≈75个单词;

  • 1-2句话≈30个token;

  • 一段话≈100个token,1500个单词≈2048个token;

单词如何划分还取决于语言。此前有人统计过,中文要用的token数是英文数量的1.2到2.7倍

919a64c15b910431e1932f5f8b56234a.jpeg

token-to-char(token到单词)比例越高,处理成本也就越高。因此处理中文tokenize要比英文更贵

可以这样理解,token是大模型认识理解人类现实世界的方式。它非常简单,还能大大降低内存和时间复杂度。

但将单词token化存在一个问题,就会使模型很难学习到有意义的输入表示,最直观的表示就是不能理解单词的含义。

当时Transformers有做过相应优化,比如一个复杂、不常见的单词分为一个有意义的token和一个独立token。

就像annoyingly就被分成“annoying”和“ly”,前者保留了其语义,后者则是频繁出现。

这也成就了如今ChatGPT及其他大模型产品的惊艳效果,能很好地理解人类的语言。

至于无法处理单词反转这样一个小任务,自然也有解决之道。

最简单直接的,就是你先自己把单词给分开喽~

deddc63e9a0fc6d1a7272c0845c1c98d.jpeg

或者也可以让ChatGPT一步一步来,先tokenize每个字母。

4a46e14a854bea1913e362e529251b86.jpeg

又或者让它写一个反转字母的程序,然后程序的结果对了。(狗头)

717f5160d44d956aaf74333c61966204.jpeg

不过也可以使用GPT-4,实测没有这样的问题。

ead9f8b63a8ee393fc0efe82ff8fabb5.jpeg实测GPT-4

总之,token就是AI理解自然语言的基石。

而作为AI理解人类自然语言的桥梁,token的重要性也越来越明显。

它已经成为AI模型性能优劣的关键决定因素,还是大模型的计费标准。

甚至有了token文学

正如前文所言,token能方便模型捕捉到更细粒度的语义信息,如词义、词序、语法结构等。其顺序、位置在序列建模任务(如语言建模、机器翻译、文本生成等)中至关重要。

模型只有在准确了解每个token在序列中的位置和上下文情况,才能更好正确预测内容,给出合理输出。

因此,token的质量、数量对模型效果有直接影响

今年开始,越来越多大模型发布时,都会着重强调token数量,比如谷歌PaLM 2曝光细节中提到,它训练用到了3.6万亿个token。

以及很多行业内大佬也纷纷表示,token真的很关键!

今年从特斯拉跳槽到OpenAI的AI科学家安德烈·卡帕斯(Andrej Karpathy)就曾在演讲中表示:

更多token能让模型更好思考。

64950d6e5ed739d7e1d89c8f25e0d0c3.jpeg

而且他强调,模型的性能并不只由参数规模来决定。

比如LLaMA的参数规模远小于GPT-3(65B vs 175B),但由于它用更多token进行训练(1.4T vs 300B),所以LLaMA更强大。

ca5452e057a1540442841a2094d2a405.jpeg

而凭借着对模型性能的直接影响,token还是AI模型的计费标准

以OpenAI的定价标准为例,他们以1K个token为单位进行计费,不同模型、不同类型的token价格不同。

bd6bc4229c456666edef424357908797.jpeg

总之,踏进AI大模型领域的大门后,就会发现token是绕不开的知识点。

嗯,甚至衍生出了token文学……

d6eac90554f5f58499097e175c904920.jpeg

不过值得一提的是,token在中文世界里到底该翻译成啥,现在还没有完全定下来。

直译“令牌”总是有点怪怪的。

GPT-4觉得叫“词元”或“标记”比较好,你觉得呢?

6c2a2f120a87df5d77c52353d83a125c.jpeg

参考链接:
[1]https://www.reddit.com/r/ChatGPT/comments/13xxehx/chatgpt_is_unable_to_reverse_words/

[2]https://help.openai.com/en/articles/4936856-what-are-tokens-and-how-to-count-them
[3]https://openai.com/pricing

-------------------

END


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/4070.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT 爆火,社交应用如何 Get 新技能

风浪越大,鱼越贵。关注【融云全球互联网通信云】了解更多 现在,最大的浪无疑属于 ChatGPT,一款以对话方式进行交互的语言模型。 通过创新业务打下江山的商业传奇们,都怕跟丢了这波浪潮而成为“上一代人”。所以,我们…

什么是让ChatGPT爆火的大语言模型(LLM)

什么是让ChatGPT爆火的大语言模型(LLM) 更多精彩内容: https://www.nvidia.cn/gtc-global/?ncidref-dev-876561 文章目录 什么是让ChatGPT爆火的大语言模型(LLM)大型语言模型有什么用?大型语言模型如何工作?大型语言模型的热门应用在哪里可以找到大型语…

chat GPT已注册,还有40卢比

打开官网,注册chat GptopenAI 国外电话验证sms 真不错

ChatGPT 3分钟帮我生成一个网站(附演示动图和教程)

直接上图(为了演示方便生成一个简单网站,复杂网站也可以生成) 快照地址:https://7479037674-share.lightly.teamcode.com,打开可复制到自己的在线IDE-lightly中运行。 网站生成详细教程已经放到了我的知识星球了。下图…

向chatgpt提问最重要的技巧

如何理解 Prompt ? prompt 通常指的是一个输入的文本段落或短语,作为生成模型输出的起点或引导。prompt 可以是一个问题、一段文字描述、一段对话或任何形式的文本输入,模型会基于 prompt 所提供的上下文和语义信息,生成相应的输出…

通过python代码向chatGPT提问,并接受返回结果打印

由于科研需求 过程 结果 步骤: 1 申请API https://platform.openai.com/docs/api-reference/introduction 2 得到一个密钥 3 放到上面的python 代码 # -*- coding:utf-8 -*-f import requestsimport openaiopenai.api_key "sk-( 放自己的&am…

《如何向ChatGPT提问并获得高质量的答案》

24种标准的提问范式,获取高质量答案 关于作者 易卜拉欣约翰(Ibrahim John) 伊布拉欣约翰是《从ChatGPT获得高质量答案的艺术:提示工程技术的完整指南》一书的作者。 他出生于坦桑尼亚,是科技和商业领域的知名人物。…

【ChatGPT高端玩法】ChatGPT提问指令大全——7个常用提问模板(上)

系列文章目录 第一章 ChatGPT一分钟制作PPT 第二章 ChatGPT生成Excel统计格式 第三章 ChatGPT生成Excel提取字符公式 第四章 ChatGPT生成思维导图 第五章 ChatGPT快速生成短视频 第六章 ChatGPT提问指令大全——7个常用提问模板(上) 第七章 Chat…

自媒体作者如何向ChatGPT提问

如何向ChatGPT提问,获得高质量的回复?针对这个问题,小编进行了相关的测试,今天跟大家分享向ChatGPT提问的技巧。 以自媒体作者为例,不同平台具有不同的阅读习惯,当我们想要创作一篇小红书笔记,…

《如何向ChatGPT提问并获得高质量的答案》—Prompt技术的完整指南

本教程收集于:AIGC从入门到精通教程 目录 第1章:提示工程技术简介 第2章:说明提示技术(Instructions Prompt Technique)

如何更好地向 ChatGPT 提问?

在与 ChatGPT 进行交互时,如何提出更好的问题可以让你更快地获得更准确的答案。 清晰明了的问题陈述:要确保问题具有清晰、明了、毫不含混的特点,能够帮助ChatGPT更快地理解你的问题。 具体化的问题:要为问题提供上下文和细节&am…

向ChatGPT提问

你想了解ChatGPT吗? 你想向ChatGPT提问题吗? 你想知道它会怎么回答你吗? 欢迎关注我的微信公众号(技术修道场),并在公众号后台直接发送你想问的任何问题,或者直接在该文章下留言,…

ChatGPT 提问技巧

说明:该文章由AI自动生成,仅供参考。😄 在使用 ChatGPT 进行提问时,如何提出清晰、明确的问题,是一个非常重要的问题。下面介绍一些 ChatGPT 提问技巧,帮助您更好地提出问题,获得更准确、有用的…

Nature新规:用ChatGPT写论文可以,列为作者不行

詹士 发自 凹非寺量子位 | 公众号 QbitAI 面对ChatGPT,Nature终于坐不住了。 本周,这家权威学术出版机构下场,针对ChatGPT代写学研文章、被列为作者等一系列问题,给了定性。 具体来说,Nature列出两项原则: …

ChatGPT网站部署教程

实现效果 gpt聊天 mj绘画 vercel一键部署教程 Fork对应源码到自己的仓库 进入vercel容器准备一键部署 选择github登录 选择对应的github仓库

[最新搭建教程]0基础Linux CentOS7系统服务器本地安装部署ChatGPT模型服务搭建/免费域名绑定网页Https访问/调用open AI的API/GPT3/GPT3.5/GPT4模型接口

一、关于此文 本文介绍了如何克隆一个开源的项目,通过请求调用OpenAI ChatGPT模型接口,以使用ChatGPT的强大功能。相比于直接登录ChatGPT官网对话,此方法对话过程更为流畅,不会频频出现限流导致对话中断或网络异常;此…

【教程】ChuanhuChatGPT本地化部署支持多语言模型支持上传分析文档附件的GPT

原文:【教程】本地化部署支持多语言模型支持上传分析文档附件的GPT_腾讯新闻 说明 该项目要是为 ChatGPT API 和其他多种语言模型(Language Language Models,简称 LLM)提供一个用户友好的 Web 图形界面(GUI)。这个项目的 GUI 支…

中科院ChatGPT 学术版 本地部署实践记录

近期中科院ChatGPT 学术版 在github上限了,截止本文发布已经有18.3k的star了。 他们将ChatGPT 学术版开源出来真的非常好,能让更多的人享受到科技的红利。 我也想着试一下,这次也记录下本地部署的过程。 其实文件中的readme,已…

一键部署自己的ChatGPT

最近尝试了下ChatGPT-Next-Web项目,可以一键免费部署你的私人 ChatGPT 网页应用,整体过程非常丝滑,觉得有必要推荐给大家。 只要提供api key,即可在1分钟内完成一键部署。有自己的域名的话还可以无障碍访问和使用,速度…

5 种适合初学者尝试的使用聊天 GPT 的股票分析技术

如果您是股市新手,您可能想知道如何有效地分析股票。 幸运的是,借助 Chat GPT 等高级人工智能技术,您现在可以执行高级股票分析技术,帮助您做出更好的投资决策。 在本文中,我们将探索五种非常适合初学者的使用 Chat GPT 的股票分析技术。 1. 情感分析 情绪分析是一个强…