GPT Prompt中英文token对比

点击↑上方↑蓝色“编了个程”关注我~

93cedb094308acfa93d30c006eb2ee3c.png

这是Yasin的第 93 篇原创文章

4e040f43a65f98a1519c312f4843a986.png

官方的token解释

->

Our models understand and process text by breaking it down into tokens. Tokens can be words or just chunks of characters. For example, the word “hamburger” gets broken up into the tokens “ham”, “bur” and “ger”, while a short and common word like “pear” is a single token. Many tokens start with a whitespace, for example “ hello” and “ bye”. The number of tokens processed in a given API request depends on the length of both your inputs and outputs. As a rough rule of thumb, 1 token is approximately 4 characters or 0.75 words for English text. One limitation to keep in mind is that your text prompt and generated completion combined must be no more than the model's maximum context length (for most models this is 2048 tokens, or about 1500 words). Check out our tokenizer tool to learn more about how text translates to tokens.

<-

翻译:

我们的模型通过将文本分解成标记来理解和处理文本。标记可以是单词或字符块。例如,“hamburger”这个单词被分解成“ham”、“bur”和“ger”三个标记,而像“pear”这样的短且常见的单词则是一个标记。许多标记以空格开头,例如“ hello”和“ bye”。

在给定的API请求中处理的标记数量取决于输入和输出的长度。作为一个粗略的经验法则,对于英语文本,1个标记大约等于4个字符或0.75个单词。需要记住的一个限制是,您的文本提示和生成的完成组合必须不超过模型的最大上下文长度(对于大多数模型,这是2048个标记,或约1500个单词)。请查看我们的分词器工具,以了解有关文本如何转换为标记的更多信息。

中文和英文token的对比

我们将上面两段话输入到官方的token解析器,发现英文只需要200个token:

323e933190aeaf935c55a16bdd4533ef.png

而中文的需要565个token:

0432a11aa021d3faee4abddeae1632c9.png

实际测了几段prompt,中文比英文要多2到3倍的token消耗。

中英文的理解能力对比

下面是我问Chat GPT的问题:

->

chat gpt在理解中文或英文的prompt上有什么差异吗,是不是使用英文的prompt效果会更好?

<-

Chat GPT回答: 作为一个基于GPT-4架构的AI,ChatGPT在处理不同语言的文本时,理解能力和效果主要取决于训练数据。在训练过程中,大量的英文文本被用于训练,因此对于英文的理解和生成能力相对较强。虽然它也可以理解和回应中文,但可能相对于英文来说,效果稍逊一筹。

总的来说,使用英文prompt可能会得到更好的效果,因为ChatGPT在处理英文文本方面拥有更丰富的训练数据和更强的能力。然而,如果您需要使用中文与其交流,ChatGPT仍然可以提供相对可靠的回应,但可能不如英文那么精确。

相当于训练数据决定了,英文会有更强的理解能力。

结论

综合来看,prompt使用英文会占用更少的token,有更强的理解能力。那么假如我们使用英文的prompt,但用户输入的中文的,Chat GPT也能更好地理解吗?

我们来测试一下,首先是中文版本的:

29b356733991887560e6136861d711f1.png

然后是英文版本:0463eee1f13e1860c0903676f3a7a2f0.png

可以看到还是能正常理解的。哪怕是对话上下文中全是英文,只要用户输入的中文,Chat GPT仍然可以用中文来进行回答。

809ad8178b5fff94a780d75fb6d34bba.png

综合来看,使用英文的prompt会更好。

0ac5f5106f88dc9bab602eb1ec55e72e.png

关于作者

我是Yasin,一个爱写博客的技术人

微信公众号:编了个程(blgcheng)

个人网站:https://yasinshaw.com

不用魔法和GPT账号的AI聊天机器人

bot.aichatroom.cn

欢迎关注这个公众号46af9074d791f3a55903b100e965a887.png

decbcf0d9a89bcd0bc493174965ab26a.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/10704.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

意大利宣布禁用ChatGPT,限制OpenAI处理本国用户信息

来源&#xff1a;学术头条 据路透社消息&#xff0c;意大利个人数据保护局&#xff08;Garante&#xff09;于当地时间 3 月 31 日宣布&#xff0c;即日起禁止使用聊天机器人 ChatGPT&#xff0c;并限制 OpenAl 处理意大利用户信息。 Garante 表示&#xff0c;OpenAl “必须在 …

揭秘ChatGPT背后天价超算!上万颗英伟达A100,烧光微软数亿美元

【导读】ChatGPT背后&#xff0c;是微软超级昂贵的超级计算机&#xff0c;耗资数亿美元&#xff0c;用了英伟达数万颗芯片。 ChatGPT能成为如今火遍全球的顶流模型&#xff0c;少不了背后超强的算力。 数据显示&#xff0c;ChatGPT的总算力消耗约为3640PF-days&#xff08;即…

上海大学计算机体系结构实验四 HPL安装和测试(虚拟机centos7.6环境下保姆级教程!)

上海大学计算机体系结构实验四 HPL安装和测试&#xff08;虚拟机centos7.6环境下保姆级教程&#xff01;&#xff09; CSDN上的安装测试有很多&#xff0c;但在实际安装过程中经常碰到博客的教程缺了中间的某个指令&#xff0c;或者漏了某个配置&#xff08;写的不完全&#x…

OpenAI新上线GPT太强了,服务器瞬间挤爆,马斯克:你们太沉迷了

点击上方“AI遇见机器学习”&#xff0c;选择“星标”公众号 重磅干货&#xff0c;第一时间送 来自&#xff1a;机器之心 试着和 ChatGPT 聊了几句&#xff0c;它把我的问题解决了。 当每个人都在苦苦等待 GPT-4 发布时&#xff0c;OpenAI 却一直迟迟没有消息&#xff0c;仍在修…

Exception in thread “main“ java.net.SocketException: Connection reset

Exception in thread “main” java.net.SocketException: Connection reset 在做网络相关的东西时可能会遇到类似于这种连接错误的信息&#xff0c;我这里遇到了一个&#xff0c;以下是错误代码 问题重现&#xff0c;以及修复和分析 //简单的客户端 public class Center {pu…

pycharm远程连接服务器,并单步调试服务器上的代码

每天都有不同的朋友来Push我 那如果比较健忘的话&#xff0c;为啥不问一下chatGPT呢 问题的缘由在我想在本地单步调试代码。。。 我的代码完全在云端服务器的&#xff0c;还有数据集都是&#xff0c;但实际上本地代码可以通过pycharm给他传上去。 但是在后面配置的时候需要两…

复旦团队发布类ChatGPT模型MOSS,服务崩掉后并给出回复

这条路径的走通&#xff0c;为国内学术界和产业界提供了重要经验。 整理自&#xff1a;上观新闻、IT之家 进NLP群—>加入NLP交流群 ChatGPT发布以来&#xff0c;基于指令学习技术的类ChatGPT模型在我国能否开发成功&#xff0c;成为业界关注的一个焦点。今天&#xff0c;解放…

chatgpt是什么软件

ChatGPT是一款基于自然语言处理技术开发的聊天机器人软件&#xff0c;它通过与用户的交互&#xff0c;为用户提供有关各种主题的答案和解决方案。这款软件可以称为是一种智能机器人&#xff0c;它可以理解自然语言、识别语义、自主学习和适应&#xff0c;为用户提供与人类一样的…

微信小程序获取绑定授权用户手机号getPhoneNumber-全流程及手机号带*号问题

微信小程序获取微信绑定授权手机号getPhoneNumber全流程及出现手机号带*号问题详解 微信小程序文档中给出如下示例 获取微信用户绑定的手机号&#xff0c;需先调用login接口。 因为需要用户主动触发才能发起获取手机号接口&#xff0c;所以该功能不由API来调用&#xff0c;需…

微信登录与绑定方案

登录方案一&#xff08;与绑定方案一致&#xff09; 微信登录方案二 方案一&#xff1a; 优点&#xff1a;方便测试&#xff0c;与绑定流程基本一致&#xff0c;开发成本低&#xff0c;风险低 缺点&#xff1a;未关注的用户需点击关注后方可知道是否登录成功 方案二&#xff1a…

Android第三方绑定微信登录详解

微信登录官方文档地址&#xff1a;点击进入 一、准备工作 在进行微信登录之前&#xff0c;首先要在微信开放平台注册开发者账号&#xff0c;并拥有一个已审核通过的移动应用&#xff0c;并获得相应的AppID和AppSecret&#xff0c;申请微信登录且通过审核后&#xff0c;可开始接…

互联网新时代要来了(二)什么是AIGC?

什么是AIGC&#xff1f; 最近&#xff0c;又火了一个词“**AIGC”**2022年被称为是AIGC元年。那么我们敬请期待&#xff0c;AIGC为我们迎接人工智能的下一个时代。 TIPS:内容来自百度百科、知乎、腾讯、《AIGC白皮书》等网页 什么是AIGC&#xff1f; 1.什么是AIGC&#xff1f…

浏览器增强版ChatGPT无敌了?超强插件Monica,能聊能写效率Max

【导读】Chrome最强插件Monica来了&#xff01;网页版ChatGPT&#xff0c;解决一切工作问题。 提起Monica&#xff0c;你会想到什么&#xff1f; 是老友记里的主角之一MonicaGeller&#xff0c;一个热心肠的女主人形象&#xff1b;还是心跳文学部里的疯疯癫癫的Monika&#…

ChatGPT插件大爆炸 所有人都可以使用OpenAI插件的时代来了

OpenAI放出大招&#xff0c;本周将向所有ChatGPT Plus用户开放联网功能和众多插件&#xff0c;允许ChatGPT访问互联网并使用70个第三方插件。 根据华尔街见闻的梳理&#xff0c;本批第三方插件能够全方位覆盖衣食住行、社交、工作以及学习等日常所需&#xff0c;基本上能够扮演…

ChatGPT插件系统正式开放,不用写代码,人人都是程序员

整理 | 褚杏娟、核子可乐、凌敏 当地时间 3 月 23 日&#xff0c;OpenAI 宣布正式上线了以安全为核心的 ChatGPT 插件系统。OpenAI 插件将 ChatGPT 连接到第三方应用程序&#xff0c;之后 ChatGPT 便能够与开发人员定义的 API 进行交互&#xff0c;从而增强 ChatGPT 的功能并允…

ChatGPT竟有9岁小孩心智?斯坦福教授逆天发现,AI统治人类还远吗

【导读】一位斯坦福教授在上周发布的论文中证实&#xff0c;ChatGPT已经有9岁小孩的心智了。所以&#xff0c;AI离发展出自我意识还远吗&#xff1f;人类的霸主地位危了&#xff1f; ChatGPT已经有9岁小孩的心智了&#xff01; 这不是什么科幻情节&#xff0c;这一点&#xf…

你以为ChatGPT真的听懂了你的话吗?

1/6、多年以后…… 多年以后&#xff0c;面对长长的领失业救济金队伍&#xff0c;人们将会回想起2022年12月&#xff0c;不是因为大感染&#xff0c;而是初次体验ChatGPT。那时&#xff0c;人们感受到的&#xff0c;还不是旧世界的行将崩塌&#xff0c;而是对新世界到来的惊叹。…

Python量化交易09——使用证券宝获取金融行情数据(baostock)

接上一篇文章介绍怎么用Tushare获取日k数据后&#xff0c;本章教大家怎么用证券宝获取数据. baostock 的官网链接&#xff1a;A股K线数据 - www.baostock.com 这是免费的一个库&#xff0c;数据种类也很很丰富&#xff0c;挺好用的。 日K 导入包&#xff1a; import baost…

HFTrader高频交易系统架构

HFTrader高频交易系统架构 一、开发环境搭建 HFTrader高频交易系统作为QuantFabric量化交易系统的一部分&#xff0c;开发环境搭建与开源QuantFabric量化交易系统相同。 二、HFTrader高频交易系统架构 1、HFTrader功能特性 HFTrader期货功能特性如下&#xff1a; 期货行情…