OpenAI GPT-3模型详解

OpenAI GPT-3模型详解

针对文本生成和代码生成这两大类场景,OpenAPI分别提供了GPT-3Codex模型,

模型描述
GPT-3一组能够理解和生成自然语言的模型
Codex一组可以理解和生成代码的模型,包括将自然语言转换为代码

本文将为大家详细介绍这两个模型。

文章目录

    • 模型概述
      • GPT-3
        • Davinci
        • Curie
        • Babbage
        • Ada
      • Codex
    • API调用
      • Python库
      • Node.js库
    • 参数说明
    • 总结

模型概述

GPT-3

在这里插入图片描述

GPT-3模型可以理解并生成自然语言。OpenAI根据任务场景和功能强度提供了四种可选子模型。其中Davinci g功能最强大,而Ada 响应速度最快。

模型名称描述最大tokens训练数据
text-davinci-003最强大的GPT-3模型。
具有更高的输出质量、
更长的输出内容
和更好的语言理解能力。
还支持文本插入功能。
4,000 tokens截至2021年6月
text-curie-001功能强大,
但比Davinci速度更快,价格也更便宜。
2,048 tokens截至2019年10月
text-babbage-001能够完成简单任务,速度快,成本低。2,048 tokens截至2019年10月
text-ada-001能够完成非常简单的任务,
通常是GPT-3系列中速度最快的,成本最低的。
2,048 tokens截至2019年10月

尽管通常来讲Davinci最强大,但其他型号的模型在某些特定场景和任务下,具有明显的速度或成本优势。例如,Curie可以执行许多与Davinci相同的任务,但速度更快,成本仅为Davinci的1/10。

建议在实验时使用Davinci,因为它产生的结果最好。一旦实验完成,建议尝试一下其他模型的效果,看看是否能以更低的延迟或成本获得同样或近似的效果。同时还可以通过在特定任务上对其他模型进行微调来提高它们的性能。

Davinci

Davinci是GPT-3系列中最强大的模型,可以在很少指引的情况下完成其他模型能完成的任何任务。对于需要大量理解内容的应用,如针对特定受众的摘要生成和创造性内容生成,Davinci的产生效果最佳好。当然,这些优势需要更多的计算资源,因此Davinci每次API调用的成本更高,而且速度也不如其他模型。

Davinci的另一个亮点是理解文本的意图。Davinci非常擅长解决各种逻辑问题,并解释其中角色的动机。Davinci已经能够解决一些涉及因果关系的最具挑战性的人工智能问题。

擅长领域:复杂意图理解、因果关系发现及理解、针对性摘要总结

Curie

Curie也非常强大,同时速度也非常快。虽然Davinci在分析复杂文本时更具优势,但Curie在情感分类和总结摘要等许多细致任务上表现出色。Curie还非常擅长回答问题,因此非常适合作通用服务聊天机器人。

擅长领域:翻译、摘要、复杂分类、文本情感

Babbage

Babbage可以执行分类等简单任务。当涉及到语义搜索时,它也可以很好地对文档与搜索查询的匹配程度进行排序。

擅长领域:文本分类、语义搜索分类

Ada

Ada通常是速度最快的模型,可以执行解析文本、地址更正和粗放的分类任务。可以通过提供更多上下文来提升Ada的表现。

擅长:文本解析、简单分类、地址更正、关键字提取

⚠注意:高级模型都能完成低级模型能完成的任务,例如Ada能完成的工作,Curie和Davinci都能完成。

OpenAI模型是非确定性的,这意味着相同的输入可以产生不同的输出。将temperature 设置为0将使输出大部分具有确定性,但仍可能存在少量可变性。

Codex

在这里插入图片描述

Codex模型是GPT-3模型的派生模型,可以理解和生成代码。训练数据包含自然语言和来自GitHub的数十亿行公共代码。

Codex最擅长Python,并精通十几种语言,包括JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL,甚至Shell。

Open AI目前提供2种子模型:

模型名称描述最大请求训练数据
code-davinci-002最强大的Codex模型。
特别擅长将自然语言转译成代码。
除了完成代码外,还支持在代码补全。
8,000 tokens截至2021年6月
code-cushman-001几乎与Davinci Codex一样强大,但速度稍快。
这种速度优势可使其更适合于实时应用。
2,048 tokens

Codex目前尚处在公测阶段。公测期间免费调用,但是速度会受限制。推荐直接用最强的code-davinci-002

API调用

OpenAI API调用非常简单,官方提供Python和Node.js库。

Python库

Python库可以通过下面命令安装:

$ pip install openai

安装后即可在代码中通过导入openai库来调用各功能接口

import openaiopenai.api_key = "YOUR_API_KEY"response = openai.Completion.create(model="text-davinci-003", prompt="Hello", temperature=0, max_tokens=16
)

这里需要注意的是:调用接口需要先绑定OpenAI API Key。该API Key可以在OpenAI后台申请,点击右上角头像,在弹出菜单中点击”View API keys“。在API Keys管理界面可以创建或删除API Keys。

在这里插入图片描述

Node.js库

Node.js库的安装和使用步骤与Python库类似,在项目中运行

$ npm install openai

即可向项目中安装并添加openai库。安装完成后,即可在代码中调用

const { Configuration, OpenAIApi } = require("openai");
const configuration = new Configuration({apiKey: 'YOUR_API_KEY',
});
const openai = new OpenAIApi(configuration);
const response = await openai.createCompletion({model: "text-davinci-003",prompt: "Hello",temperature: 0,max_tokens: 16,
});

社区提供了其他所有主流编程语言的库,大家可以根据自己使用的语言,在这里查找。

参数说明

用API的一大好处是,API提供了众多参数,可以让我们控制输出效果。下面是GPT-3Codex模型支持的参数:

参数名类型默认值说明
modelstring模型名称(详见模型综述)
promptstring输入的提示
suffixstringnull文本生成后在文末插入的后缀
max_tokensint16文本生成时要生成的最大token数。
提示的token数加上max_tokens不能超过模型的上下文长度。
大多数模型的上下文长度为2048个token(最新模型支持4096 tokens)
temperaturefloat1采样温度。值越高意味着模型承担的风险越大。
对于需要创意的场景,可以尝试0.9,
对于答案明确的场景,建议用0(argmax采样)
建议不要与top_p同时改变。
详见《ChatGPT模型采样算法详解》
top_pfloat1核采样(温度采样的另一种方式),其中模型考虑具有top_p概率质量的token的结果。因此,0.1意味着只考虑包含最高10%概率质量的token
建议不要与temperature同时改变。
详见《ChatGPT模型采样算法详解》
nint1每个提示要生成多少个答案
streambooleanfalse是否返回流传输进度。如果设置,token将在可用时以纯数据服务器端推送事件发送,流以data:[DONE]消息终止。
logprobsintnul如果传值(最大值5)则表示包括logprobs个最可能的token以及所选令牌的对数概率。例如,如果logprobs为5,则API将返回包含5个最可能Token的列表。
echobooleanfalse是否回传提示
stopstringnull最多4个序列,遇到stopAPI将停止生成。
返回的文本不包含停止序列。
presence_penaltyfloat0数值介于-2.0和2.0之间。正值将根据到目前为止新token是否出现在文本中来惩罚新token,从而增加模型谈论新主题的可能性。
详见 《ChatGPT模型中的惩罚机制》
frequency_penaltyfloat0数值介于-2.0和2.0之间。正值根据文本中新token已经出现的频率惩罚新token,从而降低模型逐字重复同一行的可能性。
详见 《ChatGPT模型中的惩罚机制》
best_ofint1在服务端生成best_of个完成,并返回“最佳”(每个token的log概率最高的一条)。结果无法流式传输。
n一起使用时,best_of控制候选回应的数量,n指定要返回的数量–best_of必须大于等于n
⚠注意:由于此参数生成许多回应,因此会快速消耗token配额。小心使用并确保对max_tokensstop进行了合理的设置。
logit_biasmapnull修改回应种出现指定token的可能性。
接受一个json对象,该对象将token(由GPT tokenizer的token ID指定)映射到-100到100之间的相关偏差值。可以用 tokenizer tool 将文本转换成token ID。
在数学上,在采样之前,将偏差添加到模型生成的逻辑中。每个模型的确切效果会有所不同,但介于-1和1之间的值应该会降低或增加选择的可能性;像-100或100这样的值应该会导致相关token的禁用或必现。
例如,可以传递{"50256": -100}以防止生成`<
userstringnull代表终端用户的唯一标识符,OpenAI用来监控和检测滥用。

理解上述参数对文本生成任务的影响至关重要。其中最重要的一组参数是temperaturetop_ppresence_penaltyfrequency_penalty,详见《ChatGPT模型采样算法详解》 和 《ChatGPT模型中的惩罚机制》

总结

虽然GPT-3模型没有ChatGPT强大,但使用API有如下好处:

优点

  • 无需注册、直接使用
  • 有参数可以控制输出
  • 比ChatGPT稳定
  • 速度比ChatGPT快一点
  • 可以整合到其他系统中

缺点

  • 生成质量不如ChatGPT
  • 有限的上下文支持
  • 会产生费用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/17842.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vue3通透教程【十七】Vite构建TS版本Vue项目

文章目录 &#x1f31f; 写在前面&#x1f31f; 创建TS版本的Vue3项目&#x1f31f; 插件安装&#x1f31f; 写在最后 &#x1f31f; 写在前面 专栏介绍&#xff1a; 凉哥作为 Vue 的忠实 粉丝输出过大量的 Vue 文章&#xff0c;应粉丝要求开始更新 Vue3 的相关技术文章&#…

用 ChatGPT 重构工作流程

如果你第一次听说 ChatGPT&#xff0c;那你要反思一下自己的信息获取渠道是不是出了问题&#xff0c;作为 AI 时代最强代表&#xff0c;你一定要亲自去体验一下&#xff0c;而不是道听途说。 公司需要降本增效&#xff0c;个体也一样&#xff0c;在工作中畅快应用 AI 来帮助自己…

Qt:可视化UI设计

1、创建项目&修改组件的对象名字和显示文本内容 创建一个 Widget Application 项目类 QDialog&#xff0c;在创建窗体时选择基类 QDialog&#xff0c;生成的类命名为 QWDialog&#xff0c;并选择生成窗体。 在界面设计时&#xff0c;对需要访问的组件修改其objectName&am…

【Qt设计开发】GUI界面设计开发

文章目录 一、Qt简介和下载安装二、Qt入门2.1 创建第一个项目2.2 快捷键和命名规范2.3 Qt项目和VS2022项目相互转换 三、Qt基础3.1 Qt对象树和窗口坐标系概念3.2 QPushButton3.3 信号和槽(signals and slots)3.3.1 pushbutton关闭窗口3.3.2 自定义信号和槽 3.4 Lambda表达式3.5…

【饭谈】ChatGpt如果让软件ui都消失的话,那ui自动化测试该何去何从?

“未来的软件长什么样&#xff1f;” 一位妹子产品经理问我&#xff1a;“你说说未来的软件ui是什么样的&#xff1f;听到这个问题我先是诧异了一下&#xff0c;随即陷入了沉思。” 我看着眼前的产品经理&#xff0c;她是一位比较年轻干练的女强人类型&#xff0c;1.65的身材…

chatgpt赋能python:Python如何设计UI:最佳实践和关键洞察

Python如何设计UI&#xff1a;最佳实践和关键洞察 作为一种支持多种编程范式和用途的高级语言&#xff0c;Python已经成为了许多技术创造者和创业者的首选工具之一。但是&#xff0c;Python最初并不是为了动态用户界面&#xff08;Dynamic User Interface&#xff0c;简称UI&a…

基于Qt的ui图形化界面进行的界面设计

qt初学者往往会发现这样的一个问题——无论是我买的相关的书&#xff0c;还是网上博客的内容&#xff0c;基本全都是利用纯代码的形式来进行界面设计的。而初学者对各种控件的代码实现并不熟悉&#xff0c;往往在这里耗费大量时间。故本篇文章介绍了通过ui图形化界面进行设计的…

职场神器:只需三分钟,AI工具让我变成插画师

绘画技能 一般来说&#xff0c;搞技术的&#xff0c;写文章的&#xff0c;在绘画的这棵技能树上的加点往往都是零。 而且绘画和音乐这些技能往往是需要一定天赋的&#xff0c;它不像写代码和开挖机&#xff0c;后两者往往经过培训以后人人都能学会&#xff0c;而前两者没有一…

设计师与 ChatGPT 应该如何共处?

ChatGPT 的火爆&#xff0c;导致众多设计师开始忧心忡忡&#xff01; ChatGPT那么厉害&#xff0c;是不是设计师要被取代了&#xff1f;&#xff1f;? ChatGPT以及很多 AI 生成插画和图片的工具和软件&#xff0c;不仅为我们带来了惊喜&#xff0c;也让我们感受到了不少担忧!…

美国人真的开始害怕AI了

ChatGPT 发布半年后&#xff0c;人类终于意识到&#xff0c;世界已经彻底改变了。 这变化&#xff0c;比以往任何时候都更迅猛&#xff0c;更让人措手不及。 劳动者&#xff0c;学者&#xff0c;技术专家&#xff0c;NGO&#xff0c;政府&#xff0c;人们不得不作出应对。 这是…

三星引入ChatGPT半个月泄密3次;MidJourney V5相机镜头完整参数列表;万字长文,拆解投身大模型3个本质问题 | ShowMeAI日报

&#x1f440;日报&周刊合集 | &#x1f3a1;生产力工具与行业应用大全 | &#x1f9e1; 点赞关注评论拜托啦&#xff01; &#x1f916; 『三星引入 ChatGPT 半个月泄密三次』数据安全是个大问题啊&#xff01; 据韩国媒体报道&#xff0c;三星电子 (Samsung Electronics)…

2021高考成绩查询理综各科得分,2021河南高考总分及各科分数 满分分数是多少

河南高考试卷总分为750分&#xff0c;其中语文科目满分150分&#xff1b;数学科目满分150分&#xff1b;英语科目满分150分&#xff1b;文综和理综各自均为300分。 2021河南高考各科及满分分数设置考试科目顺序满分分数高考总分 语文150分750分 文数/理数150分 文综/理综300分 …

ChatGPT写的2023全国高考作文,什么水平?

2023年全国统一高考&#xff0c;1291万考生赶赴考场&#xff0c;高考语文科目考试结束后&#xff0c;备受关注的各地高考作文题目也已经新鲜出炉&#xff01; 随后&#xff0c;网上也掀起了用Chat-GPT写高考作文的热风&#xff0c;小编用全国甲卷做了尝试&#xff0c;以下是自…

恩平高考成绩查询2021,高考成绩放榜,恩平文理科这两名高分考生厉害了!

(来源&#xff1a;江门日报恩平记者站) 原标题&#xff1a;高考成绩放榜&#xff0c;恩平文理科这两名高分考生厉害了&#xff01; 2020广东高考放榜 今天下午 广东省高考成绩正式公布 文科本科线&#xff1a;430分理科本科线&#xff1a;410分 下面一起来看看 今年高考恩平文科…

数据分析2020年全国各省分高考成绩分布情况

开始 突发奇想&#xff0c; 想看下高考成绩的分布&#xff0c; 如果把每个省市的成绩划线成0-100 分会怎么样&#xff0c;简单的来说&#xff0c; 认为最高分的考了100分&#xff0c;最低分考了0分&#xff0c; 计算一下各个分数段的人数就好了&#xff0c; 顺便可以用这个数…

李开复:谈谈那些你不知道的人工智能!

https://www.toutiao.com/a6678214501399003655/ 创新工场董事长兼ceo李开复在清华大学做了名为《人工智能的黄金时代》的演讲。 在演讲中&#xff0c;李开复博士用简易的语言较为系统的介绍了人工智能&#xff0c;深度学习等概念&#xff0c;并且阐明了目前人工智能物质的问题…

李开复——人工智能领域的中坚力量

据英国《自然》杂志18日发表的论文报道&#xff0c;一款新版的“阿法狗”&#xff08;AlphaGo&#xff09;横空出世。这款名叫“阿法狗—零”&#xff08;AlphaGo Zero&#xff09;的新程序&#xff0c;以100比0的战绩打败了旧版“阿法狗”。再次引发了公众对于人工智能的热议。…

李开复:旗下AI公司或在2021年上市,估值至少10亿美元

人工智能技术的公司已经到了开花结果的时刻&#xff0c;用技术价值转换为商业价值的公司&#xff0c;一定是未来。 根据商业媒体网站 Bloomberg 报道&#xff0c;创新工场&#xff08;Sinovation Ventures&#xff09;董事长兼首席执行官李开复近日公开表示&#xff0c;他旗下…

李开复:李飞飞是人工智能的“良心”

李开复&#xff1a;李飞飞是人工智能的“良心” https://mp.weixin.qq.com/s/7mpIV902QYgcIkX3LM42Ww 【网易智能讯 10月22日消息】近日&#xff0c;李飞飞回归斯坦福大学之后&#xff0c;正式宣布启动以人为本人工智能项目&#xff0c;创建了以人为本人工智能研究院(Stanford …

“AI超人”李开复慢下来的投资节奏

https://www.toutiao.com/a6652888471444652547/ 2019-02-01 12:45:04 来源&#xff1a;投中网 作者&#xff1a;Michele “在AI崛起的时代里&#xff0c;如果只是守株待兔&#xff0c;等着那些超级模式撞到商业天才&#xff0c;碰撞出点子&#xff0c;正好敲到我们的门&…