LLMs:OpenAI官方重磅更新——新增GPT-3.5Turbo调和API更新功能

LLMs:OpenAI官方重磅更新——新增GPT-3.5Turbo调和API更新功能

导读:2023年8月22日,OpenAI官方发布,开发者现在可以使用自己的数据定制适用于其用例的GPT-3.5 Turbo模型。GPT-3.5 Turbo的微调现在已经可用,GPT-4的微调将在今年秋季推出。此更新使开发者能够定制模型,以便为其用例提供更好的性能,并在规模上运行这些定制模型。初步测试显示,经过微调的GPT-3.5 Turbo版本在某些狭窄任务上可以与基础GPT-4水平的能力相匹配,甚至表现更好。与我们所有的API一样,发送到微调API的数据由客户拥有,不会被OpenAI或任何其他组织用于训练其他模型。

目录

微调用例

微调步骤

步骤1,准备您的数据

步骤2,上传文件

步骤3,创建微调作业

步骤4,使用经过微调的模型

安全性

定价

更新后的GPT-3模型


博客文章地址:GPT-3.5 Turbo fine-tuning and API updates

微调指南地址:https://platform.openai.com/docs/guides/fine-tuning

微调用例

自GPT-3.5 Turbo发布以来,开发者和企业一直在寻求将模型定制为为其用户创建独特和差异化的体验的能力。通过此发布,开发者现在可以运行监督式微调,以使该模型在其用例中表现更佳。

在我们的私人测试版中,微调客户已经能够在常见用例中显著提高模型性能,例如:
>> 改进的可控性:微调使企业能够更好地遵循指示,例如使输出更简洁或始终以给定语言回复。例如,开发者可以使用微调来确保模型在使用德语提示时始终以德语回复。
>> 可靠的输出格式:微调提高了模型一致格式化响应的能力 - 这对于需要特定响应格式的应用程序(如代码补全或组合API调用)来说是至关重要的。开发者可以使用微调来更可靠地将用户提示转换为可与其自己的系统一起使用的高质量JSON片段。
>> 定制音调:微调是磨练模型输出的定性感觉(如其音调)的好方法,使其更符合企业品牌的声音。具有可辨识品牌声音的企业可以使用微调使模型更符合其音调的一致性。

除了提高性能外,微调还使企业能够在确保类似性能的情况下缩短提示。使用GPT-3.5 Turbo进行微调还可以处理4k个标记 - 是我们先前微调模型的两倍。早期测试者通过将指令微调为模型本身,将提示大小缩小了高达90%,加快了每个API调用的速度并降低了成本。

当与提示工程,信息检索和函数调用等其他技术结合使用时,微调效果最佳。请查看我们的微调指南以了解更多信息。对于使用函数调用和gpt-3.5-turbo-16k进行微调的支持将在今年秋季后期推出。

微调步骤

步骤1,准备您的数据

{"messages": [{ "role": "system", "content": "You are an assistant that occasionally misspells words" },{ "role": "user", "content": "Tell me a story." },{ "role": "assistant", "content": "One day a student went to schoool." }]
}

步骤2,上传文件

curl https://api.openai.com/v1/files \-H "Authorization: Bearer $OPENAI_API_KEY" \-F "purpose=fine-tune" \-F "file=@path_to_your_file" 

步骤3,创建微调作业

curl https://api.openai.com/v1/fine_tuning/jobs \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{"training_file": "TRAINING_FILE_ID","model": "gpt-3.5-turbo-0613"
}'

一旦模型完成微调过程,它就可以立即在生产中使用,并具有与基础模型相同的共享速率限制。

步骤4,使用经过微调的模型

curl https://api.openai.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{"model": "ft:gpt-3.5-turbo:org_id","messages": [{"role": "system","content": "You are an assistant that occasionally misspells words"},{"role": "user","content": "Hello! What is fine-tuning?"}]
}'

我们还将在不久的将来推出微调用户界面,开发者可以更轻松地访问有关进行中的微调作业,已完成的模型快照等信息。

安全性

对我们来说,微调的部署非常重要。为了通过微调过程保留默认模型的安全功能,微调训练数据会通过我们的Moderation API和由GPT-4提供支持的调节系统进行传递,以检测与我们的安全标准冲突的不安全训练数据。

定价

微调成本分为两部分:初始培训成本和使用成本:
>> 训练:$0.008 / 1K个标记
>> 使用输入:$0.012 / 1K个标记
>> 使用输出:$0.016 / 1K个标记

例如,对于一个训练文件为100,000个标记的gpt-3.5-turbo微调作业,经过3轮训练,预期成本为$2.40

更新后的GPT-3模型

在7月份,我们宣布原始的GPT-3基础模型(ada,babbage,curie和davinci)将于2024年1月4日关闭。今天,我们将babbage-002和davinci-002作为这些模型的替代品提供,可以作为基础模型或微调模型。客户可以通过查询Completions API来访问这些模型。

这些模型可以使用我们的新API端点/v1/fine_tuning/jobs进行微调。此新端点提供分页和更多的可扩展性,以支持微调API的未来发展。从/v1/fine-tunes转换为更新的端点非常简单,更多详细信息可以在我们的新微调指南中找到。这会停用旧的/v1/fine-tunes端点,将在2024年1月4日关闭。

基础模型和微调GPT-3模型的定价如下:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/119308.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【算法与数据结构】106、LeetCode从中序与后序遍历序列构造二叉树

文章目录 一、题目二、解法三、完整代码 所有的LeetCode题解索引,可以看这篇文章——【算法和数据结构】LeetCode题解。 一、题目 二、解法 思路分析:首先我们要知道后序遍历数组的最后一个元素必然是根节点,然后根据根节点在中序遍历数组中的…

【LeetCode-中等题】994. 腐烂的橘子

文章目录 题目方法一:bfs层序遍历 题目 该题值推荐用bfs,因为是一层一层的感染,而不是一条线走到底的那种,所以深度优先搜索不适合 方法一:bfs层序遍历 广度优先搜索,就是从起点出发,每次都尝…

Android GB28181客户端开发(1):GB28181协议简介

Android GB28181客户端开发(1):GB28181协议简介 公共安全视频监控联网系统信息传输、交换、控制技术要求(2016版) 源码请翻到文章结尾 介绍GB28181协议 GB28181协议是一种基于IP网络的远程视频监控系统,它定义了设备之间的通信协议和数据格式。GB28181协议的主要特点是支…

【Rust】001-基础语法:变量声明及数据类型

【Rust】001-基础语法:变量声明及数据类型 文章目录 【Rust】001-基础语法:变量声明及数据类型一、概述1、学习起源2、依托课程 二、入门程序1、Hello World2、交互程序代码演示执行结果 3、继续上难度:访问链接并打印响应依赖代码执行命令 三…

Collections和CollectionUtils集合操作

0.引入依赖 <dependency><groupId>org.apache.commons</groupId><artifactId>commons-collections4</artifactId><version>4.4</version> </dependency> 一.Collections用法&#xff1a; 01、排序操作 reverse(List list)…

【摆烂之小左】Maven配置IDEA教程

Maven是什么 Maven项目对象模型(POM)&#xff0c;可以通过一小段描述信息来管理项目的构建&#xff0c;报告和文档的项目管理工具软件。 Maven 除了以程序构建能力为特色之外&#xff0c;还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性&#xff0c;所以常…

数学建模:模糊综合评价分析

&#x1f506; 文章首发于我的个人博客&#xff1a;欢迎大佬们来逛逛 数学建模&#xff1a;模糊综合评价分析 文章目录 数学建模&#xff1a;模糊综合评价分析综合评价分析常用评价方法一级模糊综合评价综合代码 多级模糊综合评价总结 综合评价分析 构成综合评价类问题的五个…

go语言基础操作--二

a : 10str : "mike"//匿名函数&#xff0c;没有函数名字 形成一个闭包,函数定义&#xff0c;还没有调用f1 : func() { //:自动推到类型fmt.Println("a ", a)fmt.Println("str ", str)}f1()//给一个函数类型起别名 这个写法不推荐type FuncType …

Flutter状态管理 — 探索Flutter中的状态

前言 随着响应式编程的理念&Flutter被大众所了解以来&#xff0c;状态管理一直是一个引人深思的话题。如果想要学习好Flutter这样的响应式的编程框架就一定是离不开状态管理的。我遇到过很多没有了解过响应式编程框架的&#xff0c;或者从事后端开发&#xff0c;自己想用F…

docker笔记4:高级复杂安装-mysql主从复制

1.主从搭建步骤 1.1新建主服务器容器实例3307 docker run -p 3307:3306 --name mysql-master \ -v /mydata/mysql-master/log:/var/log/mysql \ -v /mydata/mysql-master/data:/var/lib/mysql \ -v /mydata/mysql-master/conf:/etc/mysql \ -e MYSQL_ROOT_PASSWORDroot \ -d…

Linux的目录结构特点

Linux的目录结构特点 1、使用树形目录结构来组织和管理文件。 2、整个系统只有一个根目录&#xff08;树根&#xff09;&#xff0c;Linux的根目录用“/”表示。 3、其他所有分区以及外部设备&#xff08;如硬盘&#xff0c;光驱等&#xff09;都是以根目录为起点&#xff0…

【已解决】激活虚拟环境报错:此时不应有Anaconda3\envs\[envs]\Library\ssl\cacert.pem。

新建虚拟环境后&#xff0c;进入虚拟环境的时候出现这样的报错&#xff1a; 此时不应有Anaconda3 envs yolov5 Library ssl cacert.pem。 但是之前装的虚拟环境也还能再次激活&#xff0c;base环境也无任何问题&#xff0c;仅新装的虚拟环境无法激活。 查遍了百度谷歌&#xff…

ThreadLocal源码剖析(简单理解)

Thread部分源码 public class Thread implements Runnable {ThreadLocal.ThreadLocalMap threadLocals null; }ThreadLocal源码,其中ThreadLocal有一个静态内部类ThreadLocalMap,这个Map不是类似二叉树类型的,只是一个普通数组,其中具体使用什么算法其实我也不太理解. 然后对…

通过ref 操作dom , 点击按钮后跳转到页面指定图片位置

滚动图片到视图 定义了一个名为 scrollToIndex 的函数&#xff0c;它接受一个参数 index。当按钮被点击时&#xff0c;这个函数会被调用&#xff0c;并根据传入的 index 值来滚动到对应的图片。 以 alt 来标记图片位置 alt“Tom” import { useRef } from "react";c…

1.(python数模)单函数读取常用文件

Python单函数读取常用文件 代码如下&#xff1a; import pandas as pd# 读取数据文件 def readDataFile(readPath): # readPath: 数据文件的地址和文件名try:if (readPath[-4:] ".csv"):dfFile pd.read_csv(readPath, header0, sep",") # 间隔符为逗…

I2C与I3C的对比

I2C与I3C的对比 电气特性 I2C 1.半双工 2.串行数据线(SDA)和串行时钟线(SCL) 3.数据线漏极开路&#xff0c;即I2C接口接上拉电阻 4.I2C总线运行速度&#xff1a;**标准模式100kbit/s&#xff0c;快速模式400kbit/s&#xff0c;快速模式plus 1Mbit/s&#xff0c;**高速模式…

机器学习:可解释学习

文章目录 可解释学习为什么需要可解释机器学习可解释还是强模型可解释学习的目标可解释机器学习Local ExplanationGlobal Explanation 可解释学习 神马汉斯&#xff0c;只有在有人看的时候能够答对。 为什么需要可解释机器学习 贷款&#xff0c;医疗需要给出理由&#xff0c;让…

无涯教程-JavaScript - WEIBULL函数

WEIBULL函数取代了Excel 2010中的WEIBULL.DIST函数。 描述 该函数返回威布尔分布。在可靠性分析中使用此分布,如计算设备的平均故障时间。 语法 WEIBULL(x,alpha,beta,cumulative)争论 Argument描述Required/OptionalXThe value at which to evaluate the function.Requir…

深入探讨Java虚拟机(JVM):执行流程、内存管理和垃圾回收机制

目录 什么是JVM&#xff1f; JVM 执行流程 JVM 运行时数据区 堆&#xff08;线程共享&#xff09; Java虚拟机栈&#xff08;线程私有&#xff09; 什么是线程私有? 程序计数器&#xff08;线程私有&#xff09; 方法区&#xff08;线程共享&#xff09; JDK 1.8 元空…

网络编程 day 5

1、根据select TCP服务器流程图编写服务器 #include <myhead.h>#define ERR_MSG(msg) do{\fprintf(stderr, "__%d__:", __LINE__); \perror(msg);\ }while(0)#define PORT 8888 //端口号&#xff0c;范围1024~49151 #define IP "192.168.…