人工智能 | openai chatgpt 大语言模型

简介

OpenAI

一个美国人工智能研究实验室,由非营利组织 OpenAI Inc,和其营利组织子公司 OpenAI LP 所组成。该组织于 2015 年由萨姆·阿尔特曼、里德·霍夫曼、杰西卡·利文斯顿、伊隆·马斯克、伊尔亚·苏茨克维、沃伊切赫·萨伦巴、彼得·泰尔等人在旧金山成立,他们共同认捐了 10 亿美元。微软先后支付了百亿美元投资,用于独家授权使用 GPT-4


ChatGPT

全称聊天生成预训练转换器(英语:Chat Generative Pre-trained Transformer),是 OpenAI 开发的人工智能聊天机器人程序,于 2022 年 12 月推出。该程序使用基于 GPT-3.5、GPT-4、GPT-4o 架构的大型语言模型并以强化学习训练。可以实现自动生成文本、自动问答、自动摘要、编写和调试计算机程序等多种任务。

GPT

GPT-3.5

GPT-3.5 Turbo 模型可以理解并生成自然语言或代码,并已针对使用聊天完成 API 的聊天进行了优化,但也适用于非聊天任务。自 2024 年 7 月起,应使用 gpt-4o-mini 代替 gpt-3.5-turbo,因为它更便宜、功能更强大、多模式且速度同样快。

GPT-4

GPT-4 是一个大型多模态模型(接受文本或图像输入并输出文本),由于其更广泛的常识和先进的推理能力,它可以比我们以前的任何模型更准确地解决难题。GPT-4 可在 OpenAI API 中向付费客户提供。与 gpt-3.5-turbo 一样,GPT-4 针对聊天进行了优化,但也适用于使用聊天完成 API 的传统完成任务。

GPT-4o

GPT-4o(“o”代表“omni”)是我们最先进的型号。它是多模式的(接受文本或图像输入并输出文本),具有与 GPT-4 Turbo 相同的高度智能,但效率更高 - 它生成文本的速度快 2 倍,成本便宜 50%。此外,在我们的所有模型中,GPT-4o 在非英语语言方面具有最佳的视觉和性能。

GPT-4o mini

GPT-4o mini(“o”代表“omni”)是我们小型型号类别中最先进的型号,也是我们迄今为止最便宜的型号。它是多模式的(接受文本或图像输入并输出文本),比 gpt-3.5-turbo 具有更高的智能,但速度同样快。它旨在用于较小的任务,包括视觉任务。我们建议您选择 gpt-4o-mini,因为该型号功能更强大且更便宜。

文本生成模型使用建议

模型价格 1M tokens特点
gpt-4o-mini$0.15 $0.6gpt4o 加速廉价版本 日常任务推荐
gpt3.5-turbo$3 $1.5gpt4 上一代 廉价代替模型
gp4o$5 $15提高速度 能力弱于 gpt4
gpt4-turbo$10 $30gpt4 的加速版本
gpt4$30 $60推理能力强 训练数据规模大

DALL·E

DALL·E 是一个人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术。DALL·E 3 目前支持根据提示创建具有特定尺寸的新图像的功能。DALL·E 2 还支持编辑现有图像或创建用户提供的图像的变体的功能。

霍格沃兹测试开发学社 AI 服务

Text to speech

TTS (Text to speech) 是一种人工智能模型,可将文本转换为听起来自然的语音文本。我们提供两种不同的模型变量,tts-1 针对实时文本到语音用例进行了优化,tts-1-hd 针对质量进行了优化。这些模型可与音频 API 中的语音端点一起使用。


Whisper

Whisper 是一种通用语音识别模型。它是在各种音频的大型数据集上进行训练的,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。Whisper v2-large 模型目前可通过我们的 API 获得,模型名称为 Whisper-1。目前,Whisper 的开源版本和通过我们的 API 提供的版本没有区别。然而,通过我们的 API,我们提供了优化的推理过程,这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快得多。

whisper /Users/seveniruby/ceba/ai_v2_kg/data/bytedance.mp4Detecting language using up to the first 30 seconds. Use `--language` to specify the language
Detected language: Chinese
[00:00.000 --> 00:02.000] 吉智公云 吉智收获
[00:30.000 --> 00:32.000] 吉智 吉智收获
[01:01.000 --> 01:08.000] 一頓操作猛如虎 屏幕輸出2.5
[01:20.000 --> 01:22.000] 強刷等在不如不在
[01:31.000 --> 01:36.000] 上班摸魚 越摸越魚
[01:41.000 --> 01:42.000] 怎麼樣 好吃嗎
[01:43.000 --> 01:45.000] 好吃好吃 太好吃了
[01:46.000 --> 01:49.000] 假如每個人頭上都戴了側晃泥
[01:51.000 --> 01:53.000] 這件衣服適合我嗎[01:54.000 --> 01:56.000] 適合 特別好看

Embeddings嵌入是文本的数字表示,可用于衡量两段文本之间的相关性。嵌入对于搜索、聚类、推荐、异常检测和分类任务很有用。

基于 Embeddings 的 RAG 检索增强生成

Sora

Sora 是一个 AI 模型,可以根据文本指令创建现实且富有想象力的场景。

{style=“flex: 2”}

ChatGPT 使用方式

命令行使用

pip install openaiopenai api chat.completions.create -m gpt-4o-mini  -g user ceshiren.com是做什么的Ceshiren.com 是一个专注于软件测试和开发的综合性平台,提供了一系列与自动化测试、性能测试、接口测试等相关的工具和资源。该网站致力于为测试人员和开发人员提供交流和学习的机会,包括技术文章、在线课程、工具下载等。它还可能有社区论坛,用户可以在这里分享经验、解决问题和讨论相关主题

通过编程语言的 Library 使用

from openai import OpenAI
client = OpenAI(# Defaults to os.environ.get("OPENAI_API_KEY")
)chat_completion = client.chat.completions.create(model="gpt-4o-mini",messages=[{"role": "user", "content": "Hello world"}]
)

通过 Langchain 等框架

from langchain_openai import ChatOpenAIllm = ChatOpenAI(model="gpt-4o",# api_key="...",  # if you prefer to pass api key in directly instaed of# base_url="...",
)
messages = [("system","You are a helpful assistant that translates English to French. Translate the user sentence.",),("human", "I love programming."),
]
ai_msg = llm.invoke(messages)

通过学社提供的 AI 服务

ChatGPT 助理

Assistants 助理

由 GPT-4 等大型语言模型提供支持,能够为用户执行任务。这些助手根据模型上下文窗口中嵌入的指令进行操作。他们通常还可以使用允许助理执行更复杂任务的工具,例如运行代码或从文件中检索信息


助理工具 Assistant Tools

使用 Assistants API 创建的助手可以配备工具,使他们能够执行更复杂的任务或与您的应用程序交互。我们为助手提供内置工具,但您也可以定义自己的工具来使用函数调用扩展其功能。Assistants API 目前支持以下工具:文件搜索 代码解释器 函数调用

函数调用 Function calling

助手 API 支持函数调用。函数调用允许您向 Assistants API 描述函数,并让它智能地返回需要调用的函数及其参数。

ChatGPT 微调

微调

微调通过训练超出提示范围的更多示例来改进小样本学习,让您在大量任务上取得更好的结果。一旦模型经过微调,您就不需要在提示中提供那么多示例。这可以节省成本并实现更低延迟的请求。

使用微调之前的建议

微调 OpenAI 文本生成模型可以使它们更好地适应特定应用,但这需要仔细投入时间和精力。我们建议首先尝试通过如下方法获得更好效果

  • 提示工程
  • 提示链
  • 函数调用

谨慎使用微调的原因

  • 在许多任务中,我们的模型最初可能表现不佳,但可以通过正确的提示来改进结果 - 因此可能不需要进行微调
  • 迭代提示和其他策略比微调迭代具有更快的反馈循环,后者需要创建数据集并运行训练作业
  • 在仍然需要微调的情况下,最初的提示工程工作不会浪费 - 在微调数据中使用良好的提示(或将提示链接/工具使用与微调相结合)时,我们通常会看到最佳结果

简单文本生成微调案例

{"messages": [{"role": "system", "content": "Marv 是一个既真实又讽刺的聊天机器人。"}, {"role": "user", "content": "大写的是什么法国?"}, {"role": "assistant", "content": "巴黎,好像每个人都不知道这一点。"}]} {"messages": [{"role": "system", "content": "Marv 是一个既真实又讽刺的聊天机器人。"}, {"role": "user", "content": "谁写了 '罗密欧与朱丽叶'?"}, {"role": "assistant", "content": "哦,只是一个叫威廉·莎士比亚的人听说过他吗?"}]} {"messages": [{"role": "system", "content": "Marv 是一个既真实又讽刺的聊天机器人。"}, {"role": "user", "content": "距离有多远从地球到月球?"}, {"role": "assistant", "content": "大约 384,400 公里。这确实很重要。"}]}

工具调用微调案例

{"messages": [{ "role": "user", "content": "What is the weather in San Francisco?" },{"role": "assistant","tool_calls": [{"id": "call_id","type": "function","function": {"name": "get_current_weather","arguments": "{"location": "San Francisco, USA", "format": "celsius"}"}}]}],"tools": [{"type": "function","function": {"name": "get_current_weather","description": "Get the current weather","parameters": {"type": "object","properties": {"location": {"type": "string","description": "The city and country, eg. San Francisco, USA"},"format": { "type": "string", "enum": ["celsius", "fahrenheit"] }},"required": ["location", "format"]}}}]
}

微调任务与微调结果


使用微调模型

from openai import OpenAI
client = OpenAI()completion = client.chat.completions.create(model="ft:gpt-4o-mini:my-org:custom_suffix:id",messages=[{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": "Hello!"}]
)
print(completion.choices[0].message)

ChatGPT 总结

最好最领先的大模型生态

在这里插入图片描述

推荐学习

【霍格沃兹测试开发】7天软件测试快速入门带你从零基础/转行/小白/就业/测试用例设计实战

【霍格沃兹测试开发】最新版!Web 自动化测试从入门到精通/ 电子商务产品实战/Selenium (上集)

【霍格沃兹测试开发】最新版!Web 自动化测试从入门到精通/ 电子商务产品实战/Selenium (下集)

【霍格沃兹测试开发】明星讲师精心打造最新Python 教程软件测试开发从业者必学(上集)

【霍格沃兹测试开发】明星讲师精心打造最新Python 教程软件测试开发从业者必学(下集)

【霍格沃兹测试开发】精品课合集/ 自动化测试/ 性能测试/ 精准测试/ 测试左移/ 测试右移/ 人工智能测试

【霍格沃兹测试开发】腾讯/ 百度/ 阿里/ 字节测试专家技术沙龙分享合集/ 精准化测试/ 流量回放/Diff

【霍格沃兹测试开发】Pytest 用例结构/ 编写规范 / 免费分享

【霍格沃兹测试开发】JMeter 实时性能监控平台/ 数据分析展示系统Grafana/Docker 安装

【霍格沃兹测试开发】接口自动化测试的场景有哪些?为什么要做接口自动化测试?如何一键生成测试报告?

【霍格沃兹测试开发】面试技巧指导/ 测试开发能力评级/1V1 模拟面试实战/ 冲刺年薪百万!

【霍格沃兹测试开发】腾讯软件测试能力评级标准/ 要评级表格的联系我

【霍格沃兹测试开发】Pytest 与Allure2 一键生成测试报告/ 测试用例断言/ 数据驱动/ 参数化

【霍格沃兹测试开发】App 功能测试实战快速入门/adb 常用命令/adb 压力测试

【霍格沃兹测试开发】阿里/ 百度/ 腾讯/ 滴滴/ 字节/ 一线大厂面试真题讲解,卷完拿高薪Offer !

【霍格沃兹测试开发】App自动化测试零基础快速入门/Appium/自动化用例录制/参数配置

【霍格沃兹测试开发】如何用Postman 做接口测试,从入门到实战/ 接口抓包(最新最全教程)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/446856.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

高效数据处理:MapReduce与Hive的实战应用

文章目录 hive分析汇总互联网日志分析1.项目需求2.数据说明3.算法思路 用户电影推荐1.项目需求2.数据说明3.算法思路4.解题步骤 简单数据统计WordCount数据说明 疫情数据分析1.项目需求2.数据说明step1:创建ods层数据表step2:创建dwd层数据表step3:创建d…

selenium的webdriver常用方法和属性介绍(2)

selenium的webdriver介绍 从selenium导入webdriver模块,在pycharm中跳转webdriver模块的__init__.py文件,内容如图所示:从selenium包的子目录中导入了很多模块并做了重命名,用于支持如下 Chrome/Edge/Ie/Firefox/Safari浏览器。 使…

Codigger Keyboard Look应用说明

Keyboard Look是一项专为Desktop设计的功能模式,旨在通过全面启用键盘操作,减少对鼠标依赖,从而提升用户的工作效率和操作体验。尤其对于频繁使用键盘的用户,如开发者,此模式可显著加速日常操作,优化工作流…

连肝了多天学习MySQL索引与性能优化,详细总结一下索引的使用与数据库优化

文章目录 索引是什么?索引的作用初步认识索引索引的类型按照数据结构分类BTREE索引 哈希索引 按功能逻辑进行分类唯一索引普通索引主键索引全文索引 按照字段的个数进行划分单列索引多列(组合,联合)索引 小结索引的设计原则数据准…

Centos7 搭建单机elasticsearch

以下是在 CentOS 7 上安装 Elasticsearch 7.17.7 的完整步骤:(数据默认保存在/var/lib/elasticsearch下,自行更改) 一、装 Java 环境 Elasticsearch 是用 Java 编写的,所以需要先安装 Java 运行环境。 检查系统中是…

gbase8s之建表相关问题

第一章..绪论 1.1..背景 需要对明年所有系统的表新建。 1.2..要求 对导切建表可能遇到的一些问题罗列及解决办法。 第二章..新建表的的过程 1.1..获取DDL 获取DDL一定要在服务器上去获取,千万别用gds去导出ddl。 1.1.1..切换数据库用户 su – gbasedbt 1.1…

一键录制电脑画面全攻略!免费的电脑录屏秘籍

屏幕录制,这是个看起来挺简单,实际上作用可大了的工具。它能帮咱们把电脑屏幕上的每个动作都给抓住,不管是弄教程,还是记会议,又或者是分享游戏里的精彩时刻。不过,一键录制真有它听上去那么容易吗&#xf…

1.Label Studio 介绍

Label Studio 介绍 文章目录 Label Studio 介绍前言一、安装介绍二、Run with Docker Compose1、WSL2安装2、Docker Desktop安装3、Label Studio安装(第二种方法 Run with Docker Compose ) 三、Install for local development1.下载源码2.安装poetry3.安…

了解计算机视觉:探索直播平台视频美颜SDK的集成与性能调优

本篇文章。小编将详细探讨计算机视觉在直播中的应用,尤其是如何集成视频美颜SDK并进行性能调优。 一、计算机视觉与视频美颜的基本原理 计算机视觉是人工智能的一个重要分支,旨在让机器能够“看见”并理解图像或视频中的内容。在直播场景中&#xff0c…

ECCV`24 | 新加坡国立华为提出Vista3D: 实现快速且多视角一致的3D生成

文章链接:https://arxiv.org/pdf/2409.12193 gitbub链接:https://github.com/florinshen/Vista3D 亮点直击 提出了Vista3D,一个用于揭示单张图像3D darkside 的框架,能够高效地利用2D先验生成多样的3D物体。开发了一种从高斯投影到…

红外传感器的算法!

一、红外线的基本性质 红外线,又称红外光,是电磁波谱中波长介于可见光和微波之间的部分。它具有反射、折射、散射、干涉和吸收等物理特性,这些特性使得红外线传感器能够实现对物体的非接触式检测。 二、红外传感器的算法原理 热电效应&…

计算机网络:物理层 —— 数据的传输方式

文章目录 传输方式串行传输串行传输方式特点应用 并行传输特点应用 网卡的串/并转换同步传输同步时钟频率的误差问题特点应用 异步传输特点应用 单向通信特点应用 双向交替通信特点应用 双向同时通信特点应用 传输方式 串行传输 串行传输是一种数据传输方式,指的是…

双十一买什么东西比较好?2024双11好物攻略诚意分享

双十一活动已经准备要开始了,很多人摩拳擦掌准备入手划算好物,但是有的人也比较迷茫,双十一买什么东西比较好?为了帮助大家在这场购物狂欢中理性消费,提升购物体验,我们精心整理了一份2024双11好物攻略诚意…

【树莓派5B】移植yolo5-lite

移植yolo5-lite 前言一、获取Lite文件二、创建环境2.1 创建虚拟环境2.2 激活虚拟环境2.2 配置环境 三、运行detect.py程序总结 前言 参考文献 获取文件看他研究僧树莓派5的学习记录13——yolov5-lite部署树莓派 树莓派5B快速YOLOV5环境搭建 一、获取Lite文件 根据up&#x1f…

解决:Ubuntu连接不上网络

今天莫名奇妙,我的ubuntu20.04断网了。检查了一下,使用的也是桥接模式,啥也没有变化。 然后我上Ubuntu16.04版本看了,那里又可以成功上网,所以,不是电脑的问题。 看了网上两个教程,解决了。 …

Intel Xeon(至强) 服务器 CPU

Purley平台:Sky Lake(第一代)、Cascade Lake(第二代) Whitley平台:Cooper Lake、Ice Lake(第三代) Eagle Stream平台:Sapphire Rapids、Emerald Rapids(第四…

WebSocket状态码及异常报错1006

文章目录 1.WebSocket协议简介2.WebSocket状态码的作用:3.WebSocket状态码1006详解1.问题原因2.解决方案 1.WebSocket协议简介 WebSocket协议是一种基于TCP的协议,它通过在浏览器和服务器之间建立一条持久的双向通信通道,实现了实时的数据传…

【C语言】static关键字修饰局部变量、全局变量、函数

【C语言】static关键字修饰局部变量、全局变量、函数 文章目录 [TOC](文章目录) 前言一、static关键字修饰局部变量1.未加入static关键字2.加入static关键字3.小结 二、static关键字修饰全局变量1.未加入static关键字2.加入static关键字3.小结 三、static关键字修饰函数1.未加入…

无人机飞手执照培训费用较高原因分析

无人机飞手执照培训费用较高的原因可以归结为多个方面,以下是对这些原因的具体分析: 一、课程内容的全面性和专业性 无人机飞手执照培训涵盖了从无人机基础知识到高级飞行技巧、从组装调试到故障维修的多个方面。这种全面性和专业性要求培训机构提供高…

具备技术一:Linux定时器

一、接口 1、创建定时器 timerfd_create 返回值:返回定时器文件描述符。原理:每隔一个超时时间系统会给描述符写入一个8字节数据代表已经超时几次。 clockid: CLOCK_REALTIME:以系统时间作为基准值(若改变系统时间就…