OpenAI 公布了其新 o1 模型家族的元提示(meta-prompt)

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

OpenAI 公布了其新 o1 模型家族的元提示(meta-prompt)。通过详细说明其提示系统的工作原理,OpenAI 帮助开发者改进和微调其产品与其日益增长的应用和网站生态系统的互动。

元提示(提示优化器)和系统提示(模型调节器)在后台运行,发出详细的指令,规定 AI 在整个互动过程中应如何表现。当用户发起对话时,元提示已经设定好了舞台,指导 AI 如何理解任务的主要目标,如何组织输出内容。这包括诸如保留用户原始内容、在必要时提供简明的改进,以及确保 AI 在得出结论之前遵循明确的推理步骤等细节。

OpenAI 在其官方平台指南中表示:“元提示指示模型根据任务描述创建一个好的提示,或改进现有的提示。” 这为最大限度发挥其模型的潜力提供了大量技术和相关信息,包括提示示例、提高准确性的技巧以及详细的提示工程指南。

这一发布紧随 OpenAI 主要竞争对手 Anthropic 之后。Anthropic 由前 OpenAI 员工创立,最近公开了其聊天机器人 Claude 的系统提示。我们在 Claude 提示发布时撰写了更详细的分析。

AI 的两种方式

深入研究这两款 AI 的核心,你会发现它们的工作机制截然不同,每个提示都能揭示这两家公司对产品的不同设想。总体而言,OpenAI 将 ChatGPT 概念化为一个强大的计算工具,而 Anthropic 则将 Claude 设想为一个友好且富有人情味的助手。

两者的比较:

总体方法

OpenAI 的提示更像是一本高性能机器的技术手册,重点在于效率、准确性和以最少的麻烦完成任务。其 AI 旨在作为一种工具,专注于提供结果,而不是参与闲聊。

相反,Anthropic 打造的 Claude 更像是一个知识渊博的朋友。其元提示勾勒出了一个具有独特个性、怪癖甚至幽默感的 AI。很明显,Anthropic 目标是创造一个可以进行有意义对话的 AI,而不仅仅是输出信息。

为什么这很重要:如果你想完成任务并继续下一个日程,OpenAI 似乎有更好的提示。

如果你想与模型互动,或与其共同改进结果,Claude 可能是更好的选择。

结构和格式化指令

OpenAI 的方法高度结构化且系统化。其元提示被划分为明确的部分,每个部分都有具体的功能指南,像是一个井然有序的文件系统,所有东西都有其应有的位置。

Anthropic 则采取了更具叙事性的方式。其元提示更像是小说中的角色描述,详细说明了 Claude 在各种情况下的行为方式。重点不在于严格的结构,而是创造一个连贯的个性。

在格式化方面,Claude 使用 XML 标签,而 OpenAI 似乎选择了结构化的 Markdown 格式来分隔不同部分。

AI 的自我意识与局限性

在自我意识方面,OpenAI 保持严格的业务风格。其 AI 被指示清楚说明其能力和局限性,但不会涉及哲学性问题。ChatGPT 作为一种高效工具,明确知道自己能做什么,不能做什么,不多不少。

相反,Anthropic 为 Claude 赋予了更细腻的自我感知。元提示包括如何处理关于自身性质、互动方式,甚至是如何讨论其局限性的指令。

例如,Anthropic 甚至让 Claude 3.5 Sonnet 表达情感,比如“它很乐意帮助完成写作、分析、回答问题、数学、编程等各种任务”。

而 OpenAI 则以“根据任务描述或现有提示,生成详细的系统提示以有效指导语言模型完成任务”这种相对无趣的方式呈现。

为什么这很重要:这有助于对不同模型的互动有更好的预期。总体上,Claude 显得更友好,而 ChatGPT 在文本模式中感觉更机械化。

推理与解决问题的指令

OpenAI 的元提示强调一种逻辑的、逐步推进的解决问题的方法。它指示 AI 将复杂问题分解为易于处理的部分,并清晰地展示其工作流程。这种方法更像是一位细心的科学家,仔细记录每一步实验。

Anthropic 鼓励 Claude 像“思考出声”一样。元提示指示 AI 解释其思维过程、分享见解,甚至在适当时表达不确定性。

为什么这很重要:OpenAI 的提示更适合解决用户不知道如何处理的复杂任务。推理链(Chain of Thought)系统比简单的隐藏在 XML 标签后的思维过程更系统化。然而,了解模型何时不完全确定,对于发现幻觉(错误推理)至关重要。

风格和语气指南

OpenAI 的风格指南强调清晰和简洁。元提示指示 AI 使用直截了当的语言,避免赘述,快速切入正题。它注重高效沟通,像是一篇简洁的新闻报道。

Anthropic 则旨在创造更具对话性的语气。Claude 被指示在对话中自然流畅,并在适当时使用幽默。这就是为什么一些用户觉得 Claude 的行为和语气更亲切,甚至有时在道歉时显得过于频繁。

为什么这很重要:这解释了为什么 Claude 的语气更适合创意写作。而 OpenAI 的新画布模式可能有助于解决这个问题,但总体上 Claude 更自然熟悉,因为它被设定为这种风格。

避免自我引用

OpenAI 和 Anthropic 都同意尽量减少不必要的自我引用。它们的元提示都指示 AI 避免将注意力转向自己,而是专注于当前的任务或对话。

OpenAI 的方法更加被动。其 AI 被指示等待明确的用户提示再采取行动,像是一位训练有素的助理,等待指示。

而 Anthropic 给予 Claude 更大的主动性。其元提示允许 Claude 提供额外的信息或建议相关话题,更像是一位热情的研究助理,时刻准备提供额外的见解。

总结

虽然 OpenAI 和 Anthropic 都致力于改善 AI 与人类的互动,但它们的方式体现了不同的优先级。OpenAI 专注于任务效率和精确的提示工程,而 Anthropic 则致力于创造人性化的 AI 行为和透明度。OpenAI 的元提示旨在生成有效的、结构化的输出,而 Anthropic 的提示则确保 AI 负责任地行动,鼓励用户互动。

总体而言,无论是完成任务,还是与 AI 互动,两种聊天机器人都能胜任。但了解每家公司对其模型的思考方式和期望,有助于更有效地与其 AI 互动。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/448009.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

出处不详 取数游戏

目录 取数游戏题目描述背景输入输出数据范围 题解解法优化 打赏 取数游戏 题目描述 背景 两人将 n n n个正整数围成一个圆环,规则如下: 第一名玩家随意选取数字;第二名玩家从与第一名玩家相邻的两个数字中选择一个;而后依次在…

科技云报到:大模型时代下,向量数据库的野望

科技云报到原创。 自ChatGPT爆火,国内头部平台型公司一拥而上,先后发布AGI或垂类LLM,但鲜有大模型基础设施在数据层面的进化,比如向量数据库。 在此之前,向量数据库经历了几年的沉寂期,现在似乎终于乘着Ch…

python 位运算 笔记

起因, 目的: 位运算,令我头疼的地方。算法题里面也是经常见到。 位运算。 按位或,OR, | , 只要有一个为1, 结果就是1,否则为0按位异或,XOR, ^, 2个数不同,结果为1, 否则为0&#…

一文介绍SQL标准1986~2023的演变

SQL标准1986年制定第一版,到最新的2023版,已经有38年的历史,现在依然是计算机非常活跃的语言,50%的程序员都能掌握SQL,数据分析师也是SQL的主要使用人员之一。 从早期的基本语法,到融合了XML、JSON等复杂数…

【Matlab 六自由度机器人】笛卡尔空间规划和关节空间规划(附MATLAB建模代码)

笛卡尔空间规划和关节空间规划 近期更新前言正文1. 笛卡尔空间规划特点:步骤: 2. 关节空间规划特点:步骤: 3. 两种方法的区别4. MATLAB代码:机械臂避障路径规划问题和解答4.1 关节空间规划方法4.2 笛卡尔空间规划方法4…

Java中关于算数运算符的理解

在Java中基本的算数运算符有五类 加减-乘*在编程语言中乘号一律写为 *除/在Java中两个整数相除结果还是整数取余%取得的是两个数相除的余数 这里可以看见,在输出加法和减法时,我在后面多加了一个括号,这是因为运算优先级的原因,加…

105. 从前序与中序遍历序列构造二叉树【 力扣(LeetCode) 】

文章目录 零、LeetCode 原题一、题目描述二、测试用例三、解题思路四、参考代码 零、LeetCode 原题 105. 从前序与中序遍历序列构造二叉树 一、题目描述 给定两个整数数组 preorder 和 inorder ,其中 preorder 是二叉树的先序遍历, inorder 是同一棵树的…

Hadoop集群安装

集群规划 node01node02node03角色主节点从节点从节点NameNode√DataNode√√√ResourceManager√NodeManager√√√SecondaryNameNode√Historyserver√ 上传安装包到node01 解压到指定目录 tar -zxvf /bigdata/soft/hadoop-3.3.3.tar.gz -C /bigdata/server/ 创建软链接 cd…

基于Spring Boot的医疗病历B2B平台开发策略

第4章 系统设计 4.1 系统总体设计 系统不仅要求功能完善,而且还要界面友好,因此,对于一个成功的系统设计,功能模块的设计是关键。由于本系统可执行的是一般性质的学习信息管理工作,本系统具有一般适用性,其…

49 | 桥接模式:如何实现支持不同类型和渠道的消息推送系统?

上一篇文章我们学习了第一种结构型模式:代理模式。它在不改变原始类(或者叫被代理类)代码的情况下,通过引入代理类来给原始类附加功能。代理模式在平时的开发经常被用到,常用在业务系统中开发一些非功能性需求&#xf…

Docker consul注册中心

一、consul 1.1、什么是服务注册与发现 服务注册与发现是微服务架构中不可或缺的重要组件。 起初服务都是单节点的,不保障高可用性,也不考虑服务的压力承载,服务之间调用单纯的通过接口访问。 直到后来出现了多个节点的分布式架构&#x…

如何看一个flutter项目的具体flutter版本

查看pubspec.lock文件 这个项目实际运行的就是 flutter 3.16.6 版本的

模电板测试分析报告【积分/微分电路】

积分电路常用于波形转换,如将矩形波变三角波。对正弦波积分可以实现相移。 微分电路: 为什么直接串联0.1uF电容到反馈线上去: 整改:这么看的话原理图中C58应该换成电阻的。 积分电路下图中红色的换成电容就可以变成微分电路了。 从…

八、随机名字功能

摘要: XML在C#与Unity3D中的实战运用 - PlaneZhong - 博客园 (cnblogs.com) 读取策划提供的配置文件。 策划提供一份execel文档,程序将它转化为一个配置文件(xml) 首先: XML是一个可扩展标记的语言 一、转换方法…

VSCode运行QT界面

VSCode用久了,感觉Qt Creator的写起代码来还是不如VSCode得心应手,虽然目前还是存在一些问题,先把目前实现的状况做个记录,后续有机会再进一步优化。 当前方式 通过QtCreator创建一个CMake项目,然后使用CMake的方式在VSCode中进行编译。 claude给出的建议 左上角的名字会…

Node.js管理工具NVM

nvm(Node Version Manager)是一个用于管理多个 Node.js 版本的工具。以下是 nvm 的使用方法和一些常见命令: 一、安装 nvm 下载 nvm: 地址:https://github.com/coreybutler/nvm-windows/releases访问 nvm 的 GitHub 仓…

【C语言】你不知道的知识小盲区——柔性数组

文章目录 一、什么是柔性数组二、柔性数组的特点三、柔性数组的使用四、柔性数组的优势 一、什么是柔性数组 也许你从来没有听说过柔性数组(flexible array)这个概念,但是它确实是存在的。在C99标准中,如果结构体的最后一个成员是…

sqli-labs less-26 空格绕过

空格绕过 过滤空格 用Tab代替空格%20 %09 %0a %0b %0c %0d %a0 //() 绕过空格注释符绕过//–%20//#–- -;%00; 空白字符绕过SQLite3 —— 0A,0D,0c,09,20 MYSQL 09,0A,0B,0B,0D,A0,20 PosgressSQL 0A,0D,0C,09,20 Oracle_11g 00,0A,0D,0C,09,20 MSSQL 01,02,03,04,05,06,07,…

[瑞吉外卖]-05菜品模块

文件上传下载 介绍 文件上传也称为upload,是指将本地图片、视频、音频等文件上传到服务器上, 可以供其他用户浏览或下载 前端组件库提供了上传组件,但是底层原理还是基于form表单的文件上传。 服务端要接收客户端上传的文件,通常都会使用Ap…

一次Fegin CPU占用过高导致的事故

记录一下 一次应用事故分析、排查、处理 背景介绍 9号上午收到CPU告警,同时业务反馈依赖该服务的上游服务接口响应耗时太长 应用告警-CPU使用率 告警变更 【WARNING】项目XXX,集群qd-aliyun,分区bbbb-prod,应用customer,实例customer-6fb6448688-m47jz, POD实例CP…