关于即将发布的内容,OpenAI 官方帖子提供的唯一细节是,此次发布将更新 ChatGPT 及其最新模型 GPT-4。
OpenAI 员工程博文(Bowen Cheng)跟了个帖,「比 gpt-5 更酷」,不过又迅速删帖。
OpenAI 的葫芦里到底卖的什么药?据 The information 报道,OpenAI 开发了一款 AI 语音助手,具有音频输入、音频输出功能和更好的推理能力,甚至在某些方面击败了 GPT-4 Turbo。该 AI 语音助手很可能就在周一的这场直播中公开亮相。
不管怎样,OpenAI 此番举动着实吊足大众胃口。
OpenAI 计划推出 AI 语音助手
据 The information 报道,OpenAI 正在构建一款 AI 语音助手,它能通过声音和文本与人类对话,并能识别物体和图像。据两位接触过这项新 AI 的人士透露,ChatGPT 的开发者已经向一些客户展示了部分功能,这些功能在逻辑推理方面超越了其现有产品。
OpenAI 首席执行官 Sam Altman 的目标是最终开发出可高度响应的人工智能,类似于电影《她》(Her)中的虚拟助手,提升苹果 Siri 等现有语音助手的可用程度。一名知情人士表示,这个 AI 语音助手可能会在 OpenAI 周一的直播中公开亮相,赶在谷歌发布一系列 AI 产品之前抢得先机。
OpenAI 认为,具备视觉和音频能力的智能助手拥有与智能手机相媲美的变革性潜力。理论上它能够做到当前无法做到的事情,比如充当学生的家庭教师,辅助撰写论文或解决数学难题,或者翻译交通标识、指导解决汽车故障等。
OpenAI 已经推出具备音频转录、文本转语音等功能的软件,不过这些功能是基于独立的对话 AI 模型实现,而新的语音助手则将这些功能整合在一起,使其在图像和音频理解方面更胜一筹,并且速度更快。
目前尚不清楚 OpenAI 何时会将这些新功能提供给付费客户,但知情人士透露,这些功能将被纳入 ChatGPT 的免费版本中,旨在使其运行成本低于 GPT-4 Turbo。该人士还表示,AI 语音助手在回答****某些类型的问题上表现优于 GPT-4 Turbo,但仍存在「幻觉」。
OpenAI 可能会在今年年底发布 GPT-5
其实,利用 AI 开发强大的助手,谷歌早有此想法。去年 12 月,谷歌发布了一则 Gemini 的视频,它能够实时响应人的语音命令,并识别出人正在看的图像。然而,谷歌后来解释说,这些功能需要研究人员用图像和文本指令提示模型,而不是视频中演示的简单对话。而 OpenAI 推出语音助手主要为了「狙击」谷歌、苹果。
不得不说,OpenAI 上新的速度太快了。
除了即将发布的具有音频和视觉功能的模型外,OpenAI 一直计划推出 AI 搜索引擎,旨在与谷歌竞争。此外,OpenAI 还在开发一种被称为「计算机使用 Agent」的自动化软件,可以加速软件开发和其他基于计算机的任务。
更重要的是,GPT-5 也在马不停蹄地研发中。据一位与 OpenAI 领导层讨论过此事的人士表示,OpenAI 可能会在今年年底完成 GPT-5 并公开发布。
总结
很期待今天晚上OpenAI的发布会,不知道明天又有多少行业又会迎来新的机会。
身处在这样一个波澜壮阔,人工智能每天都在迅猛发展,各种大模型能力和工具层次不穷,我真的是非常兴奋和激动。
不管OpenAI即将发布什么样的功能,毋庸置疑一定是优先开放给ChatGPT Plus用户使用的。
具体升级教程参考:国内升级GPT-4 教程,订阅GTP4.0。。