当地时间周二(3月14日),人工智能研究公司OpenAI公布了其大型语言模型的最新版本---GPT-4.0。该公司表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。
OpenAI表示,在内部评估中,GPT-4产生正确回应的可能性要比GPT-3.5高出40%。而且GPT-4是多模态的,同时支持文本和图像输入功能。GPT-4比以前的版本“更大”,这意味着其已经在更多的数据上进行了训练,并且在模型文件中有更多的权重,这使得它的运行成本更高,目前只针对Puls用户开放。
在某些情况下,GPT-4比之前的GPT-3.5版本有了巨大改进,新模型将产生更少的错误答案,更少地偏离谈话轨道,更少地谈论禁忌话题,甚至在许多标准化测试中比人类表现得更好
提炼要点:
-
GPT4是大型多模态模型(接受图像和文本输入,输出文本)
-
文本输入已经开放给ChatGPT Plus用户
-
API目前只支持文本输入,但是需要先加入等待列表。定价为每1000个提示令牌0.03美金,每1000个完成令牌0.06美金。默认速率限制为每分钟40k令牌和每分钟200个请求
-
图片输入目前还在研究预览阶段,尚未向公众开放。可以通过Be My Eyes的APP提前体验,不过也需要先加入等待列表
-
开源了 OpenAI Evals收集模型反馈,针对高质量反馈,会优先开放API权限
对于一些专业性的考试和需要具备一定研究能力的领域,GPT4都有了相对于ChatGPT的非常大的提升
OpenAI 表示,新系统可以在美国 41 个州和地区的统一律师资格考试 (UBE) 中获得前 10% 左右的成绩。根据该公司的测试,它还可以在 SAT 考试中获得 1300 分 (满分 1600 分),在高中生参加的大学生物、微积分、宏观经济学、心理学、统计学和历史先修课程考试中获得 5 分 (满分 5 分)。
以下是GPT4参加多种专业性考试的得分,考试类型从法律到GRE再到奥赛,基本都是取得了很高的分数,GRE考试甚至取得了169分
在随意对话中,GPT-3.5 和 GPT-4 之间的区别可能很微妙。当任务的复杂性达到足够的阈值时,区别就会显现出来——GPT-4 比 GPT-3.5 更可靠、更有创造力,并能够处理更多细微的指令。
发布会直播上,OpenAI总裁Gregman现场表演了一波GPT-4给代码修Bug。
出现问题啥也不用想,直接把1万字的程序文档一股脑扔给GPT-4就行。格式也不用管,你只需要Ctrl+A、Ctrl+C、Ctrl+V
虽然GPT-4这波能力大升级,但之前ChatGPT会出现幻觉、胡说八道的毛病还是没能完全改掉。
但无论如何,这一次,我们离真·人工智能,更近了一步。