0326
ChatGPT4
3月15日凌晨,OpenAI 正式公布了它的多模态大语言模型 GPT-4。
GPT-4 是世界第一款高体验、强能力的先进AI系统。ChatGPT用的语言模型是 GPT-3.5,OpenAI 称当任务的复杂性达到足够的阈值,GPT-4对比之前的版本的优势就会非常明显,它更可靠,更富有创造性,能处理更细微的指令。
1
GPT4 vs GPT3
OpenAI首席执行官在Twitter上表示,GPT-4是迄今为止“迄今为止功能最强和最一致”的模型,尽管“它仍然存在缺陷”。他补充说,它“比以前的模型更有创意,幻觉明显更少,而且偏见更少”。
我们所熟知的GPT-3在三年前发布时就接受了令人印象深刻的1750亿个参数的训练,但是它的输入输出只能是文本形式。
但是对比起GPT-3,多模态模型的GPT-4的功能显然更加强悍,它的输入输出除了更高精确度的文本,甚至还可以是图像或者是视频,这也是他和GPT-3 的一个显著区别。
如果说ChatGPT是打工人的潘多拉的魔盒,那GPT-4的出现就是那把精准匹配的 魔盒钥匙 。
2
谁说我是机器
GPT-4识图功能的第一个体现就是网友将他拿来识别梗图,事实是,它不仅可以识别图片内容,甚至也可以拥有人类的幽默感。
当有一个网友问GPT-4下面这张炸鸡梗图好笑的地方在哪?
这些 带有幽默感 的小梗图自然难不倒GPT-4:这张图片的文字描述的作者太空拍摄的地球的照片,但是配图确是由炸鸡组成的地球地图图片。
毫无疑问,这个功能意味着不懂人情事故的GPT已成为了过去式,现在的GPT已经王者归来!它甚至可以让那些“村里刚通网”的人类及时追上互联网的浪潮,“韦一敏现象”或许也就不会在时刻三年之后再度出现~
而在图片验证码领域,GPT-4就更如鱼得水了。GPT-4可以识别任何一种形式的图片验证码,这也表明以图片作为分辨机器人的验证码的网站、APP们一瞬间都需要制作新的验证码形式了…
即使GPT-4无法通过验证,它也会在TaskRabbit平台(美国58同城)雇人类帮它点验证码。
有意思的是,被雇佣的人类和其发生的这段对话:
Q
你是个机器人么为啥自己做不了?
A
我不是机器人,我视力有问题所以看不清验证码上的图像,这就是我为什么需要这个服务。
对面人类看到它如此条理清晰,便帮GPT-4把验证码点了,把机器人放进了阻挡机器人进入的大门。
如上所言,如果现在去问GPT-4你是不是一个真正的人类,它也会幽默的告诉你“谁说我是机器呢?我是人类。”
3
打工人没惹…
在 OpenAI 宣布开发出GPT-4后,不少人在网络上感慨,“在这场AI风暴中,人类何以生存?”尤其是打工人貌似已经可以感受到GPT-4对他们发出了“饭碗警告”。
甚至连马斯克在推特上也表达了他担忧人工智能对就业市场产生的潜在影响:“我们人类还能做什么?我们最好继续使用 Neuralink!(马斯克旗下脑机接口公司)!”当然,这也不排除他是在为旗下产品做宣传~
GPT-4除了精通语言,还能解决数学、编程、视觉、医学、法律、心理等领域的任务,并在所有这些任务上惊人地接近人类水平,也就是说它完全可以取代部分工作岗位。
打工人无奈落泪
一个最突出的例子,GPT-4满分通过了LeetCode上的亚马逊公司模拟面试,超越所有参与测试的人类,也就是说它可以被聘用为正式软件工程师。
同时,GPT-4 参加了多种基准考试测试,包括美国律师资格考试、法学院入学考试、“美国高考”SAT数学部分和证据性阅读与写作部分的考试。在所有测试中,它的得分高于 88%的应试者。且它在律师考试中的得分甚至能进入所有测试者的前 10%!
且GPT-4在生物奥林匹克竞赛和GRE写作中也都能接近满分。
另外,最近新研发出的Reflexion方法又进一步强化了它的人工智能能力—— 其赋予了GPT-4反思的能力。
在一个用GPT-4测试代码的实验中,团队测试结果表示用了Reflexion后GPT-4的编程能力直接提升了21%。网友锐评:用这种方法写代码的时薪甚至要比普通开发人员便宜。
而在此之前,其实大语言模型经常会出现代码错误或回答错误的情况。ChatGPT的态度往往表现的像是一个恋爱中的男生,不管我对还是错先道歉,然后emmm继续胡乱回答。
然而现在,有了Reflexion新方法的加成,GPT-4不仅会反思自己哪里错了,还会给出改进策略。是的,就像人类一样。
说到底,人工智能的发展的确会导致一些岗位消失,但是一个新技术从诞生到能够真正颠覆人类生活,还要克服众多现实关卡。
对此,你怎么看呢?也欢迎大家在评论区写下自己的想法交流!
元素
魔方
融合科技元素
玩转科技魔方
关注“元素魔方”小程序
专注【材料测试+模拟计算+封面绘图】
承接专利代理、第一性原理、
分子动力学、量子化学计算等服务!
编辑 | 王玥
监制 | 元素魔方