只有我一个人对ChatGPT感到蕉绿吗?

卷友们好,我是rumor。

上周四,在国内公众号还没刷屏的时候,我就看到ChatGPT发布的消息了,当时迅速看了下博客内容,心想「就这?」,这不跟DeepMind的Sparrow一样吗?而且设计的还没它好,Sparrow专门设计了一个可控的防攻击机制:

13e48b97b19a88bcc276ccbfbca12c08.jpeg

当时也懒得去注册账号,就快速写了篇技术解读完事了。

没想到周末的时候,这个声势越来越浩大,我赶紧跟风去买了个账号聊了一会,那时我的心情变成了:「卧槽???」,虽然我能挑出一些刺儿,但这也太牛*了。。

接下来的两三天里,我的世界都被ChatGPT打满了,看了一堆大家的截图,又看一了堆大佬的解读,再着急地刷了InstructGPT的论文,然后我开始焦虑了。甚至看到ChatGPT这几个字都有点PTSD。

a9f7c7aef2450fd00deb7bb3a46eacc8.jpeg

可能跟我的性格有关系,我开始陷入了自我否定,觉得自己这几年都在做啥,我什么时候才能搞个ChatGPT出来。虽然我也知道这不是我一个人的事情,也不是一个部门或者一家公司的事情,而是跟整个互联网行业的价值导向相关。

直到昨晚,我才突然想清楚,我焦虑的原因不只是因为「它太好了」,而是「我们可能追不上OpenAI了」

首先,它的效果除了来自大家公认的数据质量高之外,我觉得还有一点,那就是OpenAI真的把对话的闭环run起来了

比如在搜索系统里,用户的大量点击行为可以作为反馈,来不断提升排序模型的效果,而对话系统回答的是文字,自然没法统计点击率,即使加个点赞点踩的功能,也只有很少的人会点,而且对于智能客服、任务型系统来说用户往往是按心情而不是答案对错。这样就导致大部分系统都是靠一些间接指标,或者定期抽取数据去人工评估对话效果,评完后的数据,也不一定会被拿来优化模型,可能直接加词表或者配置标准问就完事了。

OpenAI也没能解决这个用户行为反馈的问题,但他们构造了另一种持续成长的闭环:优化生成模型 -> 采样用户Prompt -> 人工标注答案排序 -> 训练更契合当前用户群体的RM -> 用RM去优化生成模型

那么多公司都发布过对话模型,但大部分都是toy阶段,而OpenAI坚持了下来,并且在一年的时间里,经过数次迭代从InstructGPT[1]进化到了ChatGPT。而且随着用户量(已经百万了)和消息量的上涨,他们会更好地拟合人类的Prompt分布。

这就是令我焦虑甚至有点害怕的地方,还有一个词可以概括这个可能会发生的现象,那就是马太效应

5278796049c2c9c5dc1b178b2a775d1b.jpeg

对于AI来说,算力、模型都不是壁垒,数据是。用ChatGPT的人越多,它的效果就越好,从而吸引更多用户。并且在这个迭代过程中,我们现在说的各种问题都会迎刃而解,无非是哪个版本发布而已。(连我都知道加个搜索引擎API能提升知识问答表现,OpenAI会不知道吗(狗头。

这就是令我真正焦虑的地方。以往的BERT、大模型都没关系,无非是拿开源框架、开源数据、几张卡和人力训几个月而已。但这次OpenAI在数据和用户数量上都形成了很强的壁垒,我仔细看了下InstructGPT的论文,虽然只有十万左右的Prompt,但雇了40人的外包团队,标注文档就写了16页[2],每个任务除了问最终答案外还会问许多其他问题:

15327677b9df471719abd5d88520e479.jpeg

这,还只是他们年初时候的情况

如果真到了商用智能助理/RPA那一步,用户是选择高价但真能提效的产品,还是低价却只有70-80%执行准确率的产品?

以上,就是我最近的一些concern,如有不同意见欢迎留言讨论。大家也别被我带的那么焦虑,我只是yy了最坏的情况,虽然商业世界不乏垄断,但更多行业还是几个巨头或者一堆小厂并存的状态。

OpenAI是一个强大的peer,它一次次地把事情从0做到1,除了算法创新和构造数据的认真外,他们研究团队的视野、决心也都值得我们学习。

参考资料

[1]

Aligning Language Models to Follow Instructions: https://openai.com/blog/instruction-following/

[2]

InstructGPT标注文档: https://docs.google.com/document/u/1/d/1MJCqDNjzD04UbcnVZ-LmeXJ04-TKEICDAepXyMCBUb8/

5b095508092ce99750c80cafe5a29511.jpeg


我是朋克又极客的AI算法小姐姐rumor

北航本硕,NLP算法工程师,谷歌开发者专家

欢迎关注我,带你学习带你肝

一起在人工智能时代旋转跳跃眨巴眼

「至少算法er可能是最后一批失业的?」95d1c9d19551bb037323bd81cf44f8f8.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/7043.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

90%的留学生都在用ChatGPT写毕业论文?

ChatGPT终于火到中文圈了! 在这两个月ChatGPT已经从少数人关注的“新鲜玩意儿”,发展成让欧美大学如临大敌的“论文神器”。这究竟是怎么回事呢? 在教育领域,根据一项针对18岁以上学生的调查显示,89%通过ChatGPT完成作…

chatgpt赋能python:Python卡了怎么办:一位有10年编程经验工程师的实用建议

Python卡了怎么办:一位有10年编程经验工程师的实用建议 Python是一门强大的编程语言,它以其简单易懂、灵活多变和高效的特性,成为了全球各个领域中广泛使用的工具。但是,即使是最出色的编程语言,也难免会遇到卡顿的情…

巧用ChatGPT 解决 Hbase 快照方式读性能优化问题

一、背景 最近公司采用Hbase scan 的方式,经常性会遇到任务跑不出来region 读取超时,由于scan 全量数据,合计行数10个亿,列数接近500。根据建议方案,改为Hbase 快照读方式,避免给region 造成过大压力 二、…

npm安装时卡在sill idealTree buildDeps,npm安装卡在一个地方不动

造成上述问题的原因是因为node的默认安装环境在国外,因此我们只需要修改下镜像的地址即可 1、采用taobao的镜像地址,进入cmd之后输入: npm config get registry 3、此时可以继续输入之前的npm install 命令 npm install 附加知识&#x…

【鸡汤里面的干货】农村娃娃毕业不到四年在深圳核心地段安家置业的背后是什么在支撑?

大家好啊,我就是那个【天涯何处无知己,人穷陌路勿担忧】的架构师李肯! 架构师李肯(全网同名) 在深圳白手起家,毕业不到4年实现一线城市核心地段的安家梦,从0开始谱写励志人生!一个专…

【LLMs系列】90%chatgpt性能的小羊驼Vicuna模型学习与实战

一、前言 UC伯克利学者联手CMU、斯坦福等,再次推出一个全新模型70亿/130亿参数的Vicuna,俗称「小羊驼」(骆马)。小羊驼号称能达到GPT-4的90%性能 github 地址: GitHub - lm-sys/FastChat: An open platform for training, servi…

如何让chatgpt给我们实现一个桌面便签?

我: 用Java开发一款桌面便签软件。功能需求:1、便签可以钉在桌面任意角落;2、便签内容实时保存到本地;3、有新增按钮,点击新增时清除当前面板上的内容,新建一条新的便签内容,并保存到本地&#…

ChatGPT - 小试牛刀 - 试水排序算法

在网上找了几家国内的chagpt镜像,最后还是没忍住上车了,试了一下传说中的写代码能力,果然鸟得很。 不废话直接上图: 上面的测试地址是 唠嗑么ChatGPT国内镜像网站,从站点上也能看到ChatGPT的能力了,什么写…

九龙证券|通信巨头火了!地产板块异动拉升,龙头获主力资金追捧

今天,11个职业取得主力资金净流入。 今天沪深两市主力资金净流出106.7亿元,其中创业板净流出27.79亿元,沪深300成份股净流入18.55亿元。 申万一级职业中,今天有25个职业上涨,房地产职业涨幅居首,达3.69%&a…

火爆全网的chatGPT,究竟是什么东西?

ChatGPT似乎用一夜的时间,让人们记住了无所不能的它!它是谁,凭什么有如此魅力?甚至让拥有ChatGPT概念的股票,接连封板? 下面我们先来对它做个了解。 简单来说,ChatGPT就是由人工智能研究实验室&…

今天我们来浅谈一下ChatGPT到底是什么东西

这是一篇非学术专业性的文章,而我也是为了解chatGPT而学了两三天人工智能,所以哪里写的不好的不对的地方还希望海涵。 图灵测试 1950年,人工智能之父艾伦图灵提出乐“图灵测试”。就是说当你在不面对面的时候跟机器人进行文字聊天的时候&…

chatgpt赋能python:Python怎么考期末:优秀SEO建议

Python怎么考期末:优秀SEO建议 考试是每个学生都要经历的事情,无论是小学生还是大学生。 期末考试让我们感觉像是在面对一堵墙,需要克服无数困难。 如今,我们的目标是给大家提供一些关于如何考Python期末考试的SEO建议。 第一步…

chatgpt赋能python:如何高效地准备期末Python考试,轻松地过关!

如何高效地准备期末Python考试,轻松地过关! 作为一名有10年Python编程经验的工程师,我想与大家分享一下如何高效地准备期末Python考试,轻松地过关。 1. 复习基础语法知识 Python是一门高级语言,其语法特点简洁明了&…

期末复习【嵌入式系统】

期末复习【嵌入式系统】 前言推荐期末复习推荐题型押题复习总述问题与思考:教学内容介绍 问题与思考第1章 嵌入式系统基础问题与思考 1.1 引言1.2 嵌入式系统的概述1.2.1嵌入式系统的定义1.2.2嵌入式系统组成1.2.3嵌入式系统的特点1.2.4嵌入式系统应用 1.3 嵌入式处…

假如ChatGPT变得邪恶

提前预判一切可能性,是为了让它变得更好 人工智能的最高成果是自由和谎言——《机械姬》 *本文仅供大家学习。转载请按照相关规则,注明来源,且附上本文的所有参考文献链接 为什么StackOverflow禁止使用ChatGPT *本文3000字左右 一些思路&…

chatgpt赋能python:不挂科必看!10年Python编程经验工程师教你如何应对Python期末考试

不挂科必看!10年Python编程经验工程师教你如何应对Python期末考试 作为Python工程师,期末考试是每年必须面对的挑战之一,不仅关系到自己的成绩,还可能影响今后的职业发展。如何才能不挂科呢?下面是我从10年的编程经验…

ChatGPT参加国内大学期末考试得到90高分,某国内大模型仅7分

ChatGPT时代已经来了!未来5-10年,AI能够在大多数人类工作岗位上表现得比人类更好。就教育而言,如何应对技术迅猛发展带来的挑战?在AI时代,大学生如何比机器更有竞争力? 文汇报消息,近日&#x…

西安石油大学期末C语言重点题目总结

C语言重点知识点总结 ##例题4-7 (switch和字符的读入) 只需要记住读入的是字符,然后执行对应操作即可 例题4-10 (switch) 做好不同公里数的分段即可 求累加和,连乘 https://blog.csdn.net/weixin_35903223…

chatgpt赋能python:Python期末考试该如何应对?

Python期末考试该如何应对? 随着Python编程语言的日益流行,越来越多的人开始受到其影响并学习这门语言。然而,对于初学者,即使是有经验的工程师,Python期末考试仍然可能成为一道难题。为此,我们提供了以下…

广东外语外贸大学英语文学期末考试复习(解析+细节)2023

前言:本博客旨在以讲解的形式复习这门课程,非常详细,主要是个人复习用,也是给我比较喜欢的课一个好的结尾(虽然我不怎么去上课)。其中有不正确之处欢迎指正!翻译解读来自网易有道,文…