ChatGPT-所见、所闻、所感

作者:刘聪NLP(NLP算法工程师)

文章经过作者同意转载

作为一个NLP工程师,自22年11月30号起,我的心态的从焦虑到平静再到焦虑,每天的感觉就像做过山车一样,跌宕起伏,只因它-ChatGPT。

今天决定好好聊一聊,所见、所闻、所感。

心态为何如此波动?

第一次焦虑,在ChatGPT刚刚出来的一个月内,我跟几个同事对其进行深入探讨后,陷入了深思--“下一步我们要做什么?”。当NLP模式发生改变的时候,我们要拿什么去做回应,是不是即将被淘汰,如何抓住这一次变革所带来的机遇,焦虑和兴奋伴随着每一个日夜。于是开始了理论的学习,去了解LaMda[1]、Sparrow[2]和InstructGPT[3]

疯狂的人总会慢慢恢复理智,于是进入了平静期。过多测试之后,越发现,生成模型在事实性上依然存在很大的问题,特别是在一本正经的胡说八道时,越发觉得可怕。细思极恐,如果使用者真的不了解,真的照做了怎么办?

并且,工作在小厂的我,无卡无人无数据,根本没有资格去碰T5及之后的模型,那么我们该如何去做这样的工作。当知道一件事情是我/我们不可为的时候,会快速地选择躺平。虽然每天都会对其关注,时而对其调侃测试,但只有一种想法,与我何干。

再一次焦虑,来自于全民的追捧。当身边所有人,无论是AI从业者,还是AI非从业者,都在谈论ChatGPT时;当朋友圈10条有8条都是ChatGPT时;当知乎每日几条ChatGPT热搜时;当客户问我们,公司什么时候会有ChatGPT时;当老板拉着一起讨论及强调ChatGPT重要性时;当劝说所有人停下来看看,却无人理时;当不管谁都敢说自己即将拥有ChatGPT时,我焦虑了,太焦虑了。

个人感觉,这种焦虑至少要持续到3月份吧,需要看看以百度为首的几大厂到底可以做到什么程度。但在这期间,并不影响我们的思考,我们要努力去拥抱它。

特别喜欢一句话:“压力不会消失,只会转移”

ChatGPT为何能引起轰动?

相较于之前OpenAI宣传的大模型GPT3,所有人只需注册账号,即可有免费体验,轻松得进入到了大众的视野。如果说22年12月份是AI从业者的狂欢,那么23年就是非从业的狂飙

ChatGPT对于AI外人员来说,是一个太强大的工具了,可以无脑获取想获取的内容,无论对错,炫酷即可;极具冲击力的交互体验,让其对AI又重拾了希望,畅想着Moss的到来。

ChatGPT对于AI从业者来说,是一个思路的扩充,大模型不只是刷榜的玩具,而是可以在战场上激情挥霍的加特林;在它的加持下,所有人都认识到高质量数据的重要性,更加坚信“有多少人工,就会有多少智能”。并且从大模型的响应速度上,就足以让我们汗颜,不知后面又多少服务器在支撑,在工程上做了多少的优化。

很多人也从中看到了商机,有人靠卖号、卖服务,有人靠内容创作用到知乎、贴吧、小红书等赚取个人流量,甚至美国大学生用其写作业等等,当然也有一些人被骗。这里难免会存在很多大手在操控,像@平凡(知乎)大佬 所说:“对于这种风口类型的东西,别被骗钱,收智商税就算是挣钱了。”

我觉得ChatGPT的爆火&成功是OpenAI坚持的结果。2018年OpenAI提出GPT模型,在风头不如BERT的情况下,再次提出GPT2模型;随着Google提出T5模型之后,再次提出GPT3模型,依然是自回归语言模型,并将“参数至上和数据至上”的思想发挥到了极致。非常赞同@张俊林(知乎)大佬所说:“国内LLM在做这方面技术选型的时候,貌似很多都走了Bert双向语言模型或T5混合语言模型的技术路线,很可能方向走偏了。”[4] 而ChatGPT的爆火,还是因为经历了很多人的检验,在高质量人工校验数据下,使得模型生成的友好性、安全性更加完善,对测试结果的惊艳远远大于犯错。

特别喜欢@Naiyan Wang(知乎)在群里说的一句;“信仰是需要对问题的深刻认知才会产生的,不是无脑allin;也是多次小规模的验证才慢慢建立起来的,而不是一蹴而就。”

ChatGPT如何进行国产化?

ChatGPT的效果,虽然依赖于高质量标注数据、RLHF 技术等,但是也离不开强大的底座GPT3模型(text-davinci-002)。而这强大的底座,就需要庞大的45TB数据及1024张A100算力才能完成训练,甚至需要多轮迭代。很多学者都认为,国内大厂距离OpenAI的LLM技术至少1-2年。

我认为在数据层面,百度、腾讯、字节、知乎是有很强优势的;在算力层面,百度、阿里、腾讯、华为也是有很大优势的。通过OpenAI的提示,各大厂应该也不会再吝啬高质量标注,人海战术在国内还是有一定优势的,毕竟学生可以成为廉价劳动力。

但说句实话,国内也做了很多大模型,我就不一一举例了(都得都懂),感觉都是在刷榜玩,放出来测得,很多都不行,真是一个能打的都没有。

e261ff20183c9c609a738590cc018f25.png

目前,很多大厂都已经放出狠话,都正在进行国产化ChatGPT的研发与测试。百度三月份完成内测,阿里已经在进行内测了,360、字节、快手、京东等都再进行,只希望到时候不被打脸。但目前从股票上来看,是“秦始皇摸电线,赢麻了”

如果真的在广泛测试中,得到了大众的认可,我收回“一个能打的都没有”这句话,可别到时候变成一个产品发布会,一堆PR文,然后就没有然后了,根本就测不到看不到摸不着。

如果真的有一家成功,论证该事情的可行性,那么国内大厂应该都能做出来,只是时间长短的问题,是3个月还是6个月还是一年了。对于我们这种小厂来说,要不然调用大厂API受人限制;要不然建立企业联合会,集几家之力训练ChatGPT,几家共用;要不然直接原地解散。

如果真的没有一家做成,感觉需要各大厂联合发力了。其实,我对国内能做出来的东西的预期,只是ChatGPT的60%,差不多就算成功了,也不知道为啥这么想。

ChatGPT在应用上的问题

个人做了这么久的问答和生成任务,答案的真实及可控性依然困扰着我,虽然ChatGPT的大部分的回复使我感到惊艳,但作为一个NLP算法工程师,不能抱着娱乐至上的想法去看待这个问题。

在很多真实问答场景中,人们是不能接受犯错的,例如:“双十一优惠政策”,假设生成回复是“满300减300”,商家岂不是亏死;“鸡蛋一般煮多久”,假设生成回复是“5min”,恭喜你吃了个生蛋;假如生成回复中包含了政治内容、事实性错误、偏见问题,该如何解决,这些都是生成模型无法避开的话题。就Google新品Bard来说,仅因发布会回复答案的一个事实性错误,股价直接暴跌6%。而微软在新Bing的发布会上的例子也只是旅游类开放性问答。

而在ToB的企业场景上,往往是不允许出现事实性错误的,ChatGPT真的可以用在ToB场景吗?针对于无法连接外网的企业来说,如何使用API进行访问?真的有很多企业可以购买设备进行本地部署吗?仅在购买API的情况下,如何将通用接口进行领域数据优化?还是可以不优化,通用即最优?如何保证企业内部数据的保密性,Prompt泄露信息怎么办?那么,置信内容与生成融合、领域Prompt规范化、设备部署会成为我们重点攻克的课题

对于ToC来说,娱乐至上,一定会有一些不轨之徒,将其用在刀刃上。那么内容检测将来一定会是一个重点,当ChatGPT生成内容泛滥时,我们如何进行检测,判断哪些是真实人写的,哪些是机器生成的。虽然目前已经存在一些内容检测工具,例如:openai自身提供的检测器(虽然仅有26%)[5], @蝈蝈 (知乎)大佬的“中英双语ChatGPT检测器”[6];但只能说,在检测的路上依然是任重而道远。

我们会被ChatGPT所取代吗?

我觉得最多是工种的改变,以前驾马车的,现在开滴滴了。

可能对于很多NLP工程师来说,以前被称为炼丹师的我们,即将成为小药童。无需调整配方,只需拿拿原材料,在炉外扇扇扇子就好了。很悲观的说法,从前需要魔改网络,2018年只需对Bert进行finetune,2023年只需要In-Context Learning了吧,只能拿着别人大模型的API找找prompt了。

但,毕竟不是所有企业,会支持外网、购买设备等。既然Bert横行的时代,都还存在TextCNN。为什么ChatGPT大模型的时代,容不下我们呢?

参考资料

[1]

LaMDa: https://arxiv.org/abs/2201.08239

[2]

Sparrow: https://arxiv.org/abs/2209.14375

[3]

InstructGPT: https://arxiv.org/abs/2203.02155

[4]

通向AGI之路:大型语言模型(LLM)技术精要: https://zhuanlan.zhihu.com/p/597586623

[5]

AI text classifier: https://platform.openai.com/ai-text-classifier

[6]

中英双语ChatGPT检测器: https://zhuanlan.zhihu.com/p/598395917

END

df9f0f758035282bc79d77b9e476b849.png

分享

收藏

点赞

在看

911297051003d9346a51af6888c10c07.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/49082.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

巴黎时装周儿童单元上海站圆满举行,徐圣恩受邀参加

10月2日,作为国内最具知名度和专业性的儿童时装周,巴黎时装周儿童单元上海站隆重举行。巴黎时装周儿童单元由巴黎高定协会举办,为孩子提供一个展示梦想的舞台,自公开以来就受到社会的广泛关注与支持。著名艺人徐圣恩受邀出席本站活…

2021秋冬上海时装周开启,聚焦8大国内外品牌

2021年4月7日,上海时装周SIFS AW2021于上海静安嘉里中心正式开启,平台汇集国内外高端礼服品牌,聚焦时尚,华丽盛放。 本季上海时装周SIFS,聚焦8大国内外品牌。意大利品牌NICOLE作为全球婚纱标杆,首度来到中国…

iNFTnews丨众多时尚品牌参加元宇宙时装周,抢先把握数字时尚的未来

元宇宙作为一个全新的概念,却已在许多行业有着或轻或重的影响,其对万亿美元零售业的影响最近在元宇宙时装周 (MVFW) 上得以显现。这种完全虚拟的体验于 2022 年 3 月 24 日至 27 日在以太坊区块链上的去中心化虚拟社交平台 Decentraland 举行。线上活动吸…

一秒钟变身明星:用swapface软件体验星光熠熠的感觉!

你是否曾经想过能够用电脑或手机来实时地将自己的面部与其他人或角色进行交换?你是否曾经想过能够用一款简单易用的软件来制作出有趣或惊艳的面部交换直播、视频或图片?如果你的答案是肯定的,那么你一定要试试swapface软件,这是一…

COSELF 次元秀场伦敦时装周预告 #虚拟时尚

在虚拟世界里的未来服装,能自由变化自己的样貌和服饰。或许未来会作为人类皮肤的第二表征,极大解放人们的精神自由。 COSELF 次元秀场 「预告」 数字高定系列 时间:本月 17 - 21 日 地点:当季伦敦时装周 「COSELF 次元秀场-数字高…

小米二代真的性价碉堡了?对不起,雷军在搞期货交易

小米2代1999的价格真的碉堡了么?事实真的是如此吗?小米2手机为什么看起来性价比那么高?答案是,那是期货价格!事实上,到了十月中旬你也不一定能够买到,可以想象首次发售一定是限定很少的数量&…

XuperSocial首个明星DApp上线,探索区块链分布式通信基础设施

12月7日,星际口袋上线星际社区,为广大藏友提供稳定、可信的交流场所。 星际社区基于百度超级链团队重磅发布的去平台化社交解决方案XuperSocial搭建,XuperSocial是架设在百度超级链开放网络(XuperOS)上的DApp&#xff…

初识以太坊 ——钱包、测试网络和简单交易

以太币单位 • 以太坊的货币单位称为以太,也称为ETH或符号Ξ • ether被细分为更小的单位,直到可能的最小单位,称为wei;1 ether 10^18wei • 以太的值总是在以太坊内部表示为以wei表示的无符号整数值。 • 以太的各种单位都有一个…

Steam注册遇到CAPTCHA问题,一直注册不了,一个简单的注册办法

这个问题一直解决不了 后来我就用了V.P.eN翻墙在Google Chrome上粘贴进入网址再注册就巨快 我自己用的一个很简洁,好用免费的VPeN叫白鲸 V.P.eN下载网址:https://www.bjch110.com/?mid1003 下载安装都很简单 然后白鲸显示连接上后,就打开Goo…

Android Studio实现智能聊天机器人

项目目录 一、需求分析1、业务需求分析2、模型需求分析3、界面需求分析 二、开发环境三、聊天功能业务实现1、✨申请机器人身份标识2、搭建聊天界面布局3、搭建聊天条目布局4、封装聊天信息实体类5、编写聊天列表适配器6、实现智能机器人通信 四、项目效果五、项目总结六、源码…

Android智能聊天机器人

苹果有Siri,百度有小度,小米有小爱,而且后来竟然又出了个小兵,总之类似的智能聊天机器人是越来越多了。面对这样智能的机器人,我们似乎只能是体验者。想想底层的算法就让人头疼,它到底是怎么识别出一句话的意思的&…

德国IT行业薪酬水平大揭秘--2020

点击 欧盟IT那些事 关注我们 公告:因企鹅审核规定,本公众号从《德国IT那些事》更名为《欧盟IT那些事》。 所有脱离工龄、级别、职位、经验、城市以及裙带关系来谈论工资,都是耍流氓! 一般来说IT行业公司,资历是按等级划…

德国IT行业薪酬水平大揭秘--2023

点击 欧盟IT那些事 关注我们 公告:因企鹅审核规定,本公众号从《德国IT那些事》更名为《欧盟IT那些事》。 所有脱离工龄、级别、职位、经验、城市以及裙带关系来谈论工资,都是耍流氓!2022-23年,SAP行业薪酬异军突起&…

当事务Transactional遇见异步线程出现的坑

问题 开发小伙伴遇到线上环境消息推送不成功,排查日志发现推送是id为null 代码示例 Transactional(rollbackFor Exception.class) public void register(UserDTO dto) {User user BeanCopyUtils.copyBean(dto, User.class);insert(user);//注册成功消息推送exe…

511遇见电脑PC任意多开绿色软件

电脑端的微信只能单开,为了工作方便需要,我们有时候需要开启多个微信账号,511遇见制作一个微信多开端。 微信vx多开器特点 1.支持自动获取电脑上的微信安装路径 2.支持手动获取微信安装路径 3.支持所有版本的微信多开 4.支持自定义任意多开数…

当互联网码农遇见国企老同学

本文转载自程序员技术 码农张小北和国企职员王志强, 是同一所大学、同一个专业、同一间宿舍, 睡上下铺的兄弟。 毕业那年, 性格沉闷的张小北去了互联网公司, 善于处事的王志强选择了一家国企。 两个不同的选择, 在…

抖音直播带货数据统计,直播带货要复盘哪些数据指标

抖音直播电商数据分析需要围绕“带货”这个核心目标展开,这其中就涉及到“人、货、场”这三个概念,也就是抖音直播的流量、商品和直播间。 这三个概念组合起来,就是抖音直播电商需要关注的核心问题,也是我们数据分析的重点: 1. 不同商品适合在什么类型的直播间推广? 商品在…

带货直播系统,实现直播重要的一步——推流

什么是rtmp? RTMP是Real Time Messaging Protocol(实时消息传输协议)的首字母缩写。该协议基于TCP,是一个协议族,包括RTMP基本协议及RTMPT/RTMPS/RTMPE等多种变种。RTMP是一种设计用来进行实时数据通信的网络协议&…

虚拟主播也带货?直播电商的变与不变

5月6日晚,海外虚拟主播vox在B站开启了中国直播首秀。从最终数据来看,直播1.7小时,营收111万人民币,当晚还登上平台热门首位,这样的直播吸金能力,让不少明星都望尘莫及。 更值得关注的是,直播间…

直播带货行业如何入局?先了解一下直播商城源码吧

直播行业的爆火已经持续了多个年头,直到今天,在人们的生活中依然有着举足轻重的地位,它通过多元化的方案为许多行业带来了新的思路,特别是与传统商业所结合的“直播电商”、“直播商城”的卖货新形式,让多方因此而受益…