一览科技CTO陈锡言:大模型阴影下的技术创业机会——链接大模型与用户|量子位·视点分享回顾...

视点 发自 凹非寺
量子位 | 公众号 QbitAI

过去三个月,AIGC和其背后的大模型浪潮席卷中文互联网,所有人都能享受到人工智能技术升级带来的便利。

在公司层面,拥有大模型技术和资源的头部企业获得了最多的关注,而大模型应用层的创业公司虽活跃,但存在感却并不高。

甚至随着ChatGPT相关功能插件的释放,没有直接参与大模型竞争的应用层企业都有可能被类似于OpenAI的企业的一个插件所“覆灭”。

毫无疑问,通用人工智能的发展还会持续影响应用层企业的生存空间。

那么,作为应用层的创业公司将如何在这种压力下,寻找到属于自己的创新空间、打造独特的业务模式呢?他们的创业价值又将如何得到社会和市场的认可?

围绕应用层创业公司如何通过链接大模型与客户发挥价值,一览科技联合创始人兼CTO陈锡言在「量子位·视点」直播中分享了他的从业经验和观点。

611d175f8de4bc1bee32fe442d2bc3fc.png

以下根据分享内容进行整理:

大模型的出现拉齐了很多公司的AI水平,革了很多AI服务商的命,同时它又以极快的速度普及,可以称为史上增长最快的月活破亿的应用,颠覆了很多技术、业务和服务。

ChatGPT开始免费之后,基于OpenAI生态的一些创业公司其实都是一脸懵。虽然OpenAI的CEO表示说“不会和客户产生竞争”, Jesper CEO也说“更多大模型的出现,让公司已经摆脱了对OpenAI的单一依赖。”但这些解释的逻辑其实很无力。

ChatGPT的出众之处,在于除了大模型本身以外,还有自然语言的交互模式,这是自命令行、图像化UI之后的最先进人机交互模式。GPT4提供了通用人工智能的可能性,对话的人机交互形式配上AGI之后似乎变得无所不能。文心一言、通义千问等国产大模型也都是如此。

这半年来,团队经常会讨论到一个问题,大家都用大模型了,我们的价值究竟是什么?

大模型阴影下,创业公司有什么机会?

在文心一言发布会上,李彦宏曾提出了一个四层模型:芯片、框架、模型、应用。但是他只说了这四层模型,但是没有说这四层模型的关系究竟是金字塔形的,还是倒金字塔形、橄榄形、菱形或别的结构。

09ebbc3e28a75383d8688fd012db727e.png

芯片,肯定是卡脖子的核心竞争力。框架,是大公司的游戏。模型的话,现在看起来10亿起步,而百度还说文心同时做了10个行业大模型。

应用层,现在看起来ChatGPT、文心一言以及其他大模型的这种交互类应用都是ToC的,而且免费。大家都说要做AI大基座,要形成自己的应用生态。

如果AI大基座在模型关系里是底层(在地上),那么它对于应用层的创业者来说是一个平台。但如果AI大基座是顶部(在天上),留给应用层创业者的就会是阴影。

目前看起来,现在做大模型的AI大基座们都表现出了一个“我全要”的状态:说是大基座,实际上包含了全部的四层模型。

小孩子才做选择,做大模型花了那么多钱,当然是全都要。

3d80b63649430a7e6f1d7f68f5ca9ca0.png

阴影1:通用人工智能让很多SaaS一夜之间失去壁垒

通用人工智能好像什么都可以做,让很多SaaS软件很懵,多年的积累在大模型面前可能变得一文不值。所有软件公司都面临一种情况:被迫拥抱AI。

当“所有应用都值得用AI重做一遍”被提出来之后,大模型先把自己母公司各系产品都加上Copilot,比如浏览器、搜索引擎、即时通讯、办公软件等等。这真的让人很怀疑,我们还做其他软件的价值究竟是什么。

阴影2:不仅取缔机器和软件,还会更快取缔人类的工作

我认为能够被简单且精准描述input、process和output的工作更容易被取缔。

例如把图像中所有蓝色改成红色、仅仅做排版的文字编辑、按标准文档回复的客服服务,甚至说当制作一杯咖啡,加多少豆、怎么研磨、加多少水多少奶都非常标准的情况下,口感与手工咖啡的可能差别并不大。

阴影3:风头全是大模型公司的,没钱根本上不了船

现在几乎所有的风头热度都在制作大模型的这些公司,包括创业明星系的、BAT系的、名校系的。有一件事情可以肯定,创业公司根本就参与不了大模型的开发工作。

A100虽然不好买,但其实购买方法也很多,京东上就有——只不过上次查的时候是10万元一张,今天已经变成了119,999元。买不买得到并不是问题,买不买得起才是问题

即使创业公司有5,000万,买完500张后连网线都买不起,电费也只能用花呗。所以创业公司入局大模型如果没有10个亿,根本上不了牌桌。

382b5b09839dade5d562fb38340876b0.png

AIGC并没有创造新的需求。我要一幅AIGC的画,可能等于我要一幅更便宜的画,这是供需市场决定的。AIGC只是一个工具,而需求侧永远想要更便宜的产品。

AIGC重复了很多业务流程以及供求关系,几乎所有的企业其实都希望AIGC来提升生产力,但实际上其实困难重重。

AIGC对生产力提升中的真正困难

4bcab01796bb2db3a82dcd0e7600582c.png

一、工作流程固化很难改变。

AIGC工具强调个体,个体是打工人,打工人卖的是时间,凑够时间可能就拿到工资了。而AI工具作为新事物,还有很多的不确定性,很难说服打工人为了一个不确定的工具去增加学习成本。

二、商务比系统更重要得多。

很多ToB业务一旦成熟之后,商务关系往往比业务本身更重要。系统被弱化了,甚至有些老板对技术部的要求就是,只要不宕机,做成什么样都不影响公司赚钱。我听到最无力反驳的一句话,客户的工作方式不变,自己公司单独变化有什么用。

三、很多打工人更愿意偷偷的使用。

我们不得不承认,很多场景尤其是创意类工作场景,使用AI并不是一个很体面的事情。如果借助AI制作了东西,或是使用AIGC节省出了更多时间来休息摸鱼,打工人自然不想承认,也永远不能承认。

四、担心信息泄露。

安全的确是一个问题,但更多时候可能是一个借口,没有前面三点重要。

AIGC工具现在更多的是个体的赋能,而不是对企业的赋能。希望大家记住这句话,这是我们创业的一个机会。

什么样的岗位不容易被AI取缔?

b9dec4994032a7b195626526ee7f634c.png

一、要求结果稳定精准

GPT4到底会不会解数学题是一个很有争议的问题。

比如:一个计算机只能执行「+1」和「X2」两个运算,如果输入「1」,问最少几个步骤可以得到63。GPT4肯定是倒推法,方法是正确的,但每次都会算错,比较好笑的是它知道算错了,还能拼命扯回来。比如在某一步骤中「X2」,然后得到70,突然发现超了,这时他告诉你最后再减7,也能得到63。

我不觉得稳定和精准是一个大模型应该有的必要属性,我也不相信语言模型能解决数学问题。这是我的一个比较偏执的世界观,有可能是错的。

二、强IP属性业务

大家有没有注意到,书法作为我们国家很重要的一种艺术形式,到现在为止却没有一个书法的AI模型出现。这可能是价值问题导致的,书法AI模型它可能就没有价值。

比如说这个字是启功写的,这字是苏轼写的,如果第三种字是AIGC写的,很有可能会被扔掉。因为书法很强调个人风格、审美和个人IP。

三、对安全要求很高

想象一个职业,AI理发师。

理发师这样的职业是需要极其信任和安全的,如果一个黑化的理发师拿着刀在我面前,我可以说大哥别伤害我,打感情牌可能还有一线生机。但如果对面是一个机器人,它仅仅是一个杀戮机器,我毫无办法。

另外理发师这个行业也具有强IP属性,任何一个理发师在社区都是强IP。

四、数据集缺少或者不容易被标注

大模型本身的泛化能力仍然受限于数据集。如果说某个行业会被取缔的话,那最简单的一个判定标准就是该行业能否组织足够多、足够好的标注数据;如果数据质量非常多非常好,大概率机器会代替人完成。

但如果是那种不容易被标注的,比如说一个艺术作品,它不仅包含了创作者的情绪和感情,还包含了观看者当下的情绪,大概率不会被替代。就像我们常说的“1000个人心中有1000个哈姆雷特”,这个复杂度很难得到有效标注,标注的意义也不大。

五、需要动手实验的

有一个很经典的问题:如果ChatGPT早发明500年,人类还会不会知道地球是圆的?

我认为在科学面前,AIGC和圣经是一样的,不是因为他们权威,而是因为在科学面前,他们都需要被摒弃。

AI虽然可以处理和模拟一些既定的任务,但它们缺乏人类的直觉、情感以及对抽象概念的理解,这是无法模拟的。

大模型背景下的技术创业机会

fc2fba7166d53b6ba3c9c8e0d2c4b719.png

一、懂业务懂技术:链接大模型与用户

我们有个客户是影视行业的上市公司,老板最开始要求全公司都要用AI,100多号人响应号召使用一堆五花八门的工具,后来缩减到只剩ChatGPT和Midjourney,到最后就什么都不用了。直到后来找到我们来提供企业级的AI工具,和现有的工作流做无缝打通。

所以其实企业永远需要信息系统,如果又懂业务又懂技术的话,做大模型和企业之间的链接者是一个不错的选择。

二、有钱有能力:加入大模型创业

这里面还是有很多值得做的事情,比如多模态、潜信息、脑机交互等等,但需要有钱有能力。

三、有趣的灵魂:利用AI制作有趣的内容

AIGC对于内容创作者,其实是一个特别好的时代。以前很庞大的创作组织,现在可能只需要几个人。

另外,ChatGPT一本正经的胡说八道,或是天马行空的奇思妙想,这种能力特别适合做内容创作。

四、直男程序员:微调/定制模型

有一种纯技术方向:为企业提供微调大模型,或者提供行业定制模型。

当我第一次看到 MaaS,也就是Model as a Service的时候,我是绝望的,要被大公司逼近绝路的感觉。但是最近我又看到一个词Fine Tuning as a Service,我觉得特别有趣,一看就是程序员想到的。这个词让我感受到了程序员乐观、积极向上的情绪。

AIGC大背景下有哪些岗位会炙手可热?

其实淘金热中最赚钱的是卖牛仔裤的。在整个AIGC大背景下,除了刚才那些直接创业的机会,我认为还会有一些炙手可热的工作岗位或是可以形成服务的。

e6bb1dfa35d18fb1e9adc61f90ac154f.png

一、AI对齐工程师

随着AI工具的不断发展, AI如何与人类的价值观保持一致,以及AI系统如何保证自己的可解释性等等将会成为重点。AI对齐工程师,是要保证AI系统在任何时候都能和人类的价值观保持一致,保证人类的利益,以及保证人类对AI的控制权,甚至必要的时候拔网线、断电等等。

二、模型训练工程师

刚才说到每个企业都值得拥有自己的模型,那么在大模型基础上,通过微调或者蒸馏等方式,得到一个企业专有的模型,也是一个很重要的事情。

三、数据治理工程师

虽然企业都值得拥有属于自己的模型,但是模型依赖数据。

数据治理指的是在一个组织内部对数据质量、数据整合、数据隐私、业务流程等做合理的管理体,保证数据的准确性、一致性以及可用性。首先要数据可用,才有机会训练模型。

大多数企业的数据化程度是不足的。其实越是在线化业务的公司,或者做数据服务的公司,数据化程度越偏低,很多互联网企业的数据化程度甚至远不如一些工厂。

四、数据标注师

高质量的标注数据会成为AI系统的核心竞争力。前几天我看新闻,北京还提出了一个概念,要做统一的数据标注服务,大家也都看到了数据标注是一个非常重要的业务。

babyAGI和autoGPT有哪些启示?

2290640cc8db60c1b6926890481dcf0c.png

前段时间babyAGI和autoGPT比较火,火得快,凉的也快,但是留下了几个词很有价值,比如「思维链」和「任务队列」,有的地方解释成「工作流」。

左图是babyAGI第二版的工作流程图,核心就是把第一个问题形成一个问题列表,然后放到队列里面,对每一个问题做相应地执行,然后通过ChatGPT解读相应的答案,再对答案生成若干个问题,类似于金字塔的结构,通过逻辑树的方式逐渐地去找解决方案的本质。

右图指的是autoGPT第一版里面最重要的几步,也是把一个问题拆解成多步,然后列出相应的计划,但是它比 babyAGI多了一步,就是检查这个东西对不对的概念,然后批评、反省。这个步骤对一个智能型的AI系统而言,是非常重要的。

从这两个开源项目里面,我们能学到很多做大模型还没有触及到的,或是比较有特色的AI系统的地方。我的想法是对它们做改进之后,使用专家系统来设置自己的业务工作流,提前录入到系统里面。

做应用层 AI产品的底气和优势

一览科技凭什么在应用层做AI视频工具,或者说在应用层AI这个产品上,我们具有什么样的优势?

a03aa85e22a44592c58de028e401035f.png

第一个优势,数据积累。一览已经做了很多年的商用视频,服务了数千家企业用户,全球范围签约了数十万的视频创作者,积累了很多的商业视频数据,这些数据是独有的,且在创作以及视频交易的过程中,还会不断产生新的数据,具有成长性。

第二个优势,场景明确。我们一直垂直于视频的创作。

第三个优势,业务相对成熟,成立五年,我们已经积累了海量创作者和内容消费者。

第四个优势,创作的安全性。通用人工智能AGI有很多的风险及不确定性,但在内容创作上的包容度以及AI对齐和内容安全措施已经相对完善,涉政、涉恐、涉黄、涉暴的预警措施相对完善。

我们选择了一个适合自己的垂直的领域,并且在这个领域上具有一定的优势,这是一览AI视频工具在应用层的特色。

说了这么多,实际介绍下一览AIGC工作流中「AI编剧」这个产品。

我们提前把工作流注入到AI系统里,然后由AI一步步执行。在我看来,“Step by Step”这个过程并不应该由通用人工智能来执行,应该由人类专家来输入。

fe17f5d47bc0ba62ac7f0a04a58090b7.png

第一步,通过一句话生成若干个创意。生成创意的过程,等于头脑风暴,这特别适合AIGC。我们可以输入几个关键词,比如宫廷、狗血、爱情、伦理、逆袭、反转,它就能够瞬间输出很多个创意。

第二步,在工作流程之中开始角色设计。角色设计需要哪些东西,比如人物的性格特征,行为习惯,体貌特征,对话风格,包括性别、年龄等。

c415fd6fcb8d9f4bfcb8f11a76764d6b.png

现在有了角色和创意,把这些内容输入给AI来生成剧情,剧情里面一定要有冲突和反转,这也是我们要提前录入进去的设置,然后就可以快速生成若干个剧情,同时批量生成几百字甚至几千字的脚本。我们可以选择1个最有挑战的剧情,接下来根据剧情,我们还可以生成一系列概念图。

另外,大家也知道Token的限制,其实对于剧情,我们也可以把一个剧情分解成若干个段落,每个段落再进行扩展,这也是一个能让剧本逐渐丰满的过程。

b5eeb62ab393ea787d1cf1c1cd9c49f7.png

一览「AI编剧」工作流的四个核心:上下文存储、海量的创意,视觉化创作、评估反馈。

评估反馈,大家可以理解为剧本评分,相当于autoGPT里面的批评环节。这个过程中,我们可以产生更多的信息、更多的数据。

c49167be3d8a74587fe0a50a50863db6.png

经过剧本评估之后,这些情节段落进行不停的调整和优化,然后进入下一步,再次生成视觉化的创作,不断打磨作品质量。

AIGC 加速了平庸时代的到来

AIGC可以提高所有生产工作或者创作的平均水平,但是它只能让未来比过去更好。但如果以前都变得一样好时,原来的更好就变成了现在的平庸。当AI工具全面普及,平庸的创作会无比廉价,人类的未来属于真正的工匠。

毋庸置疑,AI工具普及和 AIGC内容爆炸都是历史浪潮的一部分,不可倒退,无法避免。从媒体到时尚到建筑,再到其他一切,都会充满了不可避免的、普遍的平庸。但乐观的人总能找到自己的方式翻出不一样的浪花。最后用马斯克最近发的一个推特献给大家。

坚守自己的工匠精神,哪怕是不得不孤身前行。
Stay on the right path,even if you have to walk alone.

关于「量子位·视点」

量子位发起的CEO/CTO系列分享活动,不定期邀请前沿科技领域创业公司CEO/CTO,分享企业最新战略、最新技术、最新产品,与广大从业者、爱好者探讨前沿技术理论与产业实践。欢迎大家多多关注 ~

e319a6d6cee3ba4eafcbc94c529e2df7.png

需要观看直播回放的小伙伴,请戳“阅读原文”吧~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/69400.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linus Torvalds 亲自上手,改善用户模式栈扩展代码

【编者按】Linux 的创始人 Linus Torvalds 最近亲自改进了用户模式栈扩展代码,解决了一个与虚拟内存地址布局相关的问题。 原文链接:https://www.phoronix.com/news/Linux-65-User-Mode-Stack-Expand 未经允许,禁止转载! 作者 | M…

从零实现教你AI机器人

文章首发于博客 OpenAI 接口实践 OpenAI的接口文档十分详细,包括对话补全,文本补全,代码补全等等信息,也包含了最佳生产实践,最佳安全实践等篇章,通读之后十分受用,推荐大家前往阅读。本文就是在…

2021创新科技项目申报书找谁写,项目申报申请书怎么写

企业在申请创新科技项目的时候,时需要提交相关的项目申报书的,而对于很多企业来说,他们感到头疼的是2021创新科技项目申报书找谁写、怎么写。在这里,就为大家分享关于项目申报书的具体撰写技巧,一起来看看吧。 关于202…

科研项目补贴申报书范例,申请研发补助找谁写

我们在申请科研项目补贴的时候,需要提交相关的项目申报书,而对于很多朋友来说,其最为难的事情可能就在于项目申报书上。这里,为了方便大家解决这一问题,特别为大家分享关于科研项目补贴申报书范例,一起来看…

第二批!四川省科技计划项目任务书和纸质申报书相关流程要求材料

关于第二批批签订、报送2022年四川省科技计划项目任务书和纸质申报书流程时间和申请事项整理如下,小编已经为你们整理了相关的信息,符合条件想申报或者对此有疑问的欢迎致电小编。 一、四川省科技计划项目任务书和纸质申报书填报审核流程 (一…

基于Java科研项目申报管理系统

目前高校的科研项目管理的管理大多还采用Excel软件,word等办公软件进行大量的数据汇总及处理,但由于其操作性和实用性不强,严重制约了高校科研管理工作的规范化和质量化发展,而且也严重影响高校领导及时利用科研信息进行决策的水平…

《计算机工程与应用》11月最新投稿经验分享

我的文章最早四月份投的是《中国图象图形学报》,历经三个月终审被拒,紧接着就投了《计算机工程与应用》,然而很快就被拒稿了,说实话有些打击人。因为秋招找工作的原因,这篇论文就被搁置了,十月份开始大修论…

期刊论文添加基金项目、作者简介

一、点击工具栏中【视图】,选择【草稿】 二、鼠标光标放到作者后(其实第一页哪里都可以),点击【引用】➡【脚注下方的扩展符号】 三、脚注下方的扩展符号点击后弹出【脚注和尾注】对话框,点击【自定义标记】后面【符号…

【竞赛篇-新苗申报书撰写(四千字总结建议)】浙江省新苗人才计划申报书撰写经验分享及格式要求

本文只介绍新苗申报书撰写,更多关于新苗内容可以看我的 相关专栏 个人曾立项过3项新苗,在此将之前写申报书的经验,结合学院里已经立项的其他若干份材料的优点,对新苗申报书撰写进行总结。主要是给没有思路的提示一下每一块的思路&…

如何下载国家自然科学基金申请书的模板

首先,打开国家自然科学基金的登录界面(账号找单位的科研秘书注册索取): 国家自然科学基金网络信息系统人员登录平台https://isisn.nsfc.gov.cn/pmpweb/login 登录后如下图所示: 除了第一行的个人成果,基本…

让小米成为印度第一的“头号功臣”,9 年后宣布离职!

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 2010 年时,可能谁也不曾想过,彼时在中关村刚刚起步的小米,如今会成为全球知名手机厂商、甚至销量还一度超越苹果跃升全球第二——这一切的背后,离不开许…

火爆的文字游戏你玩了吗?「GitHub 热点速览 v.22.06」

作者:HelloGitHub-小鱼干 不知道你有没有被 Wordle 这款游戏刷屏,在本期热点速览的特推部分选了一个 React 编写的开源版本同你分享,而本次公众号摘要也是一个提示,🤔 只不过这个只能盲猜了。别小瞧 Wordle 这个游戏&a…

登录(实时验证手机格式、验证码)

思路: 动态验证手机号格式:利用计算属性会根据内容的变化而调用的特点,将表单绑定v-model,在计算属性中,利用正则不断检验手机格式,正确返回true验证码:当手机号格式正确时,点击才有效,利用时间制造三元运算符改变验证码的文本内容,且倒计时期间,再次点击无效代码示…

「2021年」国内主流短信验证码平台综合评测

「2021年」国内主流短信验证码平台综合评测 “ 目前市面上主营短信验证码业务的平台有哪几家、手机验证码平台哪个好,它们提供哪些短信验证码服务,短信发送的速度、送达率和稳定性等技术性能如何,短信收费价格多少钱。今天通过评测阿里云、梦…

网页版滑动验证码+短信验证码(史上最全版)

PC版滑动验证的实现 简介 滑动验证是基于人机识别技术开发的智能验证码产品。用户通过简单的右滑交互,无需思考即可通过验证。 资源引入说明 使用PC版滑动验证码,需要引入以下js资源,为保证服务功能最优,官方会定期迭代升级线上…

百度api验证码识别

在爬虫操作中难免会遇到文字验证码识别,处理方法有很多这次要说得是百度api的调用来对文字进行识别。分两步走第一:百度AI开放平台注册并建立自己的项目。第二:写代码。 百度AI平台创建项目 创建自己的账号,登录之后出现页面如下…

2021年11月最新搜狗验证码识别,6位全对正确率高达96%

训练数据准备 标记数据是最花费时间的事情。最开始手工标记验证码1万条,训练后正确率在50%左右。然后写写代码使用这种低正确率的去自动标记。使用搜狗自动验证,来实现自动标记。逐渐积累数据量,后期只需要人工标记错误验证码就行。这样可以大…

ChatGPT风口当下,我把收藏了两年的嵌入式AI资源学习笔记,全分享给大家(附代码/视频/学习规划)...

“ChatGPT可怕的是,它会将世界的命运重新洗牌” 人类已经历3次超级工具的“革命”,每一次都重塑了世界新的格局。 第一个降临的超级工具就是互联网,它用虚拟的聚合,打开了现实的距离,将地球压缩成村落。极大程度的模糊…

MXNet的机器翻译实践《编码器-解码器(seq2seq)和注意力机制》

机器翻译就是将一种语言翻译成另外一种语言,输入和输出的长度都是不定长的,所以这里会主要介绍两种应用,编码器-解码器以及注意力机制。 编码器是用来分析输入序列,解码器用来生成输出序列。其中在训练时,我们会使用一…