锦秋基金臧天宇:大模型时代,AI创业者如何掘金

“2011年, A16Z 创始合伙人 Marc Andreesse 提出'Software is eating the world',在我们步入 AI新时代的节点,或许我们可以说, AI is eating the world。”

火山引擎和锦秋基金联合主办的「2023 AI逐梦者计划」活动中,锦秋基金执行董事臧天宇表示。

在AI发展的历史长河中,深度学习的出现推动了AI第一波大规模应用,AI四小龙的出现,人脸识别的应用落地,吸引了众多人的目光,但行业巨变并未如期而至,AI技术商业落地的表现不尽如人意,拿着锤子找钉子成为AI创业公司普遍面临的难题,行业开始进入冷静期。

随着ChatGPT为代表的AIGC的流行,大模型逐渐走向成熟,其所表现的推理、理解、创造力已经具备了成为人类助手的潜力,而随着数据的不断积累,其所形成的飞轮效应,将使基座模型走向通用AGI,同时基于大模型的应用将变得越来越智能,未来你的工作日程安排、一日三餐、财务税务申报、小孩教育或许都可以由人工智能帮你自动规划。

不过在锦秋基金看来,技术从来不是只可远观的黑科技和“酷炫”的代名词,只有真实解决行业需求和痛点的先进技术,才能真正为行业和社会创造价值。

实际上,锦秋基金的创始团队早在2019年就开始了在AI领域的系统布局,在长坡厚雪的AI赛道上滚起了雪球。

围绕AI相关垂直行业的应用机会,此前团队曾参与投资了零犀科技,基于AI和BPO的结合,零犀科技帮助企业解决营销获客效率的问题。此后沿着AI+垂直行业的脉络,投资团队在AI+工业、AI+农业、AI+生物制药等领域都做了布局。

通过对不同细分行业的梳理,我们敏锐地发现,在不同的行业环节,存在着人力资源瓶颈,而利用行业过去沉淀的有效数据,AI技术可以大幅提高行业生产效率。

随着对细分行业研究的深入,锦秋基金按图索骥,系统地绘制了AI+不同行业的产业版图,而随着版图的不断完善,我们也从中捕捉到了更多藏在冰山之下的机会。

在人口老龄化的背景下,劳动力短缺将不可避免,我们预测,在AI与自动驾驶、智能机器人相结合的领域,未来将有万亿级的市场成长空间,因此锦秋基金深入工业物流、自动驾驶等场景,投资了许多高成长公司。

当迈入大模型时代,锦秋基金又看好哪些方向呢?臧天宇介绍称,锦秋基金目前主要看好以多模态大模型作为认知和决策引擎,集成一系列外围模型、工具和数据,构建AI原生或AI赋能型应用的投资机会,以及大语言模型和机器人相结合的领域。

AI 1.0时代和AI 2.0时代有哪些不同?哪些因素推动了AI技术地发展?大模型时代将孕育哪些新的机会?适合AI创业者的机会有哪些?在《投资视角看大模型及其应用趋势》的演讲中,锦秋基金执行董事臧天宇分享了他对行业的看法和观点。

以下为演讲内容,有删减:

AI范式迁移:从量变到质变

锦秋基金一直以来关注AI领域相关的应用机会,在过去5、6年时间里,我们观察到一些 AI 核心要素逐渐由量变到质变,主要有三方面因素催生了这波大模型热潮。

首先是应用研究和人才的积累。过去10年AI领域的论文数量稳步增加,与此同时,相关专利数量则是呈指数型增长。学界跟业界更紧密的互动推动学术成果完成了产业化或者工程化的转化,AI研究的专利转化数量在过去五年提升了30倍,在此过程中培养了大量的专业人才,这是非常重要的积累过程。

其次,硬件算力的变化。GPU单卡算力在过去十年里翻了250倍,这带来了训练、推理效率极大的提升和成本的进一步下降。

最后,基于Transformer解码器架构的大型预训练模型,在过去三年时间里,逐渐成为业界共同的探索方向。一方面,整个训练任务能够更好地做并行化;另一方面,基于自监督学习,数据可以被更好地规模化利用,使得硬件提升的潜力能够更多地释放。

以上这些要素的共同作用,推动了这一波大模型热潮的发生,而大语言模型的发展,带来了AI开发或AI应用范式的大迁移。

我们姑且把大模型之前AI发展阶段称之为AI 1.0。在过去AI 1.0阶段进行开发时,当你明确一个应用方向和目标,你可能要选择一个或者多个合适的模型架构,在特定的基于标注的训练数据集上,去搭建一套数据清洗、模型训练、模型部署再到运维等一整套相对复杂的工作流,这些工作可能是由内部的团队来做,也可能是找一些第三方集成商来完成,例如国内的商汤、海外的C3.AI。

但带来的问题是,你需要在单一的应用场景中投入数百甚至上千万的前置成本,同时可能也要投入数十人的算法和工程团队,去维护一整套的模型架构、体系,而且在不同应用之间是不可迁移的,你需要反复地去造轮子。依据商汤科技在招股书披露的数据,其一年要开发近万个AI模型来满足不同下游客户的需求。

而到了大模型驱动的 AI 2.0时代,因为有了通用基座模型,具备通过zero-shot prompting(零样本提示)或few-shot prompting(少量样本提示),去实现模型能力在不同下游任务上的迁移,可横跨多模态,具备很好的性能。

当以通用基座模型作为基础服务,在此基础上去开发应用,成本和开发难度都会降低。以OpenAI 的 GPT 3.5的 API 调用成本作为参考,低至每千个token 0.002美元。这时我们要开发一个AI应用,就不需要前置投入一大笔钱,而是变为Pay as You Go的方式。

这与软件领域类似,从本地化部署on-premise的模式逐渐迁移到SaaS。软件领域的迁移大概是从2010年开始,极大的推动了软件的普及和渗透。2011年A16Z的创始合伙人Marc Andreesse 提出“software is eating the world”,到现在这个时间点,随着AI 应用成本进一步下降以及AI进一步普惠化,我们可以说,AI is eating the world,下一个 AI 时代已经到来。

当然上面只是一个抽象的概念模型,在实际应用开发中,我们可能还需要调用多个模型,不止是通用基座模型,可能还要连接小模型或是向量数据库,实际的最后一公里成本还没有那么低,但相较于原有的开发模式,肯定是极大地节约了开发成本。

大模型时代的新机遇

对于那些通用基座模型,即具备大参数量,权重中存储了海量的常识,且有比较强的复杂推理能力的模型,锦秋基金的观点是,它肯定是少数人的游戏,主要有三方面原因。

首先,它需要非常大的前置投入。比如2.5万-3万张A100的卡,同时搭建数据管线也需要很高的成本。这种前期投入,会随着下游应用调用量的增加逐渐摊薄,所以对于头部企业来说,它会有比较明显的规模优势。

其次,来自于用户反馈的数据飞轮。无论是基于用户反馈的强化学习过程,还是指令微调的过程,这些来自于用户使用后的真实反馈,能够促进模型在应用上的性能迭代。

最后,大模型的下游,一方面是面向开发者,另一方面它又面向C端用户,能够在开发者和用户间形成双边网络。更多的开发者开发了更丰富的应用和插件,能够吸引更多用户,而由此带来的收入机会又会吸引更多的应用开发者,这样的双边网络会促进头部基座模型形成领先生态。

预计未来通用基座模型只会有3到5家主导性的模型供应商。目前来看,业界领先的基座模型有OpenAI 的GPT3.5、GPT4,谷歌的PaLM 2和ANTHROP/C 的Claude。

未来的行业格局可能会比较像云计算,3家头部厂商,各家的模型可能会略有差异化的能力侧重或价值主张,有的更强调语言类任务,有的更强调多模态。

同时我们认为,未来还会存在一个活跃的开源生态,例如围绕Meta开源的LLaMA已经诞生了一系列的羊驼家族模型。那些对数据隐私和安全性要求较高,或对模型某一类性能有比较极致要求,同时没有特别复杂的推理需求的垂直场景,可以在finetune开源模型的基础上去做应用开发。

锦秋基金执行董事臧天宇

对于锦秋基金来说,目前我们看好以多模态大模型作为认知和决策引擎,集成多种外围模型、工具、数据库,去构建AI原生或者AI赋能已有场景的应用。

从投资的角度来说,大模型孕育了哪些新的机会呢?我们对此做了梳理。

不考虑最底层的算力提供商,大模型的生态大概可以分为四层。

最下层是 foundation model ops 层,包含针对模型的训练、推理、部署优化以及一些数据工具。这一层的挑战在于价值可能受到更底层芯片厂和云厂商的挤压,如果未来底层更多是异构或多云的生态,那么会更有机会。

在此基础之上是模型层。这其中就包括通用基座模型,这是链条中价值最集中的一环,但从创业的角度来看,可能机会并不多。同时还存在一些基于开源体系的垂直模型,它最终是面向某个特定行业或者场景的应用,我们会更多结合具体行业应用做进一步考察。

在这两层之上是开发者工具。通过集成一些中小模型、向量数据库,去解决应用中诸如胡说八道或者长短期记忆等方面的问题,在此过程中,他肯定需要有一些开发者工具,去帮助顶层的应用开发者更好地完成应用的搭建。由于它受益于生态整体的发展,在中短期有比较高的确定性,但也要关注长期天花板问题。

最上层为应用层。这一层我们认为长期会诞生最多有价值的公司。从我们的观察看,目前市面上的应用主要集中在三个方向。

围绕大模型的投资机会版图

第一类是基于大模型比较强的开放域生成能力,解决创意启发、创意产生环节的问题。

第二类是利用大模型很强的消化吸收和索引知识的能力,可以在学习专业知识的基础上去做推理问答,能够在一些知识密集型的行业,例如法律、医疗、教育,去满足研究和咨询等场景的需求。

第三类是利用大模型本身较强的推理能力,以及代码生成和使用工具的能力,去再造自己的业务流。无论是营销端的业务流、还是企业内部管理的业务流,去解决端到端的效率问题。

这是我们目前关注到的,无论是AI native,还是基于AI去做嵌入和赋能的比较主流的创业方向。无论选择哪个方向,在做AI应用中有一个比较关键的点,就是如何面向数据闭环去做用户体验设计。在我们利用AI赋能前,首先需要对业务目标有清晰的定义,再面向这个目标进行优化,同时你要把定义清晰的这些指标通过用户体验设计的方式,落到你的产品中,才能形成正向的数据飞轮。

除了以上这些,锦秋还关注相对偏早期、偏长期的机会,即大模型和机器人的结合方向,如何让机器人和自动驾驶实现更高的智能。

首先,该方向具备很高的技术价值。一方面,探索从LLM到AGI过程中可能有一个比较重要的路线,就是具身智能(指能理解、推理、并与物理世界互动的智能系统),目前大模型只是从静态的文本和视觉图像中去学习,未来可能要从与环境的交互中去学习,这需要大模型和机器人的结合。

另一方面,对机器人行业来说,能够让其从目前的自主型机器人发展到真正的智能机器人。现在的自主型机器人在任务中能做一些简单的自适应,但它是基于对已有环境清晰的建模和特定任务明确的示教,未来机器人能够完成在更开放环境的探索或者多任务的迁移学习。

其次,从商业价值角度来看,无论是清洁工、卡车司机、建筑工人、产线工人,其所做的工作有一部分是可以通过现有技术解决,但仍存在很多问题,是需要花很多成本才能在某个环境下落地,如果未来能够用更智能化的机器人去解决,将会是万亿美金级的市场。在这个方向上谷歌已经做了比较多探索,基于PaLM模型做了非常多大模型和机器人结合的研究。

当然这其中也存在很多挑战,比如大模型如何进行压缩并部署到端侧,或者可能是云-端多模型协同的一个架构;其次,过程中需要大量的多模态预训练数据,且需要不同模态间对齐,怎么规模化地去获取这样的数据,可能数据合成会是一个重要的方向;最后,这些场景是和物理世界相连接的,这其中如何保证模型的安全性,如何做质量控制,都是非常值得思考的问题。

大模型热潮爆发前后,国内外涌现了很多基于大模型领域的创业公司,我们也对海外大模型方向的创业公司进行了梳理。

截止到2023年4月,海外的创业公司最集中的类别主要在创意辅助类的应用,比如文本生成、文生图、文生视频等方向。

第二大类是面向个人的生产力工具,利用大模型去完成个人工作流的重构。

第三大类是基础设施,相对更偏向工具链层,即如何利用好的工具链体系,在大模型的基础上去搭建应用。无论是像LangChain这样的开发框架,还是Pinecone这样的向量数据库,以及其他一些数据工具,都有不错的热度。

此外面向2B场景,能帮助企业实现内外部工作流重构。比如Chatbot跟企业的客服、销售、营销以及企业搜索等场景的结合,或者一些垂直行业的生产力工具,例如从对话到销售线索的分析、医疗记录和处方的转写、人身伤害赔付的文书准备等等。

锦秋基金在AI领域深耕多年,对AI整个商业周期的发展有切身感知。

从2012年开始,以深度学习驱动的AI 1.0萌芽,推动了CV领域的高速发展,人们对AI能力及其通用性的预期经历过一轮高峰,但事实却并没有达到大多数人的预期,最终落地的最高价值场景是在字节和Meta的信息流推荐业务中。其次,在人脸识别落地于安防场景的过程中,AI四小龙也捕获到了一定的价值和行业机会。

随着第一轮泡沫逐渐破灭,大家意识到AI的落地无法摆脱垂直领域经过标注的高质量数据集,且很难在不同任务、场景间迁移,AI开始向与垂直行业深度结合且以数据为中心的范式发展,由此带来了AI+工业、AI+农业、AI+医疗等领域的兴起,自动驾驶也向着不同的垂直场景去落地,AI 1.0重新进入了爬升期。

站在今天这个时间点,两条主线交汇。一方面,AI 1.0经历了泡沫后的复苏,和行业的结合更加紧密,逐渐进入到了商业化“摘果实”阶段;另一方面,以大模型驱动的 AI 2.0 又刚刚过了萌芽期,为行业带来了新变量。

⭐️如果你是AI领域创业者,欢迎投递BP至 bp@jinqiucapital.com

锦秋基金愿与你共赴AI新纪元!

 

——END——

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/52323.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

查理芒格语录

要点 要有逆向思维 客观分析 每天读书 但要给每天读书要个固定的时间段,让自己不受打扰,高效的读书 如果你想要获得你要的东西,那就让自己配得上它。信任、成功和钦佩都是靠努力获得的 联系:怎样找到好的伴侣? 提升…

巴菲特、芒格的傲慢与偏见

(图片来源于网络) 5月1号,伯克希尔哈撒韦公司股东会,巴菲特和芒格出席。会上有人通过主持人提问,说现在加密货币市场市值已经突破2万亿美元,问巴菲特和芒格二位是否仍然认为加密货币是“无用的人造黄金”?巴菲特耍了个…

计算机读书笔记1500,《罗辑思维》读书笔记1500字

《罗辑思维》像一扇打开新世界的大门,能不断刷新我对世界的理解。 罗胖总是反向提出事情的别样观点,乍看之下,违背常识,仔细一琢磨,还真的有几份道理! 读完《罗辑思维》认知篇,想和大家分析下书…

如何读书和选书?

上面这个公号「涩郎」,是我的一个备用号,为了防止万一哪天大号失联,平时一周我也会发三篇左右的我的思考,读书笔记,认知感悟等文章,带领大家一起探索精神与财务自由之路。 前几天我在年终总结的时候&#x…

查理芒格思维模型 —— 费马帕斯卡系统

前言 查理元思维模型最早的提倡者,他说这样的好晶体,至少能数出一百个,它们都来自「重要学科的重要结论」 查理芒格提 在《穷查理宝典》中提到了有100多个思维模型, 他尤其强调了: 数学:复利原理、排列组…

《查理·芒格的智慧:投资的格栅理论》读书笔记

Charles Munger查理芒格是一位思考者,把自己的深度思考和投资相结合,取得了非凡的成就。幸运的是,他把自己的思考方式告诉大家,同时也分享了他自己的格栅模型。学习那些基础学科的基础理论,并将它们应用到自己的实践中…

不可错过的查理芒格科普智慧

“和你一起品程序人生”,这里是程序新视界,我是二师兄。 已经听腻了二师兄的絮叨?今天为你请来了一位智慧的老者,与你分享他人生的一些科普智慧。或许其中的某一条会让你豁然开朗,开启新的人生篇章,少走弯…

世界读书日之后聊聊读书

大家好,我是二师兄。世界读书日刚过,结合最近看的影视和读的书,聊聊一些关于读书和推荐书的想法。 先说说推荐书的事。时不时有人说:最近想读书,给推荐几本好书吧。对于推荐书这件事,起初有些兴奋&#xf…

chatgpt赋能python:Python与SEO:两个强大的工具的结合使用方式

Python与SEO:两个强大的工具的结合使用方式 SEO或搜索引擎优化一直是网站和在线业务成功所必需的重要部分。而Python编程语言是一种广泛使用的高级编程语言,可用于多个任务和领域,包括SEO优化。 从提高搜索引擎排名到自动化关键词分析和竞争…

chatgpt赋能Python-python_picture

Python 图片处理:从基础到高阶 Python 作为一门开源、高效、易学习的编程语言,被广泛应用于图片处理领域。在这篇文章中,我们将从基础的图片处理方法到高级的机器学习应用,一步一步的介绍 Python 可以做什么、怎么做,…

国内AI大模型 VS chatgpt (20)-- H265/H264有何不同,h265有什么优势?

H265/H264有何不同,h265有什么优势? 文心一言: H.264和H.265是两种不同的视频编码标准,它们在压缩质量和带宽需求方面有所不同。 H.264是一种高效的视频压缩标准,它的编码单位是宏块(macroblock)&#…

马赛克也被破解了!宅男的福音

我的新书《Android App开发入门与实战》已于2020年8月由人民邮电出版社出版,欢迎购买。点击进入详情 GitHub严选:每天推荐一个GitHub优质开源项目 路再长也会有终点,夜再长也会有尽头,不管雨下得有多大,总会有停止的时…

2023智源大会议程公开丨基础模型前沿技术论坛

6月9日,2023北京智源大会,将邀请这一领域的探索者、实践者、以及关心智能科学的每个人,共同拉开未来舞台的帷幕,你准备好了吗?与会知名嘉宾包括,图灵奖得主Yann LeCun、图灵奖得主Geoffrey Hinton、OpenAI创…

Neuralink 估值355亿,脑机接口没有第二个“马斯克” | 钛媒体焦点

图片来源:mixed-news ▎两年公司估值翻了接近三倍,马斯克的Neuralink成为了脑机接口行业规模最大的企业。 作者|林志佳 编辑|李小年 脑机接口技术又重新火爆了起来。 埃隆马斯克(Elon Musk)创立的脑机接口公…

“踢爆”职场焦虑、玩机车、文科转大厂程序媛,乘风破浪的 IT 女神太飒了!

女程序员、产品经理,在科技圈中究竟是怎样的存在? 作者 | 苏宓 出品 | CSDN(ID:CSDNnews) 以 IT 为圈,在这个围城之中,尤其是技术相关的岗位而言,男性占比高于女性早已是一种常态。…

1700页,卷S人的 软件测试《八股文》PDF手册,涨薪跳槽拿高薪就靠它了

大家好,最近有不少小伙伴在后台留言,又得准备面试了,不知道从何下手! 不论是跳槽涨薪,还是学习提升!先给自己定一个小目标,然后再朝着目标去努力就完事儿了! 为了帮大家节约时间&a…

短视频文案怎么写才能吸引用户?幽默不是唯一,触发情感也很重要

短视频文案怎么写才能吸引用户?幽默不是唯一,触发情感也很重要 很多做短视频的小伙伴们都会烦恼一件事,那就是不知道短视频的文案究竟要怎么写才能够顺利的吸引到用户。很多小伙伴认为幽默的文案才能吸粉引流,但其实除了这种方式…

做短视频不想真人出镜?分享三种无需出镜也能涨粉的短视频类型

做短视频不想真人出镜?分享三种无需出镜也能涨粉的短视频类型 很多人做短视频其实只是出于兴趣,而且因为各种各样的原因,所以并不想要真人出镜。那么今天我们就一起分享三种无需出镜也能涨粉的短视频类型,简单好做,而…

将用户名从中文改为英文

将用户名从中文改为英文 这是困扰了我很多年的问题,前几年搞过一次,但是有点担心,就放弃了,今天2021/11/04终于解决了!!!! 如果网友要通过我这篇博文来做修改,请慎重&am…

(修订)如何修改个人简历?一些过来人的经验

作者:汕大小吴(投稿) 一、前言 又到了招聘的季节,看到很多师弟师妹们不太懂得如何写简历来展现自己,这里我想给出我个人的一些建议。 因为我的简历修改了很多次,也参考了大佬的建议,也咨询过师…