数据智能产业创新服务媒体
——聚焦数智 · 改变商业
ChatGPT的火爆让AIGC站上了风口,行业迎来重大变局。
AIGC热潮席卷之下,大厂人纷纷投身AI大模型创业大军,大模型创业“百团大战”已打响。前有美团联合创始人王慧文官宣创业—— “光年之外”;后有阿里前技术副总裁贾扬清在朋友圈宣布从阿里“毕业”。这场AIGC的“百团大战”已经进入到白热化阶段。
昨日,王慧文与一流科技达成并购意向的消息更是刷爆全网。据悉,王慧文创立的公司光年之外将以换股形式收购北京一流科技,在现有团队基础之上,打造中国版的ChatGPT。目前,收购案已通过一流科技董事会。
王慧文与一流科技达成并购意向
在2023年2月13日,王慧文在社交平台发文宣布进入AI领域再创业并在即刻平台高调地发布了一个“AI 英雄帖”,广纳AI研发人才,打造中国OpenAI,特设北京光年之外科技有限公司,出资5千万美元,估值2亿美元,自有资金占股25%。据其透露,下轮融资已有顶级VC认购2.3亿美金。
近期更是有光年之外启动A轮融资消息传出,美团美团创始人王兴在3月8日发布朋友圈透露,将个人参与“光年之外”的A轮投资,并出任董事。王兴表示:“AI大模型让我既兴奋于即将创造出来的巨大生产力,又忧虑它未来对整个世界的冲击。老王和我在创业路上同行近二十年既然他决心拥抱这次大浪潮,那我必须支持。”
此次并购的一流科技什么来头?据了解,一流科技是一家做深度学习的框架创业公司,成立于2017年。其创始人兼CEO袁进辉为清华大学计算机系工学博士,曾任微软亚洲研究院主管研究员。至今公司完成4轮融资,最近一次融资发生在2021年2月,由高瓴创投独家领投的A轮融资,融资总额5000万元。
一流科技的核心产品OneFlow深度学习框架可对标谷歌的TensorFlow和脸书的PyTorch。OneFlow深度学习框架拥有完全自主知识产权,已获得十余项发明专利授权,首创自动数据模型混合并行、静态调度、去中心化和全链路异步流式执行四大核心技术,使用软件技术解决了在异构分布式集群上训练大规模深度学习模型所面临的大数据、大模型、大计算挑战,技术水平世界领先。
截至发稿之前,光年之外、一流科技对于收购一事均暂未回应。如果消息属实,那将意味着王慧文的“中国版OpenAI”进程无疑又往前走了一步。
王慧文打造中国版OpenAI所存在的差距
齐白石有言:“学我者生,似我者死。”
创立之初,王慧文宣称将打造中国版 OpenAI 创业公司,虽然王慧文发文后获得不少投资圈人士支持,但也有卖方分析师diss其“扯淡”,只会营销。ChatGPT如火如荼,资本市场热情被点燃。但王慧文致力于做中国版OpenAI真的有机会赶上甚至超越其已有产品吗?
从OpenAI的发展历程来看,其并非传统意义上的创业公司,其诞生源于特斯拉创始人马斯克、知名孵化器机构Y Combinator总裁山姆·阿尔特曼、在线支付平台PayPal联合创始人彼得·蒂尔与LinkedIn联合创始人雷德·霍夫曼等多位科技界知名企业家,预测未来有望改变世界的AGI(通用人工智能)必然会出现,且最有可能诞生于谷歌收购的位于伦敦的神经网络初创公司DeepMind。
从创立之初,到ChatGPT发布,OpenAI历经8年才有了如今的成绩。除此之外,不论在技术上还是资金上,微软、英伟达等美国科技巨头企业在人工智能基础设施领域给予了OpenAI巨大支持。
其中,微软作为全球顶尖的云计算巨头企业,其拥有全球领先的数据中心布局与算力规模,且建立了规模庞大、成本高昂的AI专用芯片集群。这些数据中心与专用芯片集群,为OpenAI旗下多款人工智能模型的深度学习训练提供了强大的算力支持。
另外,2019年7月,微软还对OpenAI进行了10亿美元的初始投资,并成为OpenAI技术商业化的“首选合作伙伴”。
而且,GPU巨头企业英伟达则在性能上提供了更多的支持。前不久,英伟达专门为OpenAI设计了世界上第一台单机箱深度学习超级计算机——NVDIA DGX-1,以用于最棘手的人工智能问题的处理。而类似NVDIA DGX-1这样的高性能产品,在中国人工智能领域是缺失的,也受到美国政府对中国企业的禁售限令。OpenAI也新上线了GPT-4,新版本比上一代文本处理能力更强,准确性更高,拉高了各方的期待值。
这些支持对于目前的王慧文来说,可能是最大的阻碍。在人员构成上,王慧文的光年之外,从公开渠道了解到,目前人员仅包括北京智源人工智能研究院副院长刘江、有着搜狗输入法之父之称的马占凯。在技术支持上,目前也仅与一流科技这样一家人工智能公司对接,达成并购意向,未看到更加像微软、英伟达这样有实力的公司为其提供强大的支撑。
华为创始人任正非曾表示,“在AI科技领域,我们短时间不会有什么成就,我们的计算太落后了,它需要大量的顶尖数学家,需要强悍的计算机运算能力。这两样东西,我们都缺乏”。
除了上述OpenAI已有的优势外,伴随着ChatGPT的火爆,国内也已经存在大量具有一定实力的玩家。例如,有华为、阿里、腾讯、百度与字节这样的互联网巨头企业,有商汤、旷视、云从、依图与寒武纪等这些新崛起的人工智能新锐企业。王慧文的光年之外与国内厂商的差距也不小。
百度文心一言能够早于很多大厂推出,最重要的原因就是百度一直有这类的应用存在。百度文心一言的技术核心是自然语言处理和深度学习技术,能够对海量数据进行分析,从而提供更加准确的建议。据了解,百度文心一言是百度人工智能技术在文本领域的一次探索,旨在提高写作效率和质量,能够分析文章的语言风格、情感色彩、阅读难度等数据,给出优化建议,帮助用户提高写作水平。然而,即使在人工智能领域深耕了数年,在部分拿到邀请码的用户在试用之后,对文心一言的表现似乎不甚满意。
商汤在AIGC的不同领域也已有多年布局,并于近期发布了多模态多任务通用大模型“书生(INTERN)2.5”。其拥有30亿参数,是物体检测标杆数据集COCO中唯一超过65.0 mAP的模型,“书生2.5”的图文跨模态开放任务处理能力可为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持。
其人员实力也是有目共睹的,商汤科技诞生于香港中文大学的实验室,其创始人汤晓鸥是香港中文大学教授,也是中国计算机视觉研究领域最顶尖的人工智能专家。联合创始人徐立、王晓刚与徐冰都分别是他在香港中文大学的博士研究生。
对于王慧文来说,不止要追赶OpenAI,还需弥补与国内企业的差距的同时,必须保证所实现的产品有比ChatGPT更好用的功能或者原版没有的亮点,不然谁会轻易更换产品。
追赶OpenAI的核心是什么?
面对AI大模型的热战,中国巨头正投入大量人力和资金加入了这场“技术赛跑”。除了王慧文的光年之外,百度的文心大模型、商汤的书生2.5大模型、华为的盘古大模型、阿里的通义大模型、腾讯的混元大模型等都是强有力的竞争者。
然而,中国版OpenAI的诞生,道路必定是漫长的,数据猿也从其目前发展状态上发现了光年之外与其他同领域玩家存在的差距,并给出了相应的建议。
首先,在技术和人员储备上。国内实验中做过的最大的模型是10亿个参数,GPT3的参数数量是国内的175倍,最新的语言模型GPT-4有1万亿个参数。王慧文的光年之外还未公布其数据,并且作为初创企业,也未发现其参数来源,又如何实现追赶OpenAI呢?并且其他竞争者已聚集其人脉,而王慧文还处于招兵买马状态。
另外,在资金上,这几年百度、腾讯、阿里都投入不低于OpenAI的资金量做大模型,OpenAI是一个烧钱的事情是确定的。ChatGPT硬件方面要3万张顶级GPU,加上CPU、内存、硬盘、网络和数据中心的电源与建筑,接近100亿人民币,训练一次要几个月,巨大的物料、电力成本之外,还有软件开发的费用。目前的竞争者中,同样兼具资金和技术实力也只有百度、华为这类大厂。虽然王慧文刚开始便获得了金额不小的融资,但对于持续烧钱的行业来说,其资金需求依然是个问题。
并且,在硬件上,训练AI需要庞大的算力。ChatGPT此次是用了5000块A100算力卡,但美国对国内禁运的首先就是A100。使用国产算力卡倒不是不行,只是芯片制程跟不上,导致英伟达1块卡,国内要用2-3块。相应数据传输时间也会变长,并且消耗的电力、物料成本更会成倍提高。因此,国内很可能不会很快追上OpenAI 的算力投入。
最后,在应用场景方面,目前该类企业还未实现真正的应用场景,这不仅是光年之外,也是目前百度的文心一言、商汤的书生2.5大模型、华为的盘古大模型等一直被诟病的问题。OpenAI CEO都直言这是一款“糟糕的产品”,金钱在燃烧,服务器在冒烟。部分地区没法光明正大访问,频繁出错的信息,他的原话是说:“人们访问的是一个有时能用,有时不能用的网站。”即使作为生产力工具,运用到文章转写、创作等场景,实际的应用深度并没有设想乐观。这导致ChatGPT暂时不能直接进入工作流,意味着这样的生产力工具都是“糟糕”的。
建议:
1、加速人员、资金和技术方面的募集和储备。在基础环境上保证强有力的输出,才能能快的追赶上他人的脚步。GPT相对其他模型,需要碾压式的参数数量。为了运作这样的超大模型,相对就需要无比庞大的算力。王慧文继续找到能够在技术上帮助其快速成长的助手。
2、提前想好出路,也就是未来公司产品的应用场景。ChatGPT属于AI的自然语言处理(NLP)方向,至今为止共计演化了三代。在早期,很多研究者并不看好GPT模型,因为这个模型有些反直觉,并且非常烧钱。处于早期阶段的创业公司,要想获得投资人的垂青,要么技术和工程化能力得特别强,要么对C端用户或者B端场景有特别深刻的洞察,能够把这些和AI技术结合,打造出能落地的产品。国内创业,不先走场景而走技术驱动非常艰难。王慧文可以从技术场景落地考虑为先,这样的动作才更有价值。
3、错位竞争。国内也只有BAT这样拥有自主云计算平台、且掌握大量用户的互联网公司,而且最好是和 ChatGPT 错位竞争,比如做中国可以正常联网使用的中文模型,但其中最困难的部分,其实是敏感词和有害信息的过滤。王慧文现在需要思考的最大的问题,并不是去多么追求技术上的革新,而是想清楚,这项技术本身,能不能带来生产关系的改造和生产力的提升。如果不能的话,其实没有太大的改变,因为他没有创造新的需求,或者说让这种关系足够改善。
总而言之,对于王慧文来说,虽然近期动作频频,但速度依然较慢,不仅需提高速度,在业务领域抓紧布局。更需要思考光年之外能真正带来的变革是什么?OpenAI能以很少的收入支撑很高的估值,获得长久的资金支持,除了技术信仰,还有资本和产业的支持,在国内,很难有VC拿钱冒险做技术驱动创新的环境,王慧文可能正在充当后者的角色。如果这是一次理想主义的试水,当所有的目标和过程坚定而明确,那么成败其实并不完全由结果判定。
文:媛媛 余小鱼 / 数据猿