原创 | 文 BFT机器人
横空出世的ChatGPT迅速在全球掀起一股AI浪潮,而后GPT4的惊艳发布更是在科技界掷下一颗深水炸弹。
正如英伟达创始人黄仁勋在GTC2023上说的那样“我们正处于AI的iPhone时刻”,由ChatGPT掀起的科技风暴正席卷世界,“AI是否会取代人类”这个沉寂了许久的话题再次被推到风口浪尖,AI威胁论甚嚣尘上,甚至引得科技大佬联名上书叫停GPT-5。
但在这几欲腾飞的风口上,国内AI大模型仍未至“冷静期”,资本市场热度不减,众多科技大佬入局创业“内卷”,AI大语言模型技术研发也阔步向前迈进。
01 初具规模,蓄势待发
资本入局,狂潮涌动。
ChatGPT掀起的大模型创业潮,距今已数月有余,在这期间,有人怀踌躇之心交付答卷——“文心一言”接受市场检验。
有人高调入局,谋划筹备:美团创始人王慧文招兵买马广发英雄帖,与一流科技公司达成并购意向,成立的AI科技公司光年之外目前已有两亿美金融资并落户搜狐大厦;出门问问创始人李志飞回归,志做“中国的OpenAI”;前京东AI掌门人创业狂揽数亿人民币融资,开发垂直类大模型……
日前,搜狗创始人王小川于近日正式官宣大模型创业成立“百川智能“,以5000万美金作为初步启动资金低调开场。据悉,百川团队招揽了大量王小川在搜狗的部下,模型目前在训版本有500亿参数,预计年中发布第一版,年底期望追平GPT-3.5。
王小川的技术理想主义和技术驱动的创业经验,历来受到业界、学界的多方认可,前搜狗团队基础加持,华为、腾讯、微软等大厂人才加入,还有清华大学与百川智能也将在基础科研和人才方面达成合作,王小川的大模型团队人才众多,可谓“闷声干大事”。
4月10日,昆仑万维和奇点智源合作自研、中国第一个真正实现智能涌现的国产大语言模型——「天工」3.5正式官宣,并将于4月17日启动邀请测试。
昆仑万维表示,团队自2020年起已深耕大模型领域三年,从最初的一亿级模型,到如今的百亿级模型「天工」,其智能水平已非常接近 OpenAI ChatGPT。「天工」4和「天工」5也将在未来陆续诞生。
无独有偶,商汤科技同日发布了它的类ChatGPT聊天机器人——「商量」(SenseChat),寓意“「商量」「商量」,都能解决”。背后的AI大模型「日日新SenseNova」则寓意着“苟日新、日日新、又日新”。
在一个多小时的发布会上,商汤CEO徐立实时演示了多轮对话、文本和图像生成、3D视觉生成、实时互动等。
除了常规的语言理解、支持问答、解决复杂问题、提供定制化建议、创建文本等生成能力外,「商量」还具备医学咨询能够为健康问题提供一定程度的参考帮助,并且可以进行AI编写代码。
此外,还有文生图大模型「秒画」,支持用户上传图片供学习风格,基于prompt生成相匹配的图片;数字人生成平台「如影」,用户上传符合要求的视频,再加上利用平台工具生成背景、语音等,制作称一段以自己为原型的数字人演示短视频;3D内容生成平台「琼宇」和「格物」则是可以生成建筑、园区等和扫描普通物体后3D建模。
发布会上商汤科技CEO徐立直言“我们可以为客户提供一个AI大模型超市“。目前,「日日新SenseNova」面向政企开放多种API接口和服务,企业可根据实际需求调用。
在「天工」与「商量」官宣前,阿里类ChatGPT「通义千问」于4月7日官宣并开启企业邀测,拿到内测资格的网友们纷纷对其从代码生成、文学创作、数学逻辑到语义理解等能力进行测评,并与GPT-3.5、GPT-4和百度此前发布的大模型文心一言进行横向对比。
「通义千问」目前不具备联网能力,也不支持多模态,仅限于文本生成。有网友评价其水平接近于GPT-3.5但还有瑕疵,与文心一言的表现则是各有千秋。
02 技术之战,国内AIGC亟待成长
从ChatGPT问世到现在已过去一百多天,这场AI热随着多位大牛、多家企业的下场依然在持续升温中,各大社交媒体上“有没有中国版的ChatGPT?”的话题引起了大家的广泛讨论。
多家大模型初创公司立志成为国内大模型领军人物,是对标ChatGPT的强大而不是单纯复刻,国内AIGC有自己的道路要走。
距离「通义千问」发布不到一周,今天的2023阿里云峰会上又扔出重磅消息,CEO张勇宣布阿里全系产品都将接入大模型,涵盖了衣食住行消费娱乐多种场景,钉钉和天猫精灵将率先接入测试,矩阵产品待评估后正式发布。
犹记上个月微软也是在发布会上官宣Microsoft 365 Copilot,并成功掀起了办公软件革命,阿里此次则更为彻底。
阿里云的全栈服务覆盖基础设施即服务(IaaS)、平台即服务(PaaS)、模型即服务(MaaS)三层架构,提供智能化探索所需的通用服务,为各行各业全身心拥抱智能时代服务。正是基于此前的技术累积和经验耕耘,张勇才能说出“我们为未来的智能化时代准备好了“的豪言。
王小川曾向朋友表示“最大最成功的公司一定是在应用上想得最清楚的公司”,对于百川智能的发展他也有着自己的规划:要构建中国最好的大模型底座,在搜索、多模态、教育、医疗等知识层面增强,同时发展通用模型和垂类模型。
OpenAI的胜利在王小川看来是技术理想主义的胜利,而这是我们国内的研发和市场环境亟待提高的地方,也是为何ChatGPT没有率先出现在中国的原因。
我们拥有着人力财力充足的大厂,但是大厂注重效益、成绩、风险规避,很难为看不到未来的项目去过多投入,毕竟在推出ChatGPT的这条路上,在技术领域傲视群雄OpenAI都走了八年。
在这场AI浪潮里业界大牛看到了AGI的未来,看到了生产力的提升,看到了下游应用的拓展,于是纷纷投身进入,布局虽晚,但目标明确,未来依然可期。
昨日,国家互联网信息办公室也就《生成式人工智能服务管理办法(征求意见稿)》公开征求意见。乘上AIGC这趟科技革命东风,中国已开始从各方面做好准备。
03 结语
国内大模型这条赛道,从各AI公司成立,各大厂入场布局,到百万年薪人才抢夺战。
从顶着GPT-4压力发布的文心一言,前几日发布的「通义千问」,到前日官宣的商汤「日日新」,虽然产品内测表现距ChatGPT仍有不小差距,人们对于中国的大模型之路或看好或唱衰,褒贬不一。
但无可置疑的是我们正在经历从0到1这个过程,国内目前的大语言模型产品或许还不完整不够强大,我们已落后于时间,但只要怀揣初心,深耕技术,就一定会迎来最终蜕变的一天。
ChatGPT离真的AGI还有很远的路,大语言模型的刮起的这阵生成式AI之风能持续多久也尚未可知。在发展的过程中,我们不乏多点耐心拭目以待,看热潮褪去之后,谁能抗住挫折与低谷,迎来突破与革新,最终在这场AI大战中折桂。
且听风吟,静待佳音。
更多精彩内容请关注公众号:BFT机器人
本文为原创文章,版权归BFT机器人所有,如需转载请与我们联系。若您对该文章内容有任何疑问,请与我们联系,将及时回应。