跨越山海的云知声,迎来了自己的GPT时刻

文|光锥智能,作者|郝鑫,编辑|王一粟

“世界上最高的山是什么山?”

云知声创始人兼CEO黄伟仍清楚地记得,十年前他用语音提出的第一个问题。答案播放出来的那一刻,黄伟第一次体会到创业的成就感。

今年2月底,山海大模型雏形初现,用同样的问题测试,黄伟一瞬间感觉好像穿越回了十年前,那座“最高的山”正在招手呼唤他。

“去年12月第一次看到ChatGPT,正是我创业十年最灰暗的时刻。而现在站在发布会舞台上,剩下的只有紧张、兴奋和自豪。”黄伟庆幸,自己再次搭上了AI下个十年的快车。

5月24日,云知声正式发布“山海大模型”,现场实测十大核心能力,具体包括:语言生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、安全合规等7项通用能力,以及插件扩展、领域增强、企业定制等3项行业落地能力。

值得一提的是,除了通用能力的演示,一向重视“工程化”的云知声也比较明确地提出了落地能力的实现路径。这让大模型的落地更加实际,不是空中楼阁。

而在更重要的行业应用层面,云知声则仍然坚持此前提出的“U+X战略”,赋能医疗、智慧物联、销售、知识管理、教育等千行百业。

在云知声最为重要的落地场景之一——医疗领域,黄伟透露,山海大模型在临床执业医师医学考试中拿到了511分,满分600分,考生平均分为365。“在医疗领域,山海大模型已经超越了GPT-4的中文水平。”

得益于此前在Ttransformer模型方向的发力,以及从2016年对医疗领域的深耕,云知声从去年12月开始组建AGI团队,“闭门修炼”5个月后,就拿出了一个在通用能力方面与国内大公司打平,在行业大模型超越GPT-4中文水平的成绩。

黄伟并不满足这样的成绩,给云知声定下了年内的目标,“年内通用能力比肩ChatGPT,并在医疗、物联、教育等多个垂直领域能力超越GPT-4。”

虽然2个月近20个大模型发布中“有李逵也有李鬼”,但一流AI公司的技术水平可以靠时间接近GPT-4成为了行业共识。当技术拉齐后,大模型正在打响一场“行业”争夺战。

01 把通用能力用起来

在通用能力上,云知声山海大模型顺利通过了语言理解、推理能力等一系列测试。

首先,在对中文的理解方面,山海大模型更接近“中国人的体质”,可以精准地理解中文6级水平的绕口令“行的人,干一行行行行,行行都行”中每个“行”的意思,还能给出单独的解释。知道八大山人是画家的名号,孙悟空和齐天大圣是同一个人。可以说,山海大模型对中文的理解达到了百科字典的水平。

不仅如此,山海大模型还具备逻辑判断和计算推理能力。例如,可以识破“所有猫都爱吃鱼,所以爱吃鱼的动物都是猫”这类伪三段论逻辑,以及“小明爸爸姓王,问小明姓什么”这类基本常识问题。

而在计算能力中,山海大模型可以立即给出鸡兔同笼这类简单问题的答案和解题过程,也能够根据指令当场编写代码。在涉及开根号等复杂的数学运算上,山海模型也没有拉胯,过程清楚、答案正确。

总体来看,与国内各家大模型相比,山海大模型虽然没有展现图文生成等多模态的能力,但关键的NLP(自然语言处理)表现仍在头部水平。

光锥智能盘点了已发布大模型的公司发现,随着技术的不断更新迭代,各家公司在文本生成、知识问答、语言理解、逻辑推理等各项通用能力上的差距正在变得越来越小,甚至有了同质化的趋势。

所以,攻克大模型的技术难关只是第一步,如何用起来才是接下来的关键。

ChatGPT惊艳全球后,OpenAI随即抛出的一颗惊雷,就是宣布向所有ChatGPT Plus用户开放联网功能和70多个第三方插件,插件覆盖了衣食住行、社交、工作以及学习等方方面面。

面对千行百业,没有一家公司能够独立吃下所有场景。民生证券报告称:“OpenAI正沿着类苹果模式的‘终端+平台+生态’,迈向高于操作系统的战略地位。”

云知声也有同样的思考路径,但不同的是,更希望利用插件,将合作伙伴的能力集成进来。用了计算器插件,山海大模型就实现了复杂计算的能力;用了搜索引擎插件,就能帮用户实时查天气、查球赛结果。与ChatGPT一样,给大模型按上了插件就装上了“外挂”。

黄伟表示:“大模型的通用能力并不能解决所有问题,还有说胡话的风险。特别是在医疗、汽车、物联一些容错率低的专业场景中,通用能力就显得不那么够用,所以才要引入大量的插件来推动应用落地,做大模型的黄金搭档。”

云知声也给AI公司做大生态提供了借鉴思路,面对很多垂类的行业场景,AI公司一方面可以自己做一些插件去开放给行业客户,集成到产品里。另一方面,也可以让客户自己做插件开发,共同深入场景。

02 成为行业专家

通用能力的提升,在行业场景的实际落地方面,还远远不够。这就要求大模型们,不仅成为AI领域的“本科全才”,更要成为特定领域中的“博士生”甚至“博导”。

即使通用能力强如ChatGPT,在医疗等特定领域的专业度也远远未达到可用的水平。例如,对一手术过程的描述,ChatGPT给出了一个完全错误的答案。可以说,一旦涉及到核心的诊疗过程,ChatGPT目前只是一个“庸医”。

“如果把GPT-4比作一个不偏科,每门都能考到80分的学生;我们要做的,则是一个可以在某一两门学科,考到95分甚至更高的学生。”黄伟在采访中说道。

而这恰恰是众多行业大模型的机会。从实际问题和产业应用出发,沉淀垂直行业经验,AI公司就能建立自己在特定领域的壁垒。

从这个角度而言,在AI 1.0时代积累下行业能力的AI公司,拥有更大的机会。

2016年,医疗+AI行业还犹如一片空白地带,彼时,AI企业们还在找寻合适的降落姿势。

以语音技术起家的云知声,抓住了医生病历记录效率低下这个痛点,以语音电子病历录入打开了医疗赛道的突破口。

为了能够做到精准识别,云知声为医院做了深度定制服务,根据不同科室、不同病种整理病历资料,运算出关键词句语料,为40多个临床和医技科室提供分场景支持,以适应医院不同科室实际的使用需求。

经过专业数据优化后,云知声在医疗领域的优势十分明确,其语音识别准确率超95%,个别科室的语音识别率超98%。医生减负效果明显,可以使医生的录入效率提升40%,每天节省1.5-2个小时时间。

然而,仅从一个单一效率工具切入并不够。

三年磨一剑,2019年,云知声公布了“医疗+AI”的战略,从电子病历场景出发构建起了医疗产品体系。除“医疗语音交互解决方案”外,针对诊疗过程的诊前、诊中、诊后不同场景,云知声还推出了导医机器人、智能病历生成系统、智能病历质控系统以及智能院后管理解决方案等产品。

此外,基于对场景的理解,云知声在医疗垂直领域建立起了知识图谱,图谱覆盖了症状、体征、疾病、手术,检查检验,药品等七大类实体,共计132万个,对应医学术语334万;包含十大类实体关系,共计757万实体关系。2017年建立至今,该知识图谱仍在更新迭代中,这成为云知声核心壁垒之一。

黄伟介绍知识图谱在大模型训练中发挥了重要的作用,“行业大模型训练有三个主要的数据来源,一是云知声多年沉淀下来的优质医疗数据,预训练阶段可以加强大模型的知识和语言能力;二是在医疗行业积累的问题解决数据,这部分可以拿来做微调;三是知识图谱,靠它严谨的知识来校验数据和训练结果。”

在高质量质量知识图谱数据之上,实现了数据到场景的全链条打通,云知声旗下的医疗产品从语言电子病历、语音助手这类效率工具,进化为了病历文书质控、医保支付审核一类的决策支持工具。

在大模型的加持下,云知声也完成了从AI助手到AI专家,再到AI导师的角色升级。对比从前,所能抵达的场景更加厚重,能触及的核心技术更多,行业know-how的经验再次更新沉淀下来。

如果说,云知声在医疗行业的扎深是一家AI公司如何深入到行业的典型,那么其在物联网领域的拓展,则证明了一家AI公司如何能把技术变成靠标准化的产品,从而打开行业广度的生意经。

2015年,云知声启动了AI语音芯片项目,并提出“云-端-芯”一体战略。一方面把在垂直行业积累的AI技能放在云端,一方面通过芯片去赋能设备端的边缘计算能力,进而把云端的算法能力向设备端进行输出。

通过自研芯片的方式将算法集成在芯片模组中,这不仅形成了相对标准化的产品,还让云知声实现了产品成本的降低。“标准化+降本”,才能大规模应用到智慧家居、车联网等场景。

同时,云知声这些年还搭建了厚重的中台能力。物联中台发挥集中调配、汇总信息的功能,实时管理设备、人员、服务等各项因素,最终通过语音交互输出指令反馈。

而到了大模型时代,面向智慧物联场景,会有什么样的进阶呢?

ChatGPT已经让业界看到,人人都能拥有一个AI助手即将成为现实。“未来将全线升级智慧物联核心产品,与山海大模型深度结合,塑造出一个真正的随身管家:从只能进行指令交互升级为类人对话,真正联动IoT生态和服务。”黄伟在发布会上表示。

“与全场景自然语言交互相比,搜索引擎的市场就非常小了。”一位曾在语音等AI领域深耕20年的创始人曾对光锥智能表示,万物智联的自然交互,才是更广阔的市场。

“大模型发布后,无论是汽车、智能家居、酒店等各个潜在客户,已经迫不及待地在跟我们要方案了。”黄伟透露。

十年间,云知声AI实现了三级跳,从第一阶段的AI三驾马车、“云端芯”战略,到第二阶段的以超算中心、知识图谱等构成的规模化AI技术战略,和开放平台+智慧物联/智慧医疗的“U+X”市场战略,每一个阶段都紧跟技术和市场的变化。

再到如今的AGI时代,云知声也迎来了自己的GPT时刻。在技术上,不仅拥抱基础大模型,也在工程化上利用指令调优+反馈强化,让大模型不断迭代提升;另外,也在多知识/多模态,以及跨语言/模态方面积极布局,为增量需求拓展能力。在市场策略上,依然坚持“U+X”,实现AGI+Industry生态加速。

在此次发布会上,除智慧医疗、物联场景外,云知声亦在教育、销售场景、知识管理等场景上储备下了能力,准备迎接更多行业的升级需求。

03 行业争夺战打响,云知声如何比拼?

自3月以来,国内已有20多个玩家狂奔入局。从文心大模型到山海大模型,国产大模型之战迎来中场战事,从比拼“通用”进阶到了比拼“行业”。

据不完全统计,在国内发布的大模型中,行业大模型占比超过60%,各家AI公司大模型已经开始向工业、金融、医疗、营销、智慧物联等多个领域渗透。比如,百度在发布文心一言后,在全国各地陆续举办了多场行业大模型的推介会,涉及工业、能源、媒体、金融等领域;而阿里云虽然没有发布单独的行业大模型,但也强调维度更垂类的企业大模型。“未来每一个企业在阿里云上既可以调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。”

相比巨头在技术上拼参数,在市场上拼生态,云知声这样的小巨头,也有自己从本质出发的思考。

“ChatGPT将人工智能研究的核心带回到语言本身,而语言其实是人类智能的一个核心载体。”云知声董事长梁家恩认为,这是一个从专用AI转向通用AI(AGI)的突破口。”

但转向通用AI,并不能盲目的扩大训练参数。这是因为,虽然在优质数据规模足够大情况下,模型越大效果越好,但训练成本也越高。

基于AI 1.0时代在专用AI方面的积累,云知声计划先将模型做到六七百亿参数,做出涌现效果,然后以这个参数规模,提升优质数据规模和大模型效果,再做千亿以上参数来提高大模型性能。

云知声坚信,通往AGI的路不只有一条。

“除了用大力出奇迹去做大模型,也可以用更高质量的‘数据+规模’当适当的数据参数,做行业‘中模型’。”黄伟表示,云知声目前正在两条腿一起走路。今年Q3云知声会发布对标GPT-3.5的“山海2.0”,数据参数也将达到千亿级。而在Q3,云知声的“中模型”也即将发布。

既然要做中模型,在行业争夺战中,又回到了上个阶段中对行业深耕的过程。

纵观整个中国市场的行业大模型玩家,首先基于1.0阶段积累的行业经验不同,各家深扎的场景也不同。现阶段,想要横跨多个行业不太现实,无论是头部大厂还是中小公司都可以有自己的壁垒。

其次,即使是进入同一行业,每家公司瞄准的方向也不同,细分领域竞争更具多样化。如同样在医疗领域,云知声将语义识别的优势运用在了门诊病历撰写、手术报告生成上,而商汤则将重点放在了线上问诊、咨询上。

而在真正的行业应用落地时,还要考虑实际成本。

在AI 1.0阶段,被调侃“有多少人工就有多少智能”的数据标注情况,将被自动化标注逐步替代。相对于GPT训练中需要的45T数据,以前的AI训练数据量如同九牛一毛。在数据量较小的情况下,还能做到分离标注,而现在数据训练过程完全自动化,根本无法标注。于是,需要通过人类生成反馈的技术,替代传统数据标注。

另外,则是数据训练成本。云知声认为,大模型训练成功后,以目前的算力成本,可能需要把大模型参数量通过蒸馏技术压缩10倍才能满足实时性和规模化应用要求,这要视具体应用场景而定。云知声在做BERT模型时,就通过模型蒸馏提速近百倍,而实际性能损失很小。“就像打击索马里海盗,不能每次都开着航母过去。”梁家恩称。

04 技术撬动行业价值

纵观国产大模型,目前整个行业依然在非常早期,即使如马斯克所言,中美技术的差距有12个月,但放眼到未来20年的长期竞争中,这开头的100米或许并没有那么重要。

回顾1.0阶段,AI公司花费了6年的时间实现了价值跨越。

科大讯飞营收从2017年的54.45亿,一跃增长至2022年的188.20亿,对应28.15%的复合增速;商汤的营收从2018年的18.5亿,增长至2022年的38.09亿,收入也实现了翻倍。

上个阶段,AI技术实现了旧业务的提效、新业务的增长,最终达成AI公司营收、市值的双增。进入2.0时代,这个逻辑依然成立,只不过2.0阶段可能释放的价值会更大,用的时间也会更短。

黄伟判断,在新时代有两件事目前是已经确定的。首先,AI公司具备了更强的技术能力后,就能更好地满足客户需求,继而也能更容易地推动商业化落地。其次,客户强烈的需求会拉动整个市场空间增长,但高准入门槛又会将一部分公司拒之门外,最后能在市场分蛋糕的是那些实力过硬的玩家。

回顾云知声11年的创业历程,保持技术的领先性和符合时代的市场战略都同等重要。“勤劳勇敢”的中国AI公司,面对新技术和新市场的热忱,会趟平所有可见的困难。

正如黄伟所信仰的,“所爱隔山海,山海皆可平”。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/8289.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT开始颠覆学习方式,应试教育面临哪些挑战?

ChatGPT爆火几个月,整个教育系统都在被颠覆。全球范围内,不少大学教授、系主任和管理人员,都在对课堂进行大规模的调整,以应对ChatGPT对教学活动造成的巨大冲击。 国内传统应试教育选出的分霸、考霸,是更能吃苦&#…

ChatGPT在教育领域的实际应用范围及局限性

ChatGPT 可以用来聊天,搜索,翻译,写代码,甚至参加某些考试。 ChatGPT在教育领域有哪些实际应用的范围 一、信息检索的替代方案 ChatGPT可以帮助学生获取精确的信息,并提供即时的结果。 例如,通常搜索引擎…

微软总裁揭示:中国将成为人工智能ChatGPT的强劲对手,商业应用加速推进

人工智能(AI)是当今世界最热门的话题之一。自从该领域进入了今天的阶段,它的发展速度越来越快,引起了人们的关注。在人工智能领域,中国的研究机构和企业将成为一个重要的竞争者。这是微软总裁布拉德史密斯在日本接受采…

牛逼,一个基于 ChatGPT 的 AI 阅读助手

【公众号回复 “1024”,免费领取程序员赚钱实操经验】 大家好,我是章鱼猫。 今天推荐的这个项目是「myGPTReader」,AI 阅读助手,一个在 slack 聊天软件里的 bot,可以读取任何网页、电子书与文档,并根据与问…

ChatGPT AI智能对话机器人 全新版本

ChatGPT中文版这是一款可以和人工智能聊天的软件,您可以与人工智能进行热烈的讨论,在聊天过程中会出现了很多可以触及的话题,用户可以在这里了解到软件的AI思维是怎样的,对任何问题都有独到的见解。 ChatGPT ChatGPT 无限问答版 立…

chatgpt赋能python:Python继续循环

Python继续循环 在编程中,循环是一种重要的控制结构。Python作为一种高级语言,提供了多种循环结构:for循环、while循环等等。但是有时候我们需要继续循环,也就是跳过当前循环,进行下一次循环。在Python中,…

【跟着chatgpt学go】Gooutine和Channel

Goroutine Goroutine 是 Go 语言中的一种并发机制,它是一种轻量级线程,可以通过关键字 go 启动一个新的 Goroutine。相比传统的线程,Goroutine 拥有更小的栈空间,因此可以创建更多的 Goroutine。 下面是一个简单的 Goroutine 的…

进阶 用循环实现用户登录程序

编写代码实现登录&#xff0c;并且只登录三次。 #include<stdio.h> int main() { int i0;for(i0;i<3;i){printf("请输入密码“);}return 0; } 根据提议我们可以首先打出框架。 不妨先假设密码为字符串。123456.#include<stdio.h> int main() { int…

chatgpt赋能python:Python怎么循环

Python怎么循环 循环是编程中最重要的控制结构之一&#xff0c;它允许我们重复执行一组语句&#xff0c;直到满足某个条件为止。在Python中&#xff0c;我们有多种循环结构可供使用&#xff0c;本文将介绍它们及其用法。 for循环 for循环通常用于迭代&#xff08;遍历&#…

求助linux tty1问题 登录后闪退 循环登陆

第一天换了镜像清华源&#xff0c;装了几个包&#xff0c;第二天服务器卡死&#xff0c;重启无法进入图形界面 输账号密码弹出来一堆报错&#xff0c;然后闪退&#xff0c;又要重新登录 报错/usr/lib/update-notifier/update-motd-fsck-at-reboot:26:ask:not found 报错/usr/li…

【ChatGPT】《Cursor教程:全自动代码生成器,GPT-4让人人都可以编程》- 知识点目录

《Cursor教程&#xff1a;全自动代码生成器&#xff0c;GPT-4让人人都可以编程》 Cursor是一款由GPT-4加持的全自动编程神器&#xff0c;任何人都可以用它来编程或者学习编程。 CommandK&#xff1a;用来调出生成代码框&#xff0c;输入你想要的程序CommandL&#xff1a; 问它…

智能客服领域中的ChatGPT:如何打造一款更加智能化、精准化的中文版?

在ChatGPT智能机器人工具的实际应用中&#xff0c;如果在雷区周围提出问题并让其自我介绍&#xff0c;则可以大致了解该工具的基本特性和技术构成。这也说明&#xff0c;在设计和研发ChatGPT时&#xff0c;我们需要关注其对话交互、文本理解和生成等多方面技术要素的融合&#…

ChatGPT:未来的客服之星

当谈论到智能客服的应用时&#xff0c;ChatGPT&#xff08;聊天型GPT&#xff09;的效果确实令人惊喜。ChatGPT是一个基于人工智能的语言模型&#xff0c;具备理解和生成自然语言的能力&#xff0c;使其成为智能客服领域的强大工具。 随着人工智能的快速发展&#xff0c;智能客…

ChatGPT对软件测试的影响

本文首发于个人网站「BY林子」&#xff0c;转载请参考版权声明。 ChatGPT是一个经过预训练的AI语言模型&#xff0c;可以通过聊天的方式回答问题&#xff0c;或者与人闲聊。它能处理的是文本类的信息&#xff0c;输出也只能是文字。它从我们输入的信息中获取上下文&#xff0c;…

ChatGPT引爆变革:第四个被颠覆的行业——新闻与媒体

随着ChatGPT技术的不断发展&#xff0c;新闻与媒体行业正面临前所未有的颠覆。在这个领域&#xff0c;ChatGPT可以高效地生成新闻报道、编辑文章、撰写评论&#xff0c;甚至提供实时的新闻动态更新。这将带来新闻传播的速度和效率的革命性提升&#xff0c;同时也可能带来对新闻…

利用ChatGPT场景化学习英语听说读写

大家好&#xff0c;我是可夫小子&#xff0c;关注AIGC、读书和自媒体。解锁更多ChatGPT、AI绘画玩法。加我&#xff0c;备注&#xff1a;chatgpt&#xff0c;拉你进群。 我们从初中就开始学习英语&#xff0c;到大学也有小十年&#xff0c;在这个过程中&#xff0c;我们投入了很…

通过ChatGPT聊天,用Ctrl+C和Ctrl+V 两分钟开发了3个游戏

直接上图 游戏生成详细教程已经放到了我的知识星球了。下图部分展示 对ChatGPT还不了解的抓紧上车了&#xff0c;别人都赚钱了&#xff0c;你还没接触&#xff0c;加入我的知识星球告诉你怎么玩赚&#xff0c;还送你一个国内很贵的ChatGPT独立账号。 下面截图是我的ChatGPT掘金…

macOS “应用程序不能打开”

右键*.app打开“显示包内容”-“contents” - “MacOS” 更改该应用的权限 在终端中输入&#xff1a;chmod x &#xff08;x前后空格&#xff09; 加应用文件路径更改安全性&#xff0c;运行该app 运行

使用python调用ChatGPT的API,打造属于自己的桌面智能助手

上期图文教程,我们介绍了ChatGPT的注册使用过程,并且使用ChatGPT生成了一个CNN卷积神经网络的代码,由于ChatGPT的官方只公布了GPT-3的API接口,因此我们基于ChatGPT 3代的API接口打造自己的智能小助手。 这里刚开始,由于我直接使用ChatGPT-3 API text-davinci-003模型搭建自…

ChatGPT,你的智能助手,社交办公利器

ChatGPT&#xff0c;你的智能助手&#xff0c;社交办公利器&#xff01; 嗨&#xff0c;亲爱的小红书好友们&#xff01;我今天要向大家强力推荐一款让生活工作更轻松的神奇助手——ChatGPT&#xff01;无论是工作中的问题求解、日常生活的疑惑迷茫&#xff0c;还是灵感创作的启…