科技云报道:大模型的中场战事,深入垂直行业腹地

科技云报道原创。

自从OpenAI于2022年11月推出ChatGPT后,一场波及全球科技界的“AI海啸”就此爆发。

在这里插入图片描述

自今年以来,国内已有超过30家企业入局大模型赛道。从百度“文心一言”、阿里“通义千问”的发布,到网易“玉言”、科大讯飞“星火”、昆仑万维“天工”等的推出,再到腾讯“混元”、京东“ChatJD”、华为“盘古”等的预告。互联网巨头、科技公司纷纷秀出“肌肉”,谁也不想在这场大模型混战中掉队。

在由OpenAI引发的这场狂奔中,大模型的发展阶段已经从“通用”迈入“垂类”。如果说通用大模型是大模型发展的初期阶段,那么垂直场景应用则可以视为“中场战事”。

在该阶段,应用与场景先行,倒逼垂直领域的大模型飞跃发展。不少医疗、金融、教育等行业内拥有用户数据积累的企业,已开始基于大模型“底座”,训练适配自身的垂类模型,比如近期由上海联通、华山医院联合开发的Uni-talk、医联“MedGPT”、云知声的“山海”等。

大模型路线分化

大模型让人类感受到的智能,是就像人类自身的学习那样,通过通用知识和逻辑能力的训练,具备了解决各种问题的能力。

大模型也有这种能力,基于文本语料采用无监督学习训练的模型可以用少量的监督样本,用于各类机器学习任务,比如图片分类、翻译、对话、写代码等,这样的能力就是所谓的通用能力。

当大模型发展到一定阶段,各领域企业意识到,其通用能力已无法承载更为专业的领域,比如医疗、金融等,每一个领域都是独立的知识体系,具备极为庞杂的知识量,显然仅靠通用大模型无法满足垂直领域的需求,这也为大模型之后发展路径的分化埋下了伏笔。

事实上,通用大模型发展至今,面临算力需求大、训练和推理成本高、数据质量不佳等挑战。一个成功的且可对外商业化输出的通用大模型,要求厂商拥有全栈大模型训练与研发能力、业务场景落地经验、AI安全治理举措、以及生态开放性等核心优势。

另外,训练基础模型的成本也是非常之高,做一个千亿级的大模型,需要单机群万卡以上的算力。从国内外来看,真正做通用模型的公司并没有那么多。相反,训练垂直领域模型所需要的代价和资源远远小于从零开始做通用模型。

因而,从商业逻辑的角度来看,大部分公司不具备做通用大模型的能力,巨头更适合做通用大模型,拥有丰富场景数据积累的公司更适合做垂域模型。

垂类大模型以深度解决行业需求为主,即企业在自己擅长的领域训练适合自己的“产业版GPT”。这类大模型生成的内容更符合特定垂类场景的需求,质量更高。

当前,已经可以看到不少垂类模型应用在金融、医疗、交易等场景中。比如,彭博社根据自身丰富的金融数据资源,基于GPT-3框架再训练,开发出了金融专属大模型BloombergGPT。

由此,大模型赛道目前出现了三类厂商:一类对标GPT的通用大模型,聚焦基础层的厂商;一类是在开源大模型基础之上训练垂类大模型,聚焦垂直行业的企业;另一类则是专注具体应用的纯应用公司。

通用VS垂类

从通用大模型到垂类大模型,是大模型技术发展到一定阶段的必然结果。

垂直大模型的发展主要体现在各个领域的模型性能持续提升,例如语音识别的错误率逐年下降,自然语言处理的语义理解能力不断提升等。通用大模型则在多任务学习、迁移学习等方面取得了显著进展,已经成为自然语言处理领域的重要研究方向。

比如,生物大模型能够提高AI制药效率。国外的研究报告显示,AI可以将新药研发的成功率提高16.7%,AI辅助药物研发每年能节约540亿美元的研发费用,并在研发主要环节节约40%至60%的时间成本。根据英伟达公开资料,使用AI技术可使药物早期发现所需时间缩短至三分之一,成本节省至两百分之一。

在产业角度来看,通用模型就是“百科全书”,能够有问必答,能够适用不同的产业土壤,而垂直模型类似于单领域的专家,虽然专业,但受众注定是少数人。

从演进路径上看,垂类模型是在通用大模型基础上训练而来,如果撇开通用大模型,垂类大模型不复存在。垂类模型强调领域的Know-How,对于特定领域来说,需要针对该领域的任务做指令学习。行业不同,场景不同,指令学习的区别也极大。比如,泛互联网行业更关注营销、推荐的效果,金融更领域更关注风控、可信、以及营销的效果。

两者的最大区别在于,垂类大模型在资源投入、成本投入等方面的要求下降了,但额外要求是行业Known-How,即对这个行业的知识要求提高了。

而从成本方面考量,通过通用大模型微调实现的垂类大模型相较通用大模型是“几何级别的下降”。根据国金证券的测算,在模型微调阶段,由于训练量级较小,仅为万级,相关的算力成本相比之下可忽略不计。

以斯坦福大学于2023年3月发布Alpaca为例,这是一个基于LLaMA-7B基座,应用5.2万指令对模型微调训练而来的对话类语言模型。该模型基于8块A100微调,微调时长3小时,算力成本不超过300元。

由于垂直应用大模型更符合垂类场景的需求、质量比通用大模型更高,也让众多企业看到了其中的机会。

医联近日发布了自主研发的基于Transformer架构的国内首款医疗大语言模型——MedGPT,其主要致力在真实医疗场景中发挥实际诊疗价值,可实现从疾病预防、诊断、治疗、康复的全流程智能化诊疗能力。

5月,微盟正式发布基于大模型的AI应用型产品WAI,该产品已正式上线包括话术生产、短信模板、商品描述、种草笔记、直播口播稿、公众号推文、短视频带货文案等25个实际应用场景。

作为聚焦物联网与医疗两大领域的人工智能企业,云知声正式发布山海大模型。该大模型针对知识密度高的领域,通过数据训练、训练数据、微调等方式,做一些专业的加强,这样模型既具备了通用应用水平,也针对特殊场景与领域进行了能力的加强。

山海大模型不仅在中文环境下的表现要好于GPT-4,甚至在医疗等个别场景下的表现效果,也已经开始优于GPT-4。目标是在今年内达到ChatGPT的通用能力水平,并在医疗、物联、教育等多个垂直领域的能力上全面超越GPT-4。

云知声创始人、CEO黄伟指出,在AI 1.0时代,虽然基于深度学习,每家都有强大的技术,但整体上并没有本质改变AI用于分类的任务,分类种类的增加仍然处在量变阶段,限制了AI创造价值的上限。

而在大模型引领的AI 2.0时代,为人工智能带来了新的能力,可以打造更多新的产品,满足客户更多的需求,例如医疗、营销、沟通等,能够创造更多的商业机会。

云知声创始人、CEO黄伟
云知声创始人、CEO黄伟

AI对于复杂逻辑理解能力大幅增强,扭转了用户对于AI“人工智障”的刻板印象,也让更多人接受人工智能,为大模型的广泛应用创造的条件。

“大模型所谓的‘思维链’能力,可以告诉用户推导的过程,从而知道中间过程里有哪些东西是错的,优化的时候就可以获得提示了,而不是像过去一样只能看见和调整参数的权重。”

云知声创始人兼CTO梁家恩表示,但就目前而言,大模型仍然是有限的东西,但对于没有见过的东西,大模型会生成“似是而非”的回答,而随着AI生成能力的不断增强,但校验会更加困难,这也让AI行业需要不断去探索新的解决方法。

相信随着越来越多企业入局,垂直大模型在各个行业和细分领域中将大量涌现。而那些能将一个垂直领域做专、做透,用高质量的数据持续优化模型,跑通商业闭环,构建起产业生态的企业,最终将把价值链做到足够长。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/51879.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

美国国会听证会探讨“深度伪造(deepfake)”风险及对策

大数据文摘授权转载自腾讯研究院 作者:曹建峰、方龄曼 近日,一段关于扎克伯格的恶搞视频在Instagram上流传。 该视频中,扎克伯格的面部表情极其僵硬,声音与本人的相比差距很大。 事实上,这是以色列一家科技公司利用人…

体验管理|如何快速低成本开始体验相关的数字化工作‼️

Guofu 第 95⭐️ 篇原创文章分享 (点击👆🏻上方卡片关注我,加⭐️星标⭐️~) 🚏 写在前面 在体验经济时代,传统企业在应对新需求、新挑战的时候,也需要用新的方式进行企业升级和转型…

vant van-uploader组件实现点击图片进行编辑(更换图片)

示例图: 思路: 1.写两个uploader组件,确保他们样式一样,定位将他们重叠放在同一个位置。给其中一个uploader组件设置z-index,让她位于上方(以下称为组件1),组件1用于触发选取图片的方…

怎么修改照片大小?一键快速修改图片宽高尺寸的方法

怎么修改照片大小?随着现在手机像素的提升,无论是用手机还是用相机拍摄出来的照片尺寸都越来越清楚,但是随之而来的问题就是图片也越来越大,因此导致大家在传输、使用的时候很不方便,那么有没有什么办法能解决这个问题…

如何编辑图片?图片如何编辑修改?

日常工作中很多情况是需要进行图片处理的,如果我们没合适图片编辑工具,处理图片可能就有些困难了,下载的处理图片软件操作难度过高,上手比较难。其实可以选择在线图片编辑(https://www.yasuotu.com/tools)网…

tui-image-editor编辑图片的使用

1.安装tui-image-editor 命令:npm i tui-image-editor 如果此步命令执行安装成功后启动还是报错找不到文件的话请检查以下文件 可手动添加到package.json后重新执行npm install 再次启动后便成功 或者单独安装此代码依赖块 npm install --save toast-ui/vue-ima…

数学好=编程能力强?答案或许跟你想的不一样

学好数理化,走遍全天下!小时候,这句顺口溜时常在耳边响起,而迈入编程行业以后,又被不小人咨询,我数学不好,能写好代码吗? 不过最近的 MIT 神经科学家在 eLife 期刊发表了一项新研究…

为什么美国学生学的数学比我们简单,却能做出很牛逼的东西?

来源:IT有个 圈儿 "美国给予不热爱数学的学生最基础的数学教育,而给予热爱数学的学生最高水平的数学教育。" 长久以来,中国人的迷思就是,为何「美国人数学这么差,还能出这么多牛逼科学家&#x…

学计算机语言需要英语基础吗,数学和英语不好的人能学编程吗?

数学和英语不好的人能学编程吗? 有许多小伙伴问:学编程需要什么基础?很多人都会有一个下意识的想法就是英语数学不好就不能学编程,其实这是一个误区。从根本上来说学编程确实需要数学和英语。因为代码是用英文写的,数学…

“编程能力差,90%输在了数学上!”丨多数程序员都是瞎努力!

一流程序员学数学,二流程序员学算法,低端看高端就是黑魔法。 可能有人以为这就是个段子,但有过工作经验的都知道,这其实就是程序员的真实写照! 想一想,我们学习、求职、工作的场景中,你一定因…

英语和数学不好是不是学不好编程?

做IT行业观察这个公众号已经三个多月~期间遇到很多想学编程,但又害怕学习编程的人,他们都有同样的问题: 学习编程,是否需要英语? 我数学不好,能学好编程吗? 学习编程,英文和数学肯定…

程序员不需要知道太多数学,你认同吗

之前在知乎看到一个问题: https://www.zhihu.com/question/48617074/answer/111889884 程序员不需要知道太多数学,你认同吗? 我听到的关于学习编程的最常见的顾虑,就是人们认为这需要很多数学知识。其实,大多数编程需…

为何敲代码,学好数学很重要?

数学是编程的灵魂所在。 作者 | Justin Meiners 译者 | 王艳妮,责编 | 屠敏 出品 | CSDN(ID:CSDNnews) 以下为译文: 程序员喜欢讨论编程语言。除了辩论它们各自的优点外,我们还喜欢将它们整合到我们的身份认…

【学术相关】为什么美国学生学的数学比我们简单,却能做出很牛逼的东西?...

本文转自|视觉算法 "美国给予不热爱数学的学生最基础的数学教育,而给予热爱数学的学生最高水平的数学教育。" 长久以来,中国人的迷思就是,为何「美国人数学这么差,还能出这么多牛逼科学家?」这个…

程序员的数学好难学?一切从基础开始!

数学知识对编程很有用,但是很多写给程序员的数学书都比较难。我们为什么不从基础的数学知识开始学习呢? 程序员的数学基础 Python实战 1.本书的重点不在于如何解题,而在于帮助读者在计算机世界里如何利用数学解决算法问题,让程序…

北大GPT解题有数学老师内味了,用人话讲难题,从高中数学到高数都能搞定

点击上方“视学算法”,选择加"星标"或“置顶” 重磅干货,第一时间送达 克雷西 发自 凹非寺量子位 | 公众号 QbitAI 北大团队教会AI把人话当编程语言用。 这下大语言模型(LLM)不光能做对数学题,而且解题过程你…

谁说数学好编程就好了?MIT告诉你:不对!

【编者按】不夸张地说,在这个时代,编程时时刻刻都在影响着整个世界的运转,它让我们的生活变得更加惬意悠闲。那编程到底是什么?应该算一门语言?还是算逻辑的具体实现? 作者 | Anne Trafton 译者 | 火火酱 …

ChatGPT能代替Oracle DBA吗?用Oracle OCP(1z0-083)的真题测试一下。

让我们来看看ChatGPT不能通过Oracle OCP的考试? 文章目录 引言测试过程总结和分析 关于博主,姚远: Oracle ACE(Oracle和MySQL数据库方向)。Oracle MAA 大师。华为云MVP。《MySQL 8.0运维与优化》的作者。拥有 Oracle …

跳出打工人的困局!程序员该怎么创业?

一位十二年的程序员老友和我说,他的公司倒闭了,现在准备清算,创业之初他带着梦想与对未来的期待踏出了这一步,没想到才短短两年就落得一场空。他对我表达出内心的不舍、惆怅,让我在聊天的过程也感同身受,个…

为啥大龄程序员不选择自己创业呢?

目录 程序员路在何方? 程序员是靠吃青春饭的吗? 程序员的第一个职业生涯阶段 大龄程序员更能理解创业的不易! 大龄程序员负担很重,导致不敢闯 经历时间的筛选,优劣已分 程序员共有的特点,技术和创业…