产业大模型刚开卷,京东跑进“最后半公里”

点击关注

 

姚    悦

王一粟

“京东一直在探索哪些产品、技术、场景可以真正把大模型用起来,在我们内部的场景中反复验证后,才决定在7月份对外发布,现在我们在零售、健康、物流、金融等业务场景里已经积累了一些经验。”京东集团技术委员会主席、京东云事业部总裁曹鹏在群访中,对光锥智能表示。

大模型火热半年,自2月官宣聚焦“产业大模型”后,一直相对低调的京东,也终于展示了自己的言犀大模型。但与此同时,大模型的竞争已经趋于白热化。据不完全统计,当前国内已发布超过80个大模型产品,并已经开始对应不同行业、不同应用场景频繁发力。

究竟什么样的大模型,才能在这番激烈的竞争中突出重围?

一方面,大模型亟需寻找到场景快速落地,另一方面,中国实体产业需要技术驱动来降本增效。

于是,从产业中来,到产业中去,就成了京东大模型自然的选择。

“大模型,让技术帮助产业降本增效的可能性成倍递增。”京东集团CEO许冉认为,从产业段切入大模型,如同从北坡攀爬技术珠峰。道路虽然更加艰难,却有更波澜壮阔的风景。

图片

长于产业的大模型

“言犀大模型训练时,融合70%的通用数据与30%数智供应链原生数据”,IEEE Fellow、京东探索研究院院长、京东科技智能服务与产品部总裁何晓冬告诉光锥智能。

这种大模型训练方式,与此前业界早期普遍认为的并不相同。

“目前,基础模型有三种不同的应用模式:第一种是通用基础模型训练好后,迁移至行业基础模型中,进而做产业(垂直)应用;第二种是通用基础模型进行微调;第三种,则是利用通用大模型+‘知识库和搜索引擎’。”业内人士分享道。

图片

2023京东科技峰会现场

由于前两种的训练成本偏高,且用于通用大模型训练的公开数据“噪声”过大,容易出现错误、谣言、偏见等问题,以至于让AI 存在“幻觉”“一本正经的胡说八道”,无法保障内容真实可信,进而阻碍大模型落地行业。

近期,从OpenAI到国内部分公司,都开始偏向第三种应用路径,而京东也正是走的这条路。“知识库+搜索引擎”,大致可以理解为是产业(垂类)领域的向量数据库,这样的向量数据库与通用大模型结合,被业界称之为“黄金搭档”。

通过这样的路径,“言犀大模型一开始就既具备常识,又具备专业性。相当于是既做了通识教育,又做了四年本科教育”,何晓冬形象地描述言犀大模型的差异性。

京东找到这样的路径,并不是偶然。

从事AIGC领域研究20余年的何晓冬,在2020年开始通过注意力机制、深度学习、Transformer 生成文档、文案,他注意到,用大语言模型直接生成的文案、文字和报告总会出现一些“胡说八道”“玄幻”的现象。

于是,何晓冬和团队提出了知识注入的预训练语言模型(K-Plug),并于2021年发布了相关论文。“京东内部用上更早一点”,何晓冬说,通过K-Plug,让Transformer和行业知识结合,让生成式语言模型的内容生成正确率从83%、85%左右,直接提升到95%以上,才能达到商用程度。

“83%的正确率在to C 用户的聊天中,也可以接受。但是,商用是不可接受的。”何晓冬提到。

GPT能出现智能涌现,依靠的不是数据,而是文本数据中的知识。所以,相比一味的追求超大参数量,数据中的“知识”含量更为重要。

基于20年的行业“知识”积累,京东言犀可以说是“长”在了数智供应链上。

图片

供应链是产业中数据最集中、结构最复杂、相关度最密切的环节。在零售、物流,到健康、保险、工业等场景中,京东沉淀了从采购、分销、交易、物流等产业链条中的巨量数据,并且每天还会源源不断产生大量“活”的交互数据。

在行业中长期积累的“知识”,保障了大模型的可信,极大的帮助大模型落地。

“只有自己的场景才能培养适合自己的大模型应用”,京东集团副总裁、京东科技产品与解决方案总裁高礼强如此说道。

30%的京东数智供应链数据,训练出了产业可用的大模型,而大模型在应用过程中要落地,还需要在具体场景中继续打磨。

在场景中历练,算法与数据的飞轮

“大模型不是我们的目标,而是(产业服务的)工具。”曹鹏表示,大模型不能只用来聊天、画画、吟诗作赋,最终还是要在产业中创造价值。

所以,在语言大模型火热的半年里,京东选择了埋头摸索和尝试,让大模型先在京东的多项业务中历练。

由于AIGC在生成和交互中表现优异,所以在京东健康中落地较快。

图片

AI问诊流程

在京东健康的诸多业务流程中,大模型首先在AI问诊中落地。用户输入“我可以吃阿司匹林吗?”的诉求后,接下来在AI的引导下,通过多轮对话逐步判断病因,给出诊断、用药参考,并进行生活建议,医疗风险提示。

这就是在言犀大模型3.0的基础上,通过医疗知识和经验训练的“慧医千询”大模型,在现场辅助诊疗场景下的具体表现。这背后,是京东健康累计线上问诊数据2.8亿,超3千万高质量临患对话,140余科室医疗专家等数据积累。

如果是一般通用大模型,在遇到患者问题时,更倾向于直接把答案给出。“但是在实际的医疗场景下,是需要多轮对话,才能更深入了解用户病史信息,这样才能给出更适合用户自身特点的方案。”京东集团副总裁、京东健康技术产品部负责人李欣表示。

医疗是和百姓生活息息相关一个行业,其中存在一个著名的“不可能三角”,即医疗服务不可能同时实现高质量、高覆盖、低成本,这本质上是由于优质医疗资源的供给不足造成。

“慧医千询”的出现,目标就是通过远程医疗全流程方案,解决这个“不可能三角”。

李欣透露,“慧医千询”重点会做两个核心场景,“首先是药师的问答,这个非常专业化、具体,是医疗大模型最容易发挥作用的地方,AI自动化可以省去90%的人工工作量。再在这个基础上,推全场景医患问答。”

除了京东健康,大模型在京东物流、零售等方面也大展拳脚。

“电商的产品视频、照片直接由人去拍摄非常贵,少则几百块,多则几千块。”京东集团副总裁、京东科技产品与解决方案总裁高礼强表示,AIGC可以极大的降低商品营销的成本。

图片

目前,基于言犀的AIGC内容营销平台,已经能很好地理解商品特征,自动帮助商家生成商品图片、卖点等营销素材。以每套图为例,成本降低90%,周期从7天缩短到半天。

通过对营销的理解,以及用户运营经验的持续积累,大模型解决了诸如关键性任务,动态适应性、用户体验等问题。本次发布的AI增长营销平台是京东科技市场和平台运营团队依托日常的金融营销工作结合大模型应用的探索,能大幅优化了营销运营流程,降低运营人员的学习成本与操作成本,实现方案生产效率上百倍提高。将过去涉及产品/研发/算法/设计/分析师等5类以上职能才能完成的流程,压缩至1人。同时,一个入口的全新交互模式,让人机交互次数从2000次降低至少于50次,将操作效率提升了超过40倍。

另外,数字人在主播方面的落地也是行业热点,基于京东在电商领域知识增强模型K-PLUG,仅需在直播后台上传商品链接,数字人就能“阅读”商品详情,找到关键的规格、卖点等信息,并自动生成真实、生动、可阅读性强的直播文案。

图片

例如,商家原先写出50个SKU的直播脚本需要至少五小时,使用K-PLUG模型只需要“一键生成”。目前K-PLUG商品文案写作能力已经覆盖3000多个京东的品类,累计生成文案30多亿字。

通过上面场景就可以看到,大模型在产业(垂类)场景中的降本增效非常明显。

当大模型在海量具体场景中使用时,人类真实反馈就会让数据和算法的形成飞轮效应。这期间,高质量数据不断生成,垂直行业的智能涌现才有可能出现。

为了支撑大模型在场景中的历练,京东需要不断在产品和算力方面提升能力。产品方面,日前,京东将积累高质量行业数据的两个平台——数智平台优加DaaS和言犀智能服务都已升级到了3.0版本,进一步提升了交互能力,以及更好地将数据用起来;算力方面,已经布局了全国首个基于SuperPOD架构的超大规模计算集群——天琴α,算力总规模达到135TFLOPS(每秒浮点运算次数)。

六年AI路,三年大模型

种树最好的时间是在十年前。

在大模型突然爆火之前,京东很早已经开始“栽树”。

“技术、技术、技术”,2017年初,京东开始全面向 AI 技术转型。

第一个技术,主要用于解决内部大规模人力带来的效率问题;第二个技术,是组件化、模块化的技术服务对外输出;第三个技术,则是对前沿技术进行探索和有秩序地创新。

2017年底,京东在人工智能的布局就开始落地,一方面聚集团队,通过人才、研究、专利等打造技术护城河;但与此同时,京东也一直在思考一个问题——怎样将这些技术落地产生闭环的商业价值和产品价值?

2018年,人工智能领域科学家何晓冬正式加入京东。2020年,何晓冬团队就开始关注如何利用深度学习的模型。2021年京东开始组建大模型团队,探索深度学习及语音和语言技术在新兴领域等应用场景的落地。

早在2022年,京东就推出了百亿参数的大模型Vega。但直到今年上半年ChatGPT大火,京东虽然在2月份宣布要做服务产业的大模型,但迟迟没有对外公布。

“百模大战”白热化升级,外界都替京东着急了。“有无数的朋友,最近都会跑过来问我,你们京东有没有大模型?什么时候发大模型?”曹鹏在2023京东全球科技探索者大会暨京东云峰会上打趣道。

但这背后,其实回到一个很严肃的问题上,就是京东最初就思考的那个问题——技术的价值,也可以说成是大模型的价值。

“大模型本身是没有办法直接产生价值的,只有放到场景里才能够产生实际的价值。”曹鹏说,“在京东我们真正讲大模型本身会比较少,更多会讲在产业里面、场景里面,怎么能够利用新的技术带来产业变化,真的给产业不断提升效率、改善体验、降低成本,这才是一个技术真正核心的价值所在。”

关于大模型,京东制定了“三步走”战略。第一步,基于内部实践构建言犀大模型和言犀AI开发计算平台;第二步,在零售、金融、健康、物流等京东内部高复杂场景大规模锤炼,并针对重点场景的标杆客户进行对外服务,主要目的是发现那些看起来“不起眼”,但产业应用中又非常关键的问题;第三步,针对严肃商业场景将大模型能力对外开放。

图片

今年上半年,京东大模型走过了第一步,并在第二个阶段有了初步尝试,处于在第二个阶段的深化和逐步向第三步迈进的状态。

大模型不是一天能炼成的。

在 ChatGPT 证明 AGI(通用人工智能)的可能性之前,AI技术长期面临着技术突破遥遥无期、商业落地困难等问题,甚至AI行业自己也一度质疑过人工智能的价值。

但在今年光锥智能观察到一个现象,就是:

人工智能,已经不再是独立的人工智能实验室,而是泛化到所有业务当中。

当 AI 离开实验室,才是价值绽放的开始。

图片

京东对大模型的价值,有自己的理解。许冉在峰会上提出,“大模型的价值=算法×算力×数据×产业厚度的平方”的公式,她强调,当产业效率和产业的边界得到质的提升后,大模型才有了更重要的实际价值和意义,将不亚于又一次工业革命。

欢迎关注“光锥智能”CSDN号,关注前沿科技!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/56799.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

赠书 | 写作、绘画、游戏、音视频编辑…AIGC为内容生产带来了什么?

文中有数据派THU福利哦 当AIGC产品不断涌向社会,人们纷纷认为美图app“危了“的时候,美图公司创始人兼首席执行官吴欣鸿表示,影像和 AIGC 的创新结合,将带来影像生产力的大爆发,同时会为相关领域带来新的职业和新的创业…

中文公开聊天语料库

源 / 专知 语料内容 该库搜集了包含chatterbot、豆瓣多轮、PTT八卦语料、青云语料、电视剧对白语料、贴吧论坛回帖语料、微博语料小黄鸡语料共8个公开闲聊常用语料和短信,并对其进行了统一化规整和处理,达到直接可以粗略使用的目的。 使用方法 语料下载&…

获得文本语料和词汇资源(基于nltk)

在自然语言处理的实际项目中,通常要使用大量的语言数据或者语料库。本章的目的是要回答下列问题: 什么是有用的文本语料和词汇资源,我们如何使用 Python 获取它们?哪些 Python 结构最适合这项工作?编写 Python 代码时…

NLP领域中文对话系统数据集总结(有下载地址)

一、豆瓣多轮对话数据集 1、简介: 测试数据包含 1000 个对话上下文,对于每个上下文,创建 10 个响应作为候选。正确的响应意味着响应可以自然地回复给定上下文的消息。每对收到三个标签,大多数标签被视为最终决定。 2、数据格式&…

肠道病毒组识别早产儿坏死性小肠结肠炎发病前的特异性病毒特征

期刊:Nature microbiology 影响因子:30.964 发表时间:2022 样本类型:粪便样本 研究背景 坏死性小肠结肠炎(NEC)是早产的严重后果,通常与肠道细菌微生物群的改变有关。然…

新型病毒来了【PcaPatchDbTask】

急报!!新型病毒来了【PcaPatchDbTask】 1.什么是PcaPatchDbTask PcaPatchDbTask是一种新型的木马 2.PcaPatchDbTask的危害 【1】他会劫持你的浏览器主页 【2】他会读取你的键盘信息 【3】他会获取你电脑的联系人菜单 【4】它甚至不会被安全软件查杀 3.…

Nature Reviews:给医生的菌群分析指南(下)

本文转载自“态昌基因”,己获授权。 Nature Reviews:给医生的菌群分析指南(上),主要从实验阶段介绍了以下7方面,不清楚的请点击链接跳转原文阅读。 1. 样本选择 2. 样本的采集 3. 样本的保存与保护剂 4. DNA提取 5.我到…

关于儿童急性感染性腹泻

腹泻是一种常见的症状,可导致儿童生长发育迟滞和营养不良。根据世界卫生组织(WHO)发布的数据显示,急性腹泻在5岁以下儿童死亡原因中排第二位,仅次于肺炎。引起儿童腹泻的原因包括感染和非感染因素,后者主要…

MPO抗体对丨CalBioreagents 中英文说明书

艾美捷CalBioreagents MPO抗体对英文参数说明: CATALOG NUMBER: M684 PRODUCT DESCRIPTION: Mouse Monoclonal anti-human Insulin IMMUNOGEN: Purified human MPO IMMUNOGLOBULIN ISOTYPE: IgG1 PURIFICATION: Purified by DEAE chromatography. BUFFER: Sup…

PICRUSt2菌群功能预测分析

生科云网址:https://www.bioincloud.tech 01 课程简介 PICRUSt2的原理是基于已测微生物基因组的序列,推断它们的共同祖先的基因功能谱,对数据库中其它未测物种(基因组未知)的基因功能谱进行推断,构建微生物…

病毒组学数据分析 -03 CheckV病毒序列识别

CheckV 是一个完全自动化的命令行管道,用于评估单重叠群病毒基因组的质量,包括识别集成原病毒的宿主污染、估计基因组片段的完整性以及识别封闭基因组。 管道可以分为4个主要步骤:A:去除原噬菌体上的宿主污染 根据与自定义 HMM 数…

新冠病毒分型和突变分析(SARS-CoV2_ARTIC_Illumina)

SARS-CoV2_ARTIC_Illumina新冠病毒分型和突变分析 一. 本文适用于使用Artic扩增子扩增,Illumina双端测序,用于分析新冠病毒突变及分型鉴定 二. 概览:按照惯例,先上一张概览图 流程输入SRR22216743_1.fastq.gz SRR22216743_2.fas…

还真不错,今天 Chatgpt 教会我如何开发一款小工具开发(Python 代码实现)

上次使用 Chatgpt 写爬虫,虽然写出来的代码很多需要修改后才能运行,但Chatgpt提供的思路和框架都是没问题。 这次让 Chatgpt 写一写GUI程序,也就是你常看到的桌面图形程序。 由于第一次测试,就来个简单点的,用Python…

Android中文图混排时文图的居中对齐

http://www.jianshu.com/p/2650357f7547 先上效果图 看订阅号时间发现的,前一阵子项目要做一个比较复杂的图文混排,但是最后没有做,今天看到,回过头来学习下 代码还是他们的代码,我就不复制了 下来说一下这种形式…

赢在微点答案专区英语_掌握这一招!快速提高英语阅读理解成绩(终生受益)...

一、经常有学生向老师倒苦水,说学英语花了很多时候,总是提不高英语成绩?为什么? 你是否还在为英语阅读成绩而烦恼呢? 你的阅读成绩是否还总是提不高呢? 你的阅读速度是不是还很慢呢? 你阅读的准…

Android中文图混排时文图的居中对齐 FontMetrics以及自定义ImageSpan实现

文章转自:http://www.sohu.com/a/150059234_611601 本文作者CnPeng的博客地址: http://www.jianshu.com/p/2650357f7547 这个标题有点长,乍一看这么个标题你可能没明白啥意思,且听我慢慢道来。 公司的项目中新增了一个“心动”…

实战 | Android中文图混排时文图的居中对齐 FontMetrics以及自定义ImageSpan实现

这个标题有点长,乍一看这么个标题你可能没明白啥意思,且听我慢慢道来。 公司的项目中新增了一个“心动” 的功能,用户初次使用时需要给一个引导页,就是下面图中的这个样子(这就是做完之后的效果了)。 在上图…

英文期刊论文翻译格式要求和文献要求

英文期刊论文翻译格式要求和文献要求 一、全文翻译,句式尽量简单易懂(借助谷歌有道,同时借鉴前人文献写法)1、论文的翻译不能直译。 二、套入模板,调整格式(文章、参考文献)1、论文直接粘贴到模…

时文直播:2015年通信运营业统计公报

2015年,我国通信运营业认真贯彻落实中央各项政策措施,围绕实施网络强国战略,推动网络提速降费,提升4G网络和宽带基础设施水平,积极推动移动互联网、IPTV等新型信息服务普及,全面服务国民经济和社会发展&…

FontMetrics以及自定义ImageSpan实现TextView中文图混排时文图的居中对齐

这个标题有点长,乍一看这么个标题你可能没明白啥意思,且听我慢慢道来。 公司的项目中新增了一个“心动” 的功能,用户初次使用时需要给一个引导页,就是下面图中的这个样子(这就是做完之后的效果了)。 Paste_Image.png 在上图中整体…