国内 AI大模型产业发展深度分析 2024
人工智能技术的迅猛发展,使AI大模型成为科技竞争的核心、产业变革的先锋、经济增长的新动力。我国已将人工智能列为国家战略,出台系列政策扶持其发展,为AI大模型产业创造优越环境,展现巨大潜力和广阔前景。
大模型时代已至,通用、行业、端侧大模型蓬勃发展,加速产业应用落地。AI大模型作为新一代人工智能产业的核心引擎,正深度赋能我国经济社会的多领域,引领通用人工智能新纪元,催生科技革命与产业变革。面对大模型时代的挑战与机遇,产业发展方向、挑战与未来路径,亟待社会各界共同探索与努力。
2023年,人工智能大模型迅猛发展,重塑科技创新和生产生活,全球竞争加剧。国产大模型崭露头角,引领变革浪潮,机遇与挑战并存。
大模型与电力、零售、出版等传统行业深度融合,改造升级传统产业。在金融、医疗等行业,大模型促进提质增效,成为新质生产力快速发展的关键动力。
大模型稳健发展离不开政策法规的保障,确保隐私与数据安全。展望未来,期待大模型技术创新深化,赋能各业,为社会注入高质量发展的新活力。
AI大模型的崛起,引领内容生成从“可用”迈向“好用”的新纪元。各行业对内容生产的渴求得到满足,尤其在电商、影视、传媒领域,大模型的应用已蔚然成风。
大模型商业化需供需协同:供给侧需解决Transformer等根技术的成本问题,提升性价比;需求侧则需企业深度数字化,投入资金、人力与时间。未来,AI内容生成将从“好用”迈向“高效”,或将迎来技术范式的多次革新。双方共同发力,将推动大模型商业化迈向新高度。
2024 年,多重利好因素将推动大模型快速发展,首先是“人工智能+”行动等来自政府层面的有力支持,其次用户提升生活、工作效率的需求激增,再加上科技公司加大对 AI 领域投入资金、人力、技术研发,各环节协同支撑大模型发展。
当前大模型产业也面临挑战,包括算力分散不足、Transformer 结构是否为最优的疑问、领域数据稀缺、缺少现象级应用的问题。
就产业趋势而言,投入基础模型训练的公司未来可能会大幅减少,转而更多的公司会去寻找应用场景和爆款应用。vivo 结合自研大模型端侧化、矩阵化的技术优势并且会聚焦手机行业的应用经验,利用大模型重构手机各类功能,找到落地场景,普惠更多用户。
第一章 扬帆起航:中国 AI 大模型产业发展背景
1.1 中国 AI 大模型产业发展政策驱动力
我国高度关注人工智能发展,自2017年国务院发布《新一代人工智能发展规划》以来,已出台多项支持政策。2022年,科技部等六部门进一步发布《关于加快场景创新 以人工智能高水平应用促进经济高质量发展的指导意见》,推动经济高质量发展。
《政府工作报告》2024年倡议实施“人工智能+”行动,借大模型技术东风,地方政府积极出台支持政策,推动大模型产业蓬勃发展,引领未来科技新潮流。
- 北京着力推动大模型相关技术创新,构建高效协同的大模型技术产业生态;
- 上海强调打造具备国际竞争力的大模型;
- 安徽从资源方面着手吸引大模型企业入驻;
- 成都全力推动大模型技术创新,聚焦研发与迭代CV、NLP、多模态等前沿大模型,并深耕医疗、金融、商务、交通等行业,引领行业智能化升级。
2023 年以来我国各地出台的大模型产业相关政策
1.2 AI 大模型产业发展技术驱动力
AI大模型蓬勃发展,尤以语言大模型为引领。它们通过海量无标注数据的预训练,学习广泛知识并精细微调,赋予模型多任务通用求解能力,展现卓越智能实力。
2017年,Google引入Transformer架构,基于自注意力机制,为大模型预训练算法奠定基石。2018年,OpenAI与Google分别发布GPT-1和BERT,两大预训练模型,迅速成为自然语言处理领域的核心力量,引领行业新潮流。
2022 年,OpenAI 推出 ChatGPT,其拥有强大的自然语言交互与生成能力。2023 年,OpenAI 多模态预训练大模型GPT-4 发布,其具备多模态理解与多类型内容生成能力。2024 年,OpenAI 发布视频生成大模型 Sora,提出时空碎片和扩散 Transformer 技术,大模型的多模态生成能力的进一步成熟。
本部分将从经典 Transformer 架构出发,通过全面梳理基于人类反馈强化学习、指令微调、提示学习等相关大模型技术,体现技术对于产业发展的带动作用。
1.2.1 Transformer 架构
Transformer架构,2017年由Google引领潮流,已成为语言大模型的核心架构。其独特之处在于通过自注意力机制捕捉输入序列的全局信息,并通过网络层高效传递。Transformer架构凭借其卓越的特征提取能力和并行计算效率,引领了现代语言处理的新浪潮。
Transformer架构核心由输入、多层编码器、解码器及输出构成。输入涵盖源文本嵌入与位置编码;编码器与解码器均堆叠N层;最终,输出经线性处理与Softmax层得出。整体架构高效,精准处理文本数据。
Transformer 架构图
自注意力机制,作为Transformer模型的核心,能针对序列数据,对每词位置输入进行加权求和,高效捕获全局上下文,展现卓越处理能力。
通过计算Q和K的点积,应用Softmax函数确定各位置权重,随后将权重与V向量相乘,高效产出自注意力的精准结果。
Transformer模型通过引入多头自注意力机制,显著提升了模型的表达能力。该机制使模型能同时关注不同表示子空间的注意力信息。实现时,输入序列被分组,每组通过独立权重矩阵进行线性变换并计算自注意力。最后,输出被拼接并经过线性层处理,得出最终表示,从而提升了模型性能。
Transformer模型在计算自注意力和多头自注意力后,运用前馈神经网络对输入序列进行深度变换。此网络由ReLU激活的全连接层堆叠而成,旨在非线性地处理输入,从而捕获数据中的复杂特征。
1.2.2 AI 语言大模型关键技术
(1) 基于人类反馈强化学习
人类反馈强化学习(RLHF)是革命性的训练技术,它融合人类标注者的智慧于大模型学习中,构建与人类偏好一致的奖励模型。这一方法能够精准引导语言大模型的训练,确保模型准确理解并遵循用户意图,生成用户青睐的高质量内容。
基于人类反馈强化学习具体包括以下几个步骤:
通过监督或无监督学习,我们精心训练监督策略模型,利用奖惩机制引导AI模型行为。这一预训练语言模型能精准预测输出或行为,为给定输入提供准确响应。
通过训练奖励模型,我们邀请标记员提供对模型输出的反馈,对多个输出或行为质量进行排名评分。这些反馈转化为奖励信号,驱动模型在强化学习中持续优化。
采用近端策略优化(PPO)强化学习,先以监督学习构建PPO模型,再经奖励机制反馈优化模型参数。在训练过程中,智能系统尝试多种行为,根据奖励评估质量,持续优化行为策略。此过程通过不断迭代与改进,确保PPO模型能高效适应复杂环境,实现高效学习。
基于人类反馈强化学习示意图
(2) 指令微调
指令微调,一种革新语言大模型的学习策略,赋予其遵循人类语言指令的能力。在零样本环境中,它能泛化至未知任务,通过理解并遵循指令,精准完成任务,为语言交互带来全新体验。
指令微调可被视为有监督微调(Supervised Fine-Tuning,SFT)的一种特殊形式,但两者目标有所差别。SFT 是一种使用标记数据对预训练模型进行微调的过程,以便模型能够更好地执行特定任务,而指令微调是一种通过在(指令,输出)对的数据集上进一步训练大型语言模型(LLMs)的过程,以增强LLMs 的能力和可控性。指令微调的特殊之处在于其数据集的结构,即由人类指令和期望的输出组成的配对,这种结构使得指令微调专注于让模型理解和遵循人类指令。
(3) 模型提示
经大规模文本数据预训练,语言大模型展现出作为通用任务求解器的潜力。尽管这些能力在执行特定任务时可能不显见,但通过设计精准的语言指令提示,可激发其能力,此即模型提示技术。常见方法包括指令提示与思维链提示,助您精准运用大模型潜能。
指令提示(Instruction Prompt)是OpenAI在GPT-3中的创新,其低资源场景下的卓越性能证明了其有效性。该提示技术通过提供额外上下文“Prompt”,而非强制模型适应下游任务,巧妙地重组任务,使之贴近模型预训练问题。这一方法不仅高效,还展现了GPT-3在特定领域少样本提示下达到人类水平的卓越能力。
思维链(CoT)技术革新推理过程,多步推论提升黑盒模型可解释性。该技术鼓励语言大模型生成解决问题的中间推理链,模拟人类深思熟虑的复杂任务处理方式。思维链不仅激发模型多步推理能力,更使输出结果可验证,助力模型性能跃升。
思维链提示通过引入〈输入,思维链,输出〉结构,优化少样本提示,突显自然语言推理的连贯性。思维链作为语言大模型的“涌现能力”,需在模型参数达到一定规模后激活。激活方法即在提示中展示逐步推理过程,每个步骤均围绕问题构建至答案的完整推理链,确保模型能够高效、准确地理解和应用复杂逻辑。
1.3 中国 AI 大模型产业发展市场驱动力
中国AI大模型产业蓬勃发展,源于办公、制造、金融、医疗、政务等多领域对降本增效、生产自动化、风险降低、诊断准确率提升及政务服务效率增强的迫切需求。这些领域的创新共筑产业繁荣,预示AI大模型市场前景广阔。
1.3.1 办公场景
近年来,文字、语音、图像处理能力飞速跃升,大模型化身为智能“助理”,融入办公与会议,结合传统软件,实现智能化升级。
大模型智能办公产品,轻松应对文案生成、PPT美化、数据分析等日常需求。自然语言交互,让“助理”代劳繁琐工作,释放创造力。智能文档助力构建大纲、生成模板、优化表达;智能演示实现自动排版、生成备注、幻灯片一键生成;智能表格则通过对话,实现公式生成、数据处理、表格自动化。让工作更高效,创意无限。
智能会议领域,大模型卓越赋能,覆盖策划、传译、记录全程。策划环节,仅需输入主题等关键词,大模型即可自动生成详尽策划,包括环节设计、分论坛划分、时间安排及预算等,全面高效。
大模型赋能下,同声传译的精准性、即时性与多语能力大幅跃升,同时会议记录结构清晰、要点明确,为会后回顾提供高效支持。
1.3.2 制造场景
人工智能革新制造业,重塑研发设计、生产及供应链管理。大模型结合EDA/CAE/CAD,显著提升研发效率。赋能数字孪生与机器人,增强感知与执行能力。与供应链管理的融合,实现智能化工厂管理转型,引领制造业迈入全新时代。
研发设计阶段,以大模型+EDA为核心,云端扩展性实现设计自动化,精准电气设计,简化流程,缩短PCB设计周期,助力企业缩减研发时间、成本,提升竞争力。生产环节,AIGC与数字孪生技术模拟真实环境,虚拟人替代人工进行风险排查,仿真设备助力沉浸式教学,引领智造新篇章。
大模型机器人运用机器视觉技术,实现路径规划与物体识别。集成于供应链系统,重构数字化办公,通过自然语言指令实现人机交互。高效管理决策、便捷数据分析与可视化,预测需求降本增效。在仓库与物流端,智能调度、跟踪与预警,显著提升运营效率。
1.3.3 金融场景
金融行业存在前、中和后台的业务划分,在数字经济时代的浪潮中,相关业务已被大模型全局赋能提升效率。以银行为例,对话机器人、虚拟助理已经逐渐出现在个性化服务、电子营销、金融欺诈检测、信贷支持等服务场景中。个性化服务方面,银行大模型以客户数据为依据,为客户提供定制的财务和产品计划;电子营销方面,大模型根据客户行为偏好生成个性化电子邮件;金融欺诈检测方面,大模型赋能专业人员检索大量数据识别欺诈行为;信贷支持方面,大模型通过分析海量生产生活和信用数据,为信贷部门人员生成高质量的信贷方案建议,减少银行贷款收益损失。
1.3.4 医疗场景
得益于近年来医疗大模型的不断迭代,复杂的医疗数据分析任务得以解决。由于患者行为数据的独特性,大模型通过个性化设计,满足患者“千人千面”的医疗服务需求,应用于智慧影像、智慧手术、智慧健康等领域。智慧影像覆盖 CT、MR、DR、US、DSA、钼靶等医疗影像场景,为患者进行早期检测、诊断及健康风险评估;智慧手术功能大幅提高患者病情评价准确度,打牢术前风险评估、术中手术规划、术后预后估计的基础;智慧健康则作为一般患者的贴身健康助手,通过小程序等便捷方式为患者提供高质量导诊服务和个性化健康建议。
1.3.5 政务场景
在办公、制造、金融、医疗场景得到助力的同时,政务场景下的效率、信息参考范围、经验共享、规范性等常见痛点也获得大模型能力加持得以解决。为提升效率,大模型利用自动化的政策检索、政策比对解决海量政策参考、人工分析比对的耗时问题;为缩小信息参考范围,政策撰写助手结合政策数据权威白名单,并接入政策全量库,避免不可靠信息来源引发舆论风险;为提高政策管理经验共享,大模型引入政策经验知识库,提升政务业务理解和政策管理能力;为规范政策撰写,政务大模型凭借规范化生成、检查功能维护成果的规范性、权威性。
第二章 百舸争流:中国 AI 大模型产业现状及典型案例
2.1 AI 大模型主要特征
ChatGPT等AI大模型凭借海量参数与深度网络,能深入学习与理解多样特征和模式,在复杂任务中展现卓越的自然语言理解、意图识别、推理和内容生成能力。其通用问题求解能力,被视为实现通用人工智能的关键途径。
AI 大模型的三大特征:泛化性、通用性、涌现性
2.2 AI 大模型主要类型
AI大模型分为云侧与端侧两类。云侧大模型依托云端部署,具备庞大参数、丰富算力和海量数据存储能力;而端侧大模型则常见于手机、PC等终端,特点在于参数精简、本地化运行及强大的隐私保护,满足不同场景需求。
云侧大模型涵盖通用与行业模型,端侧则聚焦手机与PC大模型。通用大模型训练数据多元,适应广泛场景和任务,展现强大普适性。
行业大模型专业性强,针对金融、医疗、政务等行业深度训练,实现精准业务理解与场景应用。手机与PC端侧大模型直接部署于设备,为用户提供个性化、便捷的智能体验,引领行业智能化新潮流。
AI 大模型主要分为云侧大模型和端侧大模型两类
我国AI大模型产业正蓬勃发展,多家科技厂商推出的AI大模型已落地商用,并在金融、医疗、政务等领域取得显著成果,成为提升服务质量和效率的关键力量,展现出强大的应用潜力和市场价值。
我国通用AI大模型佼佼者包括科大讯飞的讯飞星火、百度文心一言、阿里巴巴通义千问等;行业模型则以蜜度文修、容联云赤兔、用友YonGPT为代表。vivo的蓝心大模型则融合了云侧与端侧技术;而在端侧,蔚来的NOMI GPT大模型独领风骚。这些大模型共同构筑了我国AI领域的坚实基础,展现了技术创新的无限可能。
中国 AI 大模型分类及典型案例
2.3 中国 AI 通用大模型典型案例
案例一:科大讯飞—讯飞星火认知大模型
(1)大模型简介:
讯飞星火认知大模型,科大讯飞革新之作,自然对话解析用户需求,助力人机交互、知识创作与数智化生产。七大核心能力——文本生成、语言理解、知识问答、逻辑推理、数学能力、代码及多模态——全面展现其卓越性能,引领智能时代新篇章。
(2)大模型优势:
2024年1月,科大讯飞重磅推出讯飞星火认知大模型V3.5,七大核心能力跃升新高度。数学、语言理解能力超越GPT-4 Turbo,代码能力直逼GPT-4 Turbo的96%。更在多模态理解上实现突破,达到GPT-4V的91%,特别是语音多模态能力已超越GPT-4。引领行业新风尚,讯飞星火V3.5,值得您的期待!
讯飞星火认知大模型 V3.5 七大能力
讯飞星火认知大模型V3.5全面升级,三大亮点瞩目。在人机交互上,其卓越的语义理解、指令跟随及多轮对话能力,结合情绪感知和拟人合成技术,赋能万物互联时代。在知识学习与内容创作上,凭借要素抽取、问题生成等底层能力的飞跃,催生更丰富、更实用的智能应用,大幅提升数智化生产力。
讯飞星火大模型融合外部知识,实现广泛拓展,具备卓越的逻辑推理和时空推理能力。数学作为其基础,结合代码能力连接虚拟与现实,多模态能力更是机器人、工业、家庭等场景的关键。讯飞星火V3.5在关键技术领域取得显著突破,展现数智化生产力的强大潜力。
(3)大模型应用:
讯飞星火七大能力的提升,实现了各类应用场景性能升级。
- 科大讯飞重磅推出讯飞智文,办公神器一键秒变文档、PPT!功能强大,涵盖文档自动生成、AI写作助手、多语种支持、智能配图及丰富模板选择,还有贴心的演讲备注功能,助力高效办公,尽显专业风采!
- 知识问答方面,讯飞星火对生活常识问答、医学知识问答、政策问答等任务“信手拈来”;
- 逻辑推理引领创新,思维推理深入剖析前提与假设,催生独到见解。科学推理则基于数据与信息,精准推断、预测并验证,承载科学研究的核心使命。两者共筑智慧桥梁,引领问题解决之道。
- 数学能力方面,讯飞星火可以解决方程求解、立体几何、微积分、概率统计等数学问题;
- 讯飞星火代码能力卓越,智能生成注释、函数名对应代码,支持逐行注释,精准定位语法逻辑错误,并能智能生成单元测试数据,提升开发效率。
- 讯飞星火具备卓越多模态能力,支持图片精准描述、智能问答,并能根据用户描述生成所需音频视频,满足您的多元化需求。
案例二:百度公司—文心一言大模型
(1)大模型简介:
百度文心一言,领先的人工智能大语言模型,实现跨模态、跨语言深度理解。其在文学创作、文案、搜索问答等多领域展现卓越,四大核心能力——理解、生成、逻辑、记忆——为用户提供卓越服务,展现无限可能。
(2)大模型优势:
2023年10月推出的“文心大模型4.0”在四大能力上大幅升级,逻辑能力提升3倍,记忆能力提升2倍,相较于上一代模型,展现出更为卓越的性能。
文心一言理解能力卓越,能精准捕捉潜台词、复杂句式及专业术语,应对乱序与模糊意图,并胜任代码理解与调试,展现非凡智能。
文心一言展现卓越生成能力,快速生成多样文本、代码、图片、图表、视频,涵盖文案创作、生活计划、高质量编码等场景。
文心一言展现卓越逻辑能力,助您攻克复杂逻辑难题、数学计算、职业生活决策,纠错代码,推理常识,校验逻辑,解析立体几何,激发辩论灵感。
文心大模型 4.0 的能力提升源自相关举措:
构建多维数据体系,实现数据挖掘、分析、合成、标注到评估的闭环优化,显著提升数据利用率,大幅增强模型性能。
采用有监督精调、偏好学习和强化学习技术,实现多阶段精准对齐,确保模型与人类决策高度一致,提升用户体验。
文心大模型 4.0 典型特征
(3)大模型应用:
文心大模型现开放应用,涵盖文学创作、文案、搜索问答、多模态生成及数理逻辑推算,功能全面,满足您多样化需求。
在商业领域,文心一言以专业精准的文字撰写商业计划、市场分析,为决策提供有力支持。在广告创意上,它激发无限灵感,助力广告人迅速构思出引人入胜的广告文案与宣传语,引领市场潮流。
文心一言聊天机器人精通搜索问答,以自然语言理解用户意图,提供精准答案和个性化建议。广泛应用于生活服务、教育辅导、客服等领域,为您带来便捷智能的交互体验。
文心大模型引领多模态生成新纪元,支持图像生成、处理,满足用户个性化需求。同时,它精通语音合成、识别与音频分类。更强大的是,它能处理视频数据,将文本转化为动态图像序列,实现视频分类、目标检测等,展现无限可能。
文心大模型卓越于数理逻辑推算,不仅能攻克复杂数学问题,还作为代码编写得力助手。百度研发的智能代码助手Comate,具备智能推荐、生成与问答功能,兼容多种编程语言和IDE,助力编程更高效。
案例三:阿里巴巴—通义千问大模型
(1)大模型简介:通义千问是阿里云研发的预训练语言模型,基于先进的自然语言处理技术(NLP), 执行理解、生成和解释人类语言、图片和文档等任务。通义千问能在创意文案、办公助理、学习助手、趣味生活等方面为使用者提供丰富的交互体验。
通义千问具备中英文理解、数学推理、代码理解等能力。
(2)大模型优势:2023 年 10 月,千亿级参数大模型通义千问 2.0 发布,相比 1.0 版本,其在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。中英文理解能力是大语言模型理解和表达的基础能力,英语任务中,通义千问 2.0 的 MMLU(伯克利大学、哥伦比亚大学等联合发布)基准得分是 82.5。中文任务中,通义千问 2.0 在模型训练中学习了更多中文语料,在 C-EVAL(上海交大和清华联合研发的中文大语言模型测试集)基准上获得最高分;
数学推理方面,在推理基准测试 GSM8K(OpenAI 发布的小学数学测试集)中,通义千问排名第二,展示了强大的计算和逻辑推理能力;
代码理解方面,HumanEval(OpenAI发布)测试衡量大模型理解和执行代码片段的能力,通义千问排名第三,这一能力是大模型在编程辅助、自动代码修复等场景的基础。通义千问 2.0 参数及指标评测(3)大模型应用:通义千问目前主要应用于四个方向:创意文案、办公助理、学习助手、趣味生活。
创意文案应用包括:“撰写营销文案”,输入产品介绍获得量身定制的金牌营销文案。“文章润色”能对用户提交的文章进行深度分析,挖掘其中表达不足之处,提供词汇句式变化建议。“直播带货剧本生成”,基于丰富的商品信息和用户需求,为电商主播提供生动有趣且具有营销力的脚本内容;
办公助理应用于:“SWOT 分析”为用户提供全面、深入且精准的战略决策支持,从多元视角理解并评估内外部环境对特定项目的影响。“PPT 框架生成”,智能地为用户构建专业且逻辑清晰的 PPT 结构;
学习助手应用包含了:“题目加工厂”,根据提供的专业以及学科领域进行高质量试题生成,大大节省了教师、家长以及教育机构在出题上的时间和精力。“学习计划站”可为用户提供个性化、系统化的学习路径规划,定制高效且科学的学习日程安排;
趣味生活应用有:“会放飞的菜谱”,输入菜名逐步指导提供美食烹饪秘诀。“AI 健身教练”为用户制定专属健身计划。“写歌词”,根据用户提示的歌名写出生动歌词。
2.4 中国 AI 行业大模型典型案例案例四:容联云—赤兔大模型
(1)大模型简介:赤兔大模型是容联云开发的面向企业应用的垂直行业多层次大语言模型,赋能企业搭建专属智能客服和数智化营销,完成从“降本增效”到“价值创造”的进化。丰富的智能应用为赤兔大模型能力保驾护航,包含会话洞察、业务话术、问答知识库、知识运用、数据分析、智能对话框架、流程管理。
(2)大模型优势:赤兔大模型三个核心点分别是智能性、可控性和投产比。
智能性方面是客户最关心的,首先能力是否足够丰富,能否解决以前不能解决的问题以及相关能力到底能做多好。
智能性方面,包括检索增强、会话分析、逻辑推理、数据分析。
检索增强是指在海量文档中快速定位到信息,经过整理给客户提供答案。
会话分析能让模型在对话中发现多维度信息,包括情绪、立场、各种细节的意见,并且根据不同业务快速切换业务场景。
逻辑推理体现在推荐话术的原因,投诉、预警的原因这种因果分析能力。
数据分析体现在对数据更细致且自动化的分析,减少技术人员和业务人员的数据层面上的操作;
可控性方面,赤兔大模型在道德、伦理、安全、风格、偏好上对齐,对话或话术生成时满足基本安全需求。另外让模型知道应该处理的知识范畴、知识边界,从而避免自由对话潜在的安全风险和资源消耗;
投产比方面,大模型强大能力来源于大规模,而大规模需要大投入,合理的投产比是客户采取方案的底层逻辑。所以明确是否所有场景都需要大模型,AI 底座上,没有摒弃小模型,大小模型相配合完成对上层能力的输出。机制上合理调动分配,比如有的环节大模型靠后完成线下或离线的工作,有的环节大模型调动指挥小模型完成。
(3)大模型应用:基于赤兔大模型,容联云发布了生成式应用“容犀 Copilot”。
容犀 Copilot具备三大核心能力:大模型话术、智能知识库、会话洞察。大模型话术:容犀Copilot 后台一键快速对海量历史会话数据进行核对筛选,挑选出更佳话术并生成金牌话术,兼顾质与量的同时,挖掘出客户高频关注的问题,从问题中洞悉业务痛点;
智能知识库:可以帮助企业从零开始、低成本地快速构建话术库,包括理解文档知识、知识快搜、智能问答等,大幅提升构建效率;
会话洞察:高效便捷洞察每一通会话沟通情况,分析客户诉求,精准诊断问题并优化。回归实际业务本身,容犀 Copilot 深入金融行业细分场景,打造场景化客服助手,譬如分期挽留助手、荐卡挽留助手、投诉安抚助手等,实时辅助快速洞察客户需求,推荐更佳应答话术,诊断客户情绪变化,提醒措辞及注意事项。
容犀 Copilot 产品应用场景案例五:蜜度—文修大模型
(1)大模型简介:文修大模型是蜜度推出的一款聚焦于智能校对领域的大语言模型,基于蜜度在校对领域的知识和经验积累,为政务单位、新闻媒体、企业单位、学校机构、出版机构等专业用户提供更贴合使用场景的校对服务。
文修大模型具备校对能力强、速度快、匹配度高三大特点,更好地解决垂直行业的问题。
(2)大模型优势:数字化时代,内容创作与传播速度惊人,信息准确无误地传达给公众尤为重要,蜜度文修大模型通过优秀的校对能力、高效的处理速度和高度的匹配度应对变局。
校对能力方面,文修大模型以拼写错误、语义错误、语法错误为基础,以内容差错、常识校对差错、内容风险识别三大类校对类型,27 类细分类型为校对标准,有效满足出版行业、新闻行业的“三审三校”的校对规范和实际业务需求,提供诸如广告法检测、常识校对等更为全面的校对服务;校对速度方面,文修大模型几秒钟就能校对完一篇千字文章,几分钟即可校对一本 10 万字书稿。
其快速校对的背后是实实在在的“学习能力”,文修大模型能迅速将人们短时间内难以学习消化的内容,转变成自身的校对能力,完成快速输出;匹配度方面,蜜度服务政府部门、媒体单位十余年,数十款智能应用产品及解决方案,覆盖政务部门、出版单位多个办公环节及场景,拥有成熟的流程服务,在洞察用户需求和使用场景方面拥有深厚的经验。
(3)大模型应用:文修大模型满足政务单位、新闻媒体、企业单位、学校机构、出版机构的多行业场景应用需求。
政务单位领域,赋能各级政务部门校对流程智能化,提供文字材料的内容错敏校对、修改提示和文本润色等服务,全力保障内容的准确性及严谨性,支持内网环境下校对,满足更高保密需求;
新闻媒体领域,文修大模型深入新闻媒体工作的各个环节,对多模态内容进行多类错敏校对,帮助快速定位错误并高亮显示,让内容更加规范严谨,有效维护官方账号的公信力;同时提供文本润色服务,提高出稿速度,保障新闻时效性;
企业单位领域,全流程切入企业办公场景,从内容纠错、提升文本质量等多方位出发,优化宣发内容,提高文案吸引力,助力营销效果显著提升;
学校机构领域,针对学校机构的宣传材料、新媒体稿件、科研报告、学术论文等内容进行全面校审,有效降低文字错误率,保障学术严谨性。通过 AI 润色功能助力文章、报告、材料的起草、优化工作,有助于进一步提升学校传播力、影响力;出版机构领域,提供专业、便捷、高效的内容筛查及文字质量把关服务,协助各出版机构高效处理多语言文本,降低内容差错概率,保障内容的规范性、准确性。
案例六:用友—YonGPT 大模型
(1)大模型简介:YonGPT 是用友基于数字和智能技术服务企业和公共组织数智化的企业服务大模型。YonGPT 在企业服务领域的应用主要集中在 4 个方向:
智能化的业务运营、自然化的人机交互、智慧化的知识生成、语义化的应用生成。YonGPT 企业服务大模型整体架构图(2)大模型优势:用友人工智能研发团队基于大规模的商业应用数据,结合企业应用场景和领域经验,标记了大量的企业服务语料数据,形成丰富的企业服务大模型训练素材,并将业务知识与领域经验融入企业服务大模型,确保了 YonGPT 的专业性、实用性及领先性。同时 YonGPT 通过上下文记忆、知识库表索引、Prompt 工程、Agent执行、通用工具集等扩充大模型的存储记忆、适配应用和调度执行能力,形成体系化的企业服务大模型。YonGPT 还优化了企业服务大模型的训练效率和成本,集成了丰富的开发工具和优化算法,通过自有的数据管理、大模型精调、大模型评估优化、大模型推理和插件服务等功能,为大模型的构建和服务提供稳定且有效的支撑。
(3)大模型应用:用友企业服务大模型 YonGPT 围绕四个方向推进模型训练和产品效果优化,提供深入到客户业务前端的全价值链、全场景的泛在智能和群体智能应用。
在智能化业务运营方面:YonGPT 通过强大的数据分析和预测能力,深入洞察企业运营、识别潜在的业务风险和机会,并提供智能化的解决方案,从而提高经营决策水平和业务运营效率;
在自然化人机交互方面:YonGPT 通过强大的自然语言处理技术和理解能力,使能企业应用和服务与用户进行自然而流畅的对话交流,以“人”为本的方式实现不同应用的调用、连接、组装,更自然、高效地完成工作;
在智慧化知识生成方面:YonGPT 通过从海量数据和信息中提取、整合知识,生成新的、有价值的知识内容,涵盖了行业解决方案、专业领域知识分享,助力企业和用户全面利用自身知识的储备和积累,促进知识的传播和应用;
在语义化应用生成方面:YonGPT 通过对用户需求、企业业务和数据特征的理解,可以自动生成具有语义化能力的应用程序,全方位提升企业个性化应用服务的创建效率。此外 YonGPT 在智能化场景服务中实现四个服务:企业收入/利税经营智能分析,可以实时掌控经营状况、快速洞察问题所在、精准预测企业效益、有效预见应对变化;智能生单,融合了丰富的供应链经验,通过“交互革新式”订单生成助手,实现快速智能生单,提高企业效能;智能招聘,帮助企业快速精准识别定位目标人才,从海量简历池中发现人才,通过 AI 互动优化应聘体验,实现选人、用人的精准决策;智能大搜,提供“沉浸式”搜索新体验,加速企业知识的价值化服务,并洞察用户需求、实现搜推一体,让知识赋能业务和组织。
案例七: “写易”智能创作引擎
(1)大模型简介:“写易”智能创作引擎是人民网推出的垂类写作大模型,依托自主研发的主流价值观大模型针对写作场景训练而成。“写易”智能创作引擎适合党政党媒、央企国企、学校医院等有日常阅读需求和写作需求的群体,提供专业权威、系统整体、持续更新的数智服务,从而更好地启发创作者的写作灵感。
“写易”智能创作引擎产品架构(2)大模型优势:“写易”智能创作引擎深入挖掘用户需求,构建了“随查”“随写”“随审”的交互体验, 具有创作高效、安全准确、内容丰富的特点。
其主要功能有:高效的智能创作引擎:“写易”智能创作引擎依托于超过 25 万条的权威主流语料库,创新性地实现了基于检索增强的辅助生成能力。可通过标题自动生成优质核心内容,同时结合标题与观点等上下文信息,为用户生成相关性更强、准确性更高的文章素材,从而显著提升写作效率;
专业的涉政内容审校:1.原文引用检测:检测文本是否引用了重要讲话、重要政策文件,分析引用的规范性,同时给出原文的出处等溯源信息。2.规范表述审校:对领导人重要讲话、党和国家重大政策重要文件等文本进行规范性检测。3.人物信息审校:对文本中出现的人物姓名及职务信息等进行勘误检测。4.关键信息审核:检测文本中有标志性、代表性的重大事件、重要人物、重要敏感信息等内容。5.基础纠错:对文本中的错别字检测、标点符号错误检测,包括中文、英文拼写、成对标点、特殊数字与符号等错误;
内容丰富的写作素材知识库:依托人民网和人民日报,配备强大的资料库,系统化整理信息,按照时间、内容、形式、图文音频等多维度进行分类汇总。及时同步《人民日报》每日的精选文章,实时提炼更新当日最优标题、最美佳句、最优词语等内容,为用户提供新鲜的写作素材。
(3)大模型应用:“写易”智能创作引擎,服务于以国资央企、党政机关、事业单位、党媒党网、地方融媒体、教育系统、医疗系统等为重点的全行业客户,满足客户在不同场景中的定制化高效写作需求。“写易”智能创作引擎可结合客户数据库进行定制,具体而言,人民网以行业客户数据库语料为核心,《人民日报》内容为辅助,为客户定制化训练“写易”智能创作语言大模型,帮助提高写作能力、积累写作素材、规范写作格式。
在写作过程中还可以为标题撰写、修辞使用、引用诗文和网言网语等提供丰富素材,帮助创作者启发灵感、提供思路,从而自动、高效地生成符合客户写作场景的高质量文章素材,为客户提供全维、全时、全域的智能化服务,助力工作总效率大幅提升。
2.5 中国 AI 端云结合大模型典型案例案例八:vivo—蓝心大模型
(1)大模型简介:蓝心大模型是行业首个在手机端运行的开源自研大模型,也是更适合中文用户的中文开源大模型,其包含十亿、百亿、千亿三个参数量级,共 5 款自研大模型(10 亿、70 亿、700 亿、1300 亿和 1750 亿)。随着参数提升,蓝心大模型逐渐具备文本总结、语言理解、文本创作、知识问答、角色扮演、复杂逻辑推理、复杂任务编排等能力。基于蓝心大模型能力,vivo 开发出蓝心小 V 和蓝心千询两款手机端产品。
vivo 蓝心大模型矩阵(2)大模型优势:
1)矩阵化优势vivo 大模型矩阵具有不同参数量级、多种部署方式,可应用于不同使用场景,在满足用户手机体验的同时,优化大模型推理性能以及端侧部署时占用的手机内存、功耗。10 亿参数的蓝心大模型(1B),是面向端侧场景打造的专业文本大模型,具备本地化的文本总结、图片风格化能力,适用于需要快速本地化摘要、生图的场景;70 亿参数的蓝心大模型(7B),是面向手机打造的端云两用模型,有良好的上下文关联能力和任务拆解能力,在语言理解、文本创作等场景下表现优秀。
蓝心大模型 7B 也是手机行业首家开源的大模型,实现 AI 普惠;700亿参数的蓝心大模型(70B),是 vivo 面向云端服务的主力模型,在角色扮演、知识问答等场景下表现优异,既有智能涌现,也能兼顾成本和性能。面向复杂任务,vivo 也推出了两款千亿参数模型,1300 亿和 1750 亿大模型 ,凭借更丰富的知识量提供更加专业的智能体验。
2)端侧优势蓝心大模型 1B 和蓝心大模型 7B 可在手机端运行,展现了出词快、内存低、全天候、真安全的强大端侧运行优势。
出词快:vivo 对手机端上的 1B 模型优化,测试出字速度极限可达 60 字每秒,远超人眼约 10-20 字每秒的阅读需求;
内存低:vivo 优化模型在手机端的内存占用问题, 蓝心大模型 1B 和蓝心大模型 7B分别只需占用 1.3G 和 3.8G 手机内存。
全天候:将蓝心大模型置于终端设备上可以减少数据延迟,并能够满足例如出差飞机、高铁等无网弱网场景下的大模型使用需求,使得一些应用可以全天候正常运行。
真安全:vivo 实现端侧内容安全过滤模型,优化输入语料和大模型生成内容的合规性问题,端侧大模型有助于在本地处理数据形成闭环,减少了敏感信息通过网络传输的风险,为大模型应用场景落地移动终端提供安全基石。
3)算法优势蓝心大模型具备三大算法优势:强大的基础能力、精准的指令跟随以及正确的价值取向。
首先,强大的基础能力是大模型的根基。在预训练阶段,vivo 利用最前沿的 Transformer 架构,改良注意力机制、位置编码等关键模块,采用混合精度训练以及梯度缩放策略缩短训练周期。
其次,精准的指令跟随是大模型与用户交互的核心。vivo 对于微调采用“target only loss”方法,并通过聚类分析对指令进行适应性处理,以更好地确保模型的均衡性。第三,正确的价值取向是大模型的灵魂。在强化学习阶段, vivo 建立了 300 余名专业人员组成的审核团队,制定了 200 余项的安全审查机制,对模型的输出进行筛查和标注。同时,vivo 采用离线采样策略和双重奖励模型等策略,在安全性上有明显提升。
(3)大模型应用:
1)蓝心小 V蓝心小 V 是 OriginOS 4 上搭载的一款全局智能辅助功能,支持超能语义搜索、超能问答、超能写作、超能创图、超能智慧交互。
超能语义搜索:使用自然语言即可搜索手机中的照片、文档、日程等信息;超能问答:根据用户上传的文档,快速提供文档总结,也可根据文档内容快速问答,还可以是知识百科开放式问答;超能写作:基于用户的要求,结合 AI 能力给用户生成文本,如润色、扩写、总结、格式文本等;超能创图:
1、文生图和图生图:基于用户文字描述或上传图片,生成目标图片。
2、AI 路人消除(路人隐身):上传包含路人的图片,通过对话消除路人,生成更为纯净的图片;
超能智慧交互:
1、智能识屏服务功能:一键识别屏幕上的文本、网页链接,提取有效信息;
2、超直觉化的交互方式:交互更多元,语音、文字、点击、拖拽、悬浮形式,互动更轻松。
2)蓝心千询
vivo 基于蓝心大模型打造的全天侯 AI 私人小帮手——蓝心千询,覆盖 AI对话和 AI 灵感两大核心应用场景。蓝心千询是手机行业首个大模型公开版免费APP。AI 对话模块,蓝心千询支持“超能问答”以及“超能创图”两大功能,用户可以通过 AI 对话进行文本问答、开放问答或是基于文档的问答,以高效获取信息、知识。另外,无论写诗、AI 作画、创作歌词、撰写标题/活动方案,蓝心千询皆可胜任。AI 灵感模块,蓝心千询能够提供社交媒体文案创作、PPT 大纲生成、中英文本互译等功能,还设置有穿搭建议等有趣的灵感工具。灵感广场设置有不同场景下的灵感技能卡片,覆盖工作、学习生活中的创作场景。蓝心千询将基于卡片语境快速生成对应文案,为用户的工作、学习、生活提供广泛灵感支持。
第三章 大浪淘沙:中国 AI 大模型产业发展所面临的挑战
3.1 大模型产业遭遇算力瓶颈
随着 AI 大模型规模呈现指数级增长,训练大模型越发依赖高性能 AI 芯片。
AI大模型的训练速度与产出质量直接受算力影响,GPT等LLM对算力要求更高,直接决定模型智能水平。当前,英伟达A100、H100等高性能AI芯片已广泛应用于主流大模型训练,为AI领域带来强大驱动力。
ChatGPT依托微软Azure云服务,拥有1万枚英伟达A100 GPU,这一强大算力已达到国内云计算技术专家普遍认可的AI大模型标准。
国内鲜有企业拥有万枚GPU,且性能普遍不及英伟达A100。鉴于A100及以上性能GPU受限,中国企业目前仅能采购英伟达A800作为替代,但A800亦面临缺货与溢价问题,市场供应紧张。
国产芯片性能尚未比肩国际顶尖,AI高性能芯片市场受进口限制与技术瓶颈双重影响,大模型产业发展在算力层面遭遇挑战。
3.2 主流大模型架构仍存在诸多局限
主流AI大模型采用的Transformer架构面临算力消耗大、内存占用多等挑战,亟待优化以提升性能与效率。
Transformer架构显著消耗算力资源,其计算量随上下文长度增长呈平方级递增。用户输入的上下文若扩大32倍,计算量激增超千倍,凸显架构在效率方面的挑战。
Transformer大模型对存储设备提出更高要求。训练时,需存储参数的当前值、梯度与优化器状态。参数增多,计算量与存储空间同步攀升。以1000亿参数的模型为例,其参数存储需高达400GB空间。这一挑战凸显了高效存储与计算资源的重要性。
3.3 高质量的训练数据集仍需扩展
我国中文大模型训练数据库体量匮乏,如悟道语料库最大仅5TB,开源文本仅200GB,CLUECorps数据集也仅100G。相比之下,GPT-3以英语为主的训练数据量高达45TB。中文数据库规模亟待提升,以满足大模型训练需求。
国内大模型数据调用受限,有效数据源碎片化分散,如微信公众号文章仅搜狗引擎可调,智谱清言等大模型联网收集时无法直接调用,缺乏多数据源整合,影响模型训练效果。
政府部门及大型企业的核心数据鲜少公开,如阿里巴巴“通义千问”大模型,其训练数据多源自公开网络,政府及企业数据占比甚微。展望未来,构建高质量AI大模型训练数据集,拓宽数据源、提升数据质量势在必行,以驱动AI技术的持续进步与发展。
3.4 大模型爆款应用尚未出现
ChatGPT iOS版发布近十个月,持续领跑生成式AI应用下载榜,稳居前三,下载量、用户支出及会话时长均表现出众。
GPT4.0升级支持语音交互,理解并回应语音指令,同时可将文本转化为语音播放,为用户带来全新互动体验。
OpenAI预计在2024年1月推出GPT商店GPTs,涵盖超300万款应用,覆盖写作、效率提升、研究分析、编程、教育及生活方式等多个领域,为用户提供一站式智能应用体验。
热门应用Consensus,轻松检索2亿篇学术论文,科学答案触手可得。Grimoire则简化编程过程,填写基本信息即获HTML、CSS、JavaScript代码,助力高效创建网站或编程应用。
国内AI大模型产业尚未诞生爆款应用,关键在于商业化策略不明朗,缺乏个性化客户满足。要打造爆款,必须深耕应用领域,确保每位用户都能切实感受到大模型带来的便捷与高效。
第四章 天阔云高:中国 AI 大模型产业趋势展望
4.1 AI 云侧与端侧大模型满足不同需求,C 端用户将成为端侧的主要客群
我国云侧大模型繁荣涌现,百度文心一言、阿里通义千问、科大讯飞星火、腾讯混元等竞相绽放。凭借卓越算力和海量数据,这些模型参数高、功能强,具备语言理解、知识问答、数学推理、代码生成等多重能力,展现云端智能新高度。
云侧大模型革新B端企业业务模式,提供营销、客服、会议记录、文本翻译及预算管理等一站式个性化服务,重塑企业运营生态。
端侧大模型革新C端用户体验,重塑个人设备使用习惯,涵盖文档搜索、智能识屏、图像创作等专属服务。然而,云侧大模型高昂的服务器成本,每年可达数亿至数十亿,成为发展瓶颈。其成本主要受制于调用频率与用户基数,给各大厂商带来显著挑战。
大模型端侧化,转移云端计算至终端,降低服务器成本。数据本地保存,保护个人隐私,提升安全性。其丰富的应用场景、低成本及强隐私保护,预示着大模型端侧化将成未来趋势。
瑞银预测,生成式AI智能手机出货量将迅猛增长,从2023年的5000万部跃升至2027年的5.83亿部,预计收入高达5130亿美元。面向C端用户的端侧大模型市场潜力巨大,前景广阔。
4.2 AI 大模型趋于通用化与专用化,垂直行业将是大模型的主战场
通用大模型凭借数百亿至千亿级庞大参数,展现卓越泛化及多任务学习能力。经海量数据锤炼,它精准捕捉复杂规律,对未知数据作出精准预测,实力不容小觑。
通用大模型精通文本总结、对话问答、逻辑推理等多任务,凭借大规模预训练与微调,跨领域游刃有余,更具备文字、图像、语音、视频等多模态理解生成能力,引领智能新时代。
行业大模型专长于金融、政务、医疗等领域,高效应对特定任务。金融大模型助力企业精准评估信用风险;政务大模型提供问答、公文润色与审核;医疗大模型支持影像诊疗、手术评估与导诊,全方位提升行业效率。
行业大模型凭借高度专业性和数据安全性,将在各行业及企业应用中展现其真正的价值,引领未来大模型发展潮流。
行业大模型聚焦特定领域,利用通用大模型资源实现多领域能力,模型参数精简,为企业降低成本,实现显著的经济效益。
行业大模型融合企业或机构内部数据,精准服务B端用户经营场景,显著提升效率,降低运营成本,助力机构实现降本增效目标。
4.3 AI 大模型将广泛开源,小型开发者可调用大模型能力提升开发效率
从具体进展来看,2022年8月,清华大学开源中英双语预训练模型 GLM-130B,使用通用模型算法进行预训练。
2023年6月,百川智能发布开源可商用大规模预训练语言模型 Baichuan-7B,支持中英双语。2023年10月,智谱AI 开源ChatGLM3系列模型。2023年11月,vivo开源70亿参数的大模型,向广大开发者提供了获取大模型技术的渠道。2023年12月,阿里云开源 Qwen-72B、Qwen-1.8B 和Qwen-AudioQwen大模型。随着大模型逐渐开源,
小型开发者可依托大模型,轻松开展项目、应用及插件开发,摆脱算力束缚,简化模型训练与调参,实现应用快速落地。
小型开发者巧妙运用大模型技术,集成于代码工具中,大幅提升开发效率。该技术能辅助完成重复性任务,为开发者提供精准代码建议,自动检测代码Bug并生成测试用例。这一创新方案显著缩短了编码和纠错时间,为工程师的日常工作带来极大便利。
4.4 AI 高性能芯片不断升级,AI 大模型产业生态体系将不断完善
英伟达凭借尖端半导体工艺和革命性GPU架构,稳坐全球AI高性能芯片市场领头羊。A100芯片在AI大模型训练中占据显著地位,而H100性能卓越但难求。展望未来,AI高性能芯片将持续演进,引领大模型性能与能力的飞跃。
近年来,国内AI高性能芯片发展迅猛。华为昇腾系列中,910芯片凭借7nm工艺和高达256 TFLOPS的FP16计算能力,引领行业能效新高度。另一本土巨头寒武纪,其思元290和370芯片以及配套产品,展现了云端智能加速与训练整机的全面实力。两大厂商共筑国内AI芯片新篇章。
AI 大模型将加快新质生产力发展,助力我国经济社会高质量发展
AI大模型是人工智能领域的核心技术,孕育着新质生产力。这种生产力以创新为主导,摒弃传统经济增长方式,具备高科技、高效能、高质量特征,是符合新发展理念的先进生产力。其诞生源于技术革命性突破、生产要素创新配置以及产业深度转型升级。
AI大模型作为推动新质生产力发展的关键,以劳动者、劳动资料、劳动对象的优化组合跃升为核心,显著提升全要素生产率。它引领多领域智能化升级,高效提升生产效率,降低成本,强化产业竞争力。
中国经济迈向高质量增长,AI大模型催动新产业、模式与动能,强势助力经济社会高质量发展,与《国家创新驱动发展战略纲要》中创新驱动、产业升级的要求高度契合,展现巨大发展潜力。
大模型应用在我国产业高质量发展中扮演关键角色,人工智能技术的升级推动其产业化。vivo等科技企业推出的大模型为生产生活带来便利,引领商业模式创新,助力产业升级,共创美好未来。
面向未来,我国需深化资源研发统筹,强化大模型场景引领,以推动经济社会高质量发展。确保大模型技术突破,引领实体经济蝶变与产业革新,迈向更高发展境界。
量子计算,引领AI与新生产力革命,Sora大模型公测在即。华为AI芯片生态全栈解析,2024展望,未来已来!
-对此,您有什么看法见解?-
-欢迎在评论区留言探讨和分享。-