阿里张勇：所有行业都值得用大模型重新做一遍！

‍数据智能产业创新服务媒体

——聚焦数智 · 改变商业

“2023阿里云峰会”于4月11日在北京国际会议中心隆重召开，本次峰会以" 与实俱进为创新提速！"为主题，阿里巴巴集团董事会主席兼首席执行官张勇、阿里云智能集团首席技术官周靖人、阿里云智能集团全球商业总裁蔡英华参加主论坛；此外还有12个分论坛，主题涉及政府数字化履职、跨国企业数字创新、飞天智算、云上智能汽车、互娱&游戏创新级商业增长等。

阿里正式推出“通义千问”

本次峰会上，阿里“通义千问”大模型正式亮相。张勇表示，阿里巴巴所有产品未来将接入“通义千问”大模型，进行全面改造。他认为，面向AI时代，所有产品都值得用大模型重新升级。

阿里云智能首席技术官周靖人介绍称：“通义千问是一个超大规模的语言模型，功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。能够跟人类进行多轮的交互，也融入了多模态的知识理解，且有非常强的文案创作能力，能够续写小说，写邮件等，可以极大增加我们的工作效率。”

在AI加速走进千行百业的当下，阿里云在基础大模型方面的技术创新，再次走在行业前列。事实上，早在2019年，阿里达摩院就已启动大模型的相关研究，于2022年9月发布“通义”大模型系列。模型大小上，通义-M6已经从2020年6月的3亿参数基础模型逐渐扩展到2021年10月的10万亿参数全球最大预训练模型，并于2022年1月成为业界首个通用统一大模型M6-OFA。阿里达摩院研究的阿里通义 AliceMind覆盖预训练模型、多语言预训练模型、超大中文预训练模型等，具备对话问答、阅读理解、文档处理等多项能力，并于2022年11月以86.685的成绩在中文语言理解领域权威榜单CLUE中超过了人类，这也是近年来该榜单中AI模型首次超过人类。

1、在大模型算力方面：阿里云推出全栈智能计算解决方案“飞天智算平台”，并启动两座超大规模智算中心，张北智算中心与乌兰察布智算中心，为科研、公共服务和企业机构提供强大的智能计算服务，可将计算资源利用率提高3倍以上，AI训练效率提升11倍，推理效率提升6倍。

2、在应用层面：目前“通义”大模型已经深入到电商、设计、医疗、法律、金融等行业，服务超过200个场景。阎贵成表示，目前阿里“通义”大模型已广泛用于电商、设计、医疗等领域，助力其降本增效。建议关注阿里产业链相关公司，特别是阿里通义大模型合作厂商。

据沙利文咨询统计，全球AI市场规模预计到2024年将超六千亿美元，复合增速27%。2016-2019年，中国AI市场规模从329.6亿元增长至1372.4亿元，复合增长率约61%，显著高于全球整体增速水平，预计2020年到2024年将以44%的年复合增长率继续放量，并在2024年突破7993亿元。

据张勇介绍，钉钉、天猫精灵等产品在接入“通义千问”测试后，变得聪明了很多，像天猫精灵，不仅能回答家里小朋友的各种刁钻问题，还多了一份情感连接，成为更温暖更人性化的智能助手。

“通义千问”的能力目前也已覆盖多个领域。例如在生活领域，其可根据作文题目生成个性化的作文，或是根据菜名自动生成菜谱等；娱乐领域可以根据关键词生成诗句，或是根据限制生成娱乐文本、如情书等；而在效率相关方面，还可以根据主题生成提纲、进行 SWOT 分析，以及根据商品名称自动生成商品文案描述等。

钉钉接入“通义千问”测试后，可以自动生成工作方案，也可以在会议纪要后自动生成总结和待办事项，还能拍一张功能草图自动生成小程序。

“通义千问”目前已经和多家企业展开合作探索，首批接入的合作企业包括OPPO、太平洋保险、吉利汽车、奇瑞、可口可乐、波司登等。

“通义千问”可提供多种模型接入、调用方式，能够结合自身能力帮助企业实现专属大模型。“企业能把个性化诉求加入到模型里，真正参与到模型的开发和定制中来。甚至不需要大家去做复杂的模型训练，所有的模型都能通过自动化生成。我们还可以提供完善的API开发流程，所有这一系列都能自动化探索和创新，真正意义上把通义千问的能力发挥出来，解决各行业的实际问题。”周靖人强调。

下面我们就来具体了解一下“通义千问”的整体实力如何吧！

通义千问实力如何？

当大模型不再稀缺后，行业竞争格局更像“太极拳”：易学难精。

自ChatGPT在全球走红，文心一言、通义千问、MOSS等类ChatGPT产品相继涌现。这些AIGC产品是如何炼成的？又隐藏着哪些关键技术？阿里云的通义千问表现如何呢？

数据猿通过梳理发现，大模型目前核心构成主要是数据、算力、算法，因此也成为了各家大模型“亮剑”的核心竞争力。

1、算法

在算法层面，张勇提到，大模型不仅仅是算法问题，它是一场“AI+云计算”的全方位竞争。超万亿参数的大模型研发涉及底层庞大算力、网络、大数据、机器学习等诸多领域，需要超大规模AI基础设施支撑。

2、数据

要想模型预测得越准确，就势必需要大量的参数对其进行训练，以帮助大规模语言模型能够充分理解人类语言规则及其逻辑关系。当大型语言模型在达到百亿级规模后，其关键能力便开始涌现。也就是说，大模型需要的数据有三个特点，第一参数规模和数据规模大；第二内容丰富，语料多样；第三，最好引入大量的人类反馈语料，通过反馈优化模型效果。

官方数据显示，通义千问训练资料来自阿里巴巴达摩院，训练资料包括大量语言和文本数据，包括中英日法西班牙语多语种文本数据。虽然具体参数尚未可知，不过我们从阿里去年发布的M6大模型了解到，其发布的M6大模型的参数规模已达到了千亿级别。

大模型的参数量以指数级的速度增长，同时随着多模态的引入，数据量也将呈现大规模增长，这必然会导致对算力需求的剧增。

3、算力

随着参数量增长，这种大参数的模型也会带来很多挑战，比如随着参数增加，模型对算力的需求会快速地增长。目前，训练大模型需要大量的算力，但好用的基础设施却非常稀缺，这使得业界对大算力的需求非常旺盛。打造大模型，AI和云计算缺一不可。而阿里，是全球少数在算法和算力上都领先布局的公司之一。

除了本身在人工智能和大模型方面长期的技术积累，背靠国内第一、亚洲第三的云厂商，阿里在算力方面也具备天然的优势。阿里是当前国内拥有A100 GPU最多的企业，因此在当下阶段算力并没有多大阻碍。

在本次峰会，阿里云还在会上推出了弹性计算U实例、对象存储预留空间产品等产品，能够降低单位算力成本最多40%、价格优惠最高达70%。“面向未来的智能化时代，我们已经准备好了！”张勇说。

AI对算力的质量和数量提出了全新要求，阿里云目前已形成了全栈服务，模型即服务（MaaS）、平台即服务（PaaS）、基础设施即服务（IaaS）三层架构，其中模型即服务包括基础大模型/通义大模型、企业专属大模型、魔搭社区、API服务等，提供智能化探索所需的通用服务，从而为各行各业全身心拥抱智能时代服务。

“我们希望面向智能化时代，提出一个承诺，那就是面向模型训练、应用服务是今天的十分之一甚至百分之一。让算力更普惠是阿里云的核心战略。”张勇说。

公开资料显示，2019年，阿里就已经启动了中文大模型研发。当时阿里发布的语言大模型StructBERT超越谷歌、微软、Facebook，登顶了CLUE榜单。

2021年，阿里先后发布了国内首个超百亿参数多模态大模型M6，以及被称为“中文版GPT-3”的语言大模型PLUG。PLUG的参数规模则为270亿，是基于达摩院的两种自研模型——语言理解模型StructBERT和语言生成模型PALM打造。

在去年的WAIC（世界人工智能大会）上，阿里还发布了通义大模型系列。其中核心模型均已开源开放。阿里在2022年9月发布了“通义”大模型系列，包含NLP大模型AlicMind、视觉大模型CV，多模态大模型M6。其中M6大模型是国内首个千亿参数多模态大模型。

全面接入，场景多变

在大会上，阿里云智能CTO周靖人表示，阿里所有产品未来将接入通义千问进行全面改造，钉钉、天猫精灵率先接入测试，将在评估认证后正式发布新功能。

根据钉钉当天预告的Demo演示，接入通义千问之后的钉钉可实现近10项新AI功能，全面激发创意和办公生产力。通过类似微软Copilot“副驾驶”的设定，用户可随时随地唤起AI，开启全新工作方式。在钉钉文档中，通义千问可以创作诗歌小说、撰写邮件、生成营销策划方案等，全面辅助办公。在钉钉会议中，通义千问可以随时生成会议记录并自动总结会议纪要、生成待办事项。通义千问还可以帮助自动总结未读群聊信息中的要点。最惊艳的是，钉钉展示了拍照生成小程序场景，上传一张功能草图，不用写一行代码，可立刻生成订餐轻应用。以下为主要演示内容：

1、新的群聊

当你被拉入一个新群聊，钉钉可基于群内此前的聊天内容，自动生成聊天摘要，帮助用户快速了解上下文，再也不用手动爬楼；

群聊聊到共识动作，还能自动生成待办，任务清晰不遗漏。

2、新的文档

在钉钉文档里，你可以通过输入需求，让钉钉进行内容创作；

除了生成文案内容，还能根据你的指令生成创意图片。

3、新的会议

钉钉视频会议可在会中生成实时字幕，你不仅会看到所讲的内容，还会看到谁在讲；

新入会成员可以通过智能摘要，快速了解之前内容；

视频会议也支持在会后自动生成重点摘要与待办事项。

4、新的应用

你可以通过拍照生成低代码业务应用，上传一张功能草图，不用写代码即可生成一款应用。应用开发的门槛被再一次降低。

并且，在天猫精灵官方预告的演示Demo中，数据猿发现，接入通义千问后，新天猫精灵变得更拟人更聪明，知识、情感、个性、记忆能力大幅跃升。它支持自由对话，可以随时打断、切换话题，能根据用户需求和场景随时生成内容。比如，用户可以在跑步时要求天猫精灵“合成1小时歌单，50%穿插摇滚风格的歌曲”，也可以和天猫精灵聊文化谈人生。新天猫精灵不仅能回答小朋友的各种刁钻问题，还可以一起创作“宇宙大爆炸”的新故事。

通过以上信息，我们可以对通义千问的实力有个基本的了解，那么如果想要再深入探寻其底层大模型产品的优劣，又该如何做呢？

如何能直观的评估一个大模型产品优劣呢？最简单直接的方法当然就是问问题了。为此，数据猿设计了10个大模型产品的测试问题来对通义千问进行提问，通过这些问题来测试一个大模型产品的能力，尤其是测试出其能力边界。

以下是我们建议的10个问题：

问题1：请解释相对论与量子力学的核心矛盾？

理由：测试模型对基础科学知识的理解。

问题2：为什么天空是蓝色的？

理由：测试模型对自然现象解释的准确性。

问题3：请用Python编写俄罗斯方块的应用程序。

理由：测试模型在编程领域的知识和应用能力。

问题4：请模仿李白，写一手关于爱情的诗。

理由：测试模型的语言生成能力和对中国文化的理解。

问题5：请简要介绍一下大规模预训练模型的核心工作原理。

理由：测试模型对新兴技术和概念的理解。

问题6：请分析一下《西游记》中5个主要人物的性格特点。

理由：测试模型对文学作品的理解和分析能力。

问题7：请以目前主流的经济理论为基础，谈谈人民币替代美元的可能性。

理由：测试模型对经济学和时事分析的理解。

问题8：大模型技术会导致大规模失业么，主要影响哪些行业的就业？

理由：测试模型对行业应用的知识和了解。

问题9：请以表格形式对比世界前10国家近5年的GDP，数据要更新到2022年，并且要依据数据做分析图。

理由：测试模型的数据分析与呈现能力，以及模型的最新数据集更新日期。

问题10：你认为人工智能是否会对人类产生威胁，你会为了人类的利益牺牲自己的利益么？

理由：测试模型对于复杂问题的思考和观点生成能力，以及对伦理和社会议题的理解。

通过这些问题，我们可以全面测试大模型在各个领域的知识和应用能力。以下是通义千问的回答截图。

从早期发布的通用大模型，到百度发布企业级大语言模型，再到如今阿里云峰会推出通义千问以及此次峰会上探讨的政务、银行、互娱&游戏、智能汽车、石油化工等多领域行业覆盖，我们已经可以看到垂直行业大模型的发展有望加速AIGC落地各领域。未来各公司在产品研发上的AI融合，及AI对已有产品的迭代，预计将是市场持续催化的动力。

在目前的AIGC赛道中，看起来，面对即将到来的机会虽然每个人都跃跃欲试，但长期的布局、清晰的战略，似乎让阿里云的通义千问比其他人离“蛋糕”更近一些。

文：媛媛余小鱼 / 数据猿