可能是最有前途的国产大模型：讯飞星火认知大模型

大家好，我是可夫小子，关注AIGC、读书和自媒体。解锁更多ChatGPT、AI绘画玩法。加：keeepdance，备注：chatgpt，拉你进群。

昨天下午，科大讯飞发布了自己的大模型——星火认知大模型。在上周他们还在内测的时候，我就第一时间拿到了内测资格，通知群里的小伙伴，申请也是秒过。我简单地测试了一下，最直观感受就是「水平在线、诚意满满」。

昨天我观看了他们的发布会。关于大模型，刘庆峰主要讲了1+N的模式，1就主要是大模型的七个能力：内容创作、语义理解、知识问答、逻辑推荐、数学能力、代码能力，还有一个多模态。

对于这些能力，各家的说法都不一样，无外乎就是吴恩达总结LLM的几点能力：总结、推断、转换、扩展。性能上，大语言模型的一些问题它也存在。总的来说，还算中文大模型中第一梯队。那它为什么是「可能最有前途」的那个呢？我主要有以下几点思考

与语音的结合，有天然的优势

我们知道，科大讯飞是一家做语音起家的公司。在许多场景中，前端声学处理 + 语音识别 + NLP + TTS构成了一个最基础的语音全链路技术。科大讯飞这几十年就是在这个生意，不管是2B业务，还是2C业务。

在全链路的NLP部分，这些年使用最多还是神经网络。而以ChatGPT为代表的大语言模型，使用的是Transformer，算是一种神经网络的技术升级。讯飞的大语言模型的引用，就会对NLP作出了较大的改良。当然其实模块也有会影响，但NLP提升性能最大。

我们在发布会现场也看到，科大讯飞研究院院长刘聪演示大模型案例的时候，输入是使用语音输入，再识别成文本（ASR）。回答的文本也使用了语音合成（TTS）技术读文本。可以看到，他们整合很迅速了。这些前、后端，都是他们成熟的技术，这就是他们比其他公司的优势。

与现有业务结合，快速落地商用

一个新的技术，能否迅速流行起来，就是看能不能快速融入到现有的商业模式中去。在国产大模型中，阿里的通义千问，有这样的潜质。与钉钉办公产品结合，有着立竿见影式的降本增效功能，但钉钉的商业化之路一直走得不顺。

讯飞业务中，教育占了很大比重。其实在发布会，后面也显示了「智能批改作业」的功能，这就是一个很直观的商业落地场景。这块业务，他们在市场、渠道、产品、商业模式都走通过。现在只要用大模型的能力，把这些节点都重塑、改造。小步探索，慢慢试水，就容易搞出一条大模型的变现之路。有了商业的正反馈，技术发展也会得到保障，形成商业与研发的良性互动。

一些新的点

除此之外，我还看到他们关于插件、RPA的一些演示。其实这些是针对大语言模型的技术尝试。我在之前的文章《》，就介绍了OpenAI的Gerg在TED演示的一些内测功能，就有插件的应用。比如6月份，他们还会集成浏览器插件，实现实时信息搜索，可以说讯飞应用层面，没有落后太多。

挑战与风险

我注意到，在昨天的发布会上，刘庆峰在介绍大模型的能力之前，就先提出一个「评测体系」的概念。一方面是想当国内大模型的执牛耳者，成为标准的制定者。还有一个考量就是边界划定。这波AI热度无疑是里程碑式的，那它目的地在哪里？安全边界又怎么界定？

这其实是当下各国政府以及科学家最担心的问题，还不说远景的AGI发展与人类的关系的思考，就当下如何保证技术不被滥用，都是一个很大的课题。讯飞想接这个瓷器活，但也不一定拿得出「金刚钻」

还有一个挑战，就是「算力」。我们大模型的训练和使用就是算力猛兽，每一次请求，都是数亿次的计算。据CNBC报道，ChatGPT一次训练需要200-1200美元，用了1万个英伟达的DGX A100 GPU服务器。这些高性能的GPU，就是机器学习和图形计算的AI心脏，而英伟达占据了95%有市场，之前传闻A100和H100 GPU都不卖给中国公司了。科大在22年9月被美国列入了「实体清单」，要获得这些高性能GPU更是难上加难。

巧妇难为无米之炊，谁不能忽视悬在中国公司头上的「达摩克利斯之剑」

再有一个就是对于「智能涌现」分歧，对于大语言模型的发展，实践其实是走在理论在前面。相关研究人员发现，在ChatGPT的训练语料中，中文不到1%，但是在实际的使用过程中，中文的能力并不会比英文低很多。是不是模型在海量语料学习中，掌握各种语言之间的通用规则，出现一种「智能涌现」的能力？这其实还没有定论。1750亿的参数，就是一个黑盒子。

在刘庆峰的发言稿中，我搜索了「智能/智慧涌现」高达14次。可以看得出他对这个能力的信息，这到底是科学地乐观主义，还是盲目冒进，抑或其他原因，不得而知。