可能是最有前途的国产大模型:讯飞星火认知大模型

大家好,我是可夫小子,关注AIGC、读书和自媒体。解锁更多ChatGPT、AI绘画玩法。加:keeepdance,备注:chatgpt,拉你进群。

昨天下午,科大讯飞发布了自己的大模型——星火认知大模型。在上周他们还在内测的时候,我就第一时间拿到了内测资格,通知群里的小伙伴,申请也是秒过。我简单地测试了一下,最直观感受就是「水平在线、诚意满满」。

昨天我观看了他们的发布会。关于大模型,刘庆峰主要讲了1+N的模式,1就主要是大模型的七个能力:内容创作、语义理解、知识问答、逻辑推荐、数学能力、代码能力,还有一个多模态。

loading

对于这些能力,各家的说法都不一样,无外乎就是吴恩达总结LLM的几点能力:总结、推断、转换、扩展。性能上,大语言模型的一些问题它也存在。总的来说,还算中文大模型中第一梯队。那它为什么是「可能最有前途」的那个呢?我主要有以下几点思考

与语音的结合,有天然的优势

我们知道,科大讯飞是一家做语音起家的公司。在许多场景中,前端声学处理 + 语音识别 + NLP + TTS构成了一个最基础的语音全链路技术 。科大讯飞这几十年就是在这个生意,不管是2B业务,还是2C业务。

在全链路的NLP部分,这些年使用最多还是神经网络。而以ChatGPT为代表的大语言模型,使用的是Transformer,算是一种神经网络的技术升级。讯飞的大语言模型的引用,就会对NLP作出了较大的改良。当然其实模块也有会影响,但NLP提升性能最大。

loading

我们在发布会现场也看到,科大讯飞研究院院长刘聪演示大模型案例的时候,输入是使用语音输入,再识别成文本(ASR)。回答的文本也使用了语音合成(TTS)技术读文本。可以看到,他们整合很迅速了。这些前、后端,都是他们成熟的技术,这就是他们比其他公司的优势。

与现有业务结合,快速落地商用

一个新的技术,能否迅速流行起来,就是看能不能快速融入到现有的商业模式中去。在国产大模型中,阿里的通义千问,有这样的潜质。与钉钉办公产品结合,有着立竿见影式的降本增效功能,但钉钉的商业化之路一直走得不顺。

讯飞业务中,教育占了很大比重。其实在发布会,后面也显示了「智能批改作业」的功能,这就是一个很直观的商业落地场景。这块业务,他们在市场、渠道、产品、商业模式都走通过。现在只要用大模型的能力,把这些节点都重塑、改造。小步探索,慢慢试水,就容易搞出一条大模型的变现之路。有了商业的正反馈,技术发展也会得到保障,形成商业与研发的良性互动。

loading

一些新的点

除此之外,我还看到他们关于插件、RPA的一些演示。其实这些是针对大语言模型的技术尝试。我在之前的文章《》,就介绍了OpenAI的Gerg在TED演示的一些内测功能,就有插件的应用。比如6月份,他们还会集成浏览器插件,实现实时信息搜索,可以说讯飞应用层面,没有落后太多。

loading

挑战与风险

我注意到,在昨天的发布会上,刘庆峰在介绍大模型的能力之前,就先提出一个「评测体系」的概念。一方面是想当国内大模型的执牛耳者,成为标准的制定者。还有一个考量就是边界划定。这波AI热度无疑是里程碑式的,那它目的地在哪里?安全边界又怎么界定?

这其实是当下各国政府以及科学家最担心的问题,还不说远景的AGI发展与人类的关系的思考,就当下如何保证技术不被滥用,都是一个很大的课题。讯飞想接这个瓷器活,但也不一定拿得出「金刚钻」

loading

还有一个挑战,就是「算力」。我们大模型的训练和使用就是算力猛兽,每一次请求,都是数亿次的计算。据CNBC报道,ChatGPT一次训练需要200-1200美元,用了1万个英伟达的DGX A100 GPU服务器。这些高性能的GPU,就是机器学习和图形计算的AI心脏,而英伟达占据了95%有市场,之前传闻A100和H100 GPU都不卖给中国公司了。科大在22年9月被美国列入了「实体清单」,要获得这些高性能GPU更是难上加难。

巧妇难为无米之炊,谁不能忽视悬在中国公司头上的「达摩克利斯之剑」

再有一个就是对于「智能涌现」分歧,对于大语言模型的发展,实践其实是走在理论在前面。相关研究人员发现,在ChatGPT的训练语料中,中文不到1%,但是在实际的使用过程中,中文的能力并不会比英文低很多。是不是模型在海量语料学习中,掌握各种语言之间的通用规则,出现一种「智能涌现」的能力?这其实还没有定论。1750亿的参数,就是一个黑盒子。

在刘庆峰的发言稿中,我搜索了「智能/智慧涌现」高达14次。可以看得出他对这个能力的信息,这到底是科学地乐观主义,还是盲目冒进,抑或其他原因,不得而知。

loading

后话

在知乎上,有一个网友问讯飞大模型,Who is the President of the United States?「美国的总统是谁」,大模型回答,他的知识更新是2021年9月,后面的事情它不知道。

2021年9月是一个代表性的日期,ChatGPT和GPT-4他们的训练集知识断点也是这个时间。所以也有网友怀疑,它只是调用OpenAI的API。我自己试了下,怎么回答不会再出现那个「2021年9月」了。当然,这也说明不了什么。

loading

讯飞在发布上的所有示例,都是真人现场演示,我还是觉得他们是有底气的。对此,我保持谨慎而乐观!

📣通知

我的《小白玩转ChatGPT》小册上线啦,已有180多位同学在里面学习,诸多福利一起赠送。只需一杯奶茶钱,让我们联系更紧密。

image.png

推荐阅读: ChatGPT知识库

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/26927.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数学天才陶哲轩主持白宫生成式AI工作组,李飞飞、Hassabis发表演讲

夕小瑶科技说 分享 来源 | 新智元 最近,「数学天才」陶哲轩表示,自己将领导白宫生成式人工智能工作组,就当前AI评估并收集意见。在陶哲轩看来,加入工作流的ChatGPT在数学专业领域中,并没有太多增值。 近来&#xff0c…

陶哲轩宣布主持白宫生成式AI工作组!李飞飞、Hassabis发表演讲

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>【Transformer】微信技术交流群 转载自:新智元 | 编辑:编辑部 【导读】最近,「数学天才」陶哲轩表示,自己将领导白宫生成式人工…

2023 年 06 月编程语言排行榜,Python 还会保持第一吗?

(永久免费,扫码加入) TIOBE 2023 年 06 月份的编程语言排行榜已经公布,官方的标题是:Python 还会保持第一吗?(Will Python remain number 1?) 在过去的 5 年里,Python …

2022年AI顶级论文 —生成模型之年(中)

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 过去十年来,人工智能技术在持续提高和飞速发展,并不断冲击着人类的认知。 2012年,在ImageNet图像识别挑战赛中,一种神经网络模型(AlexNet&…

大模型battle?LLM排行榜出炉,清华竟位列第五!

【CSDN 编者按】自GPT爆火之后,当下流行的开源大型语言模型越来越多,LMSYS 组织(UC伯克利博士Lianmin Zheng牵头举办)建立了 Chatbot Arena 基准平台通过匿名随机竞争来评估他们,随后发布 Elo 等级排行榜,排…

手把手教你写个扫雷(插旗,及展开图解与实现)

学习了二维数组以后,不仅可以写个三子棋,我们也可以更近一步,来写个扫雷玩玩? 编写程序的时候,一定要先做好构思与大体思路步骤,扫雷的基本运行逻辑其实并不算非常复杂,我们只需要把每一步捋顺…

四步手把手教你实现扫雷游戏(c语言)

七步手把手教你实现扫雷游戏 c语言实现扫雷游戏一. 整体思路二. 设计棋盘以及初始化三. 埋雷四. 扫雷 c语言实现扫雷游戏 一. 整体思路 和上一篇文章的三子棋一样 第一步咱们创建三个工程文件 game.c 文件 用来实现游戏的函数定义 game.h 文件 用来声明函数以及需要的头文件 …

C/【扫雷】

**本文是用C语言写的扫雷小游戏———一个C语言前期寓教于乐的小游戏。 🌱博客主页:大寄一场. 🌱系列专栏:C语言学习笔记 😘博客制作不易欢迎各位👍点赞⭐收藏➕关注 目录 一.游戏菜单的创建 二.游戏实现…

扫雷游戏-C实现

扫雷游戏 纯C,运用数组,循环实现,基础巩固 注:本篇将重心放在思路以及核心步骤讲解,重要的不是将每一部分代码记下了,而是将核心思路和代码实现理解透彻。如果你对本篇一些内容跳转,细节表示茫然…

ChatGPT 速通手册——ChatGPT 的自我介绍

从 ChatGPT 的名字就可以看出,它的最核心功能就是 Chat(聊天)。那么,我们就以聊天的形式,开始本书的内容。 先让 ChatGPT 自己做一次自我介绍。既可以展现 ChatGPT 的产品使用形式,也可以快速了解 ChatGPT 的技术概念:…

VUE svg图标 报错

:咱前端用到svg的地方多了去了 这可得会 目录 下载安装 svg 配置config文件 在vue.config.js 创建icon文件夹,存放svg格式图片 icon/index.js 创建组件components ---> SvgIcon src/utils/validate.js 在main.js引入 下载安装 svg npm ins…

可以微调类ChatGPT模型啦!开源Alpaca-LoRA+RTX 4090就能搞定

源 | 机器之心 Alpaca-LoRA 将微调类 ChatGPT 模型的算力需求降到了消费级,训练个自己的中文对话模型真就没那么难了。 2023 年,聊天机器人领域似乎只剩下两个阵营:「OpenAI 的 ChatGPT」和「其他」。 ChatGPT 功能强大,但 OpenAI…

如何使用OpenAI fine-tuning(微调)训练属于自己专有的ChatGPT模型?

要使用OpenAI的微调技术来训练自己的专有模型,您需要遵循以下步骤: 获取和准备数据集:首先,您需要准备自己的数据集。可以使用公共数据集,也可以使用自己的数据集。数据集需要以特定格式(如JSONL)进行存储,并且需要经过清洗和预处理。 选择合适的模型和超参数:根据您…

一觉睡醒,ChatGPT 竟然被淘汰了?

转自机器之心 编辑:杜伟、陈萍 OpenAI 的 Andrej Karpathy 都大力宣传,认为 AutoGPT 是 prompt 工程的下一个前沿。 近日,AI 界貌似出现了一种新的趋势:自主人工智能。 这不是空穴来风,最近一个名为 AutoGPT 的研究开始…

ChatGPT实现stackoverflow 解释

stackoverflow 解释 ChatGPT 公开服务以来,程序员们无疑是最早深入体验和"测试"的一批人。出色的效果也引发了一系列知识产权上的争议。著名的 stackoverflow 网站,就宣布禁止用户使用 ChatGPT 生成的内容来回答问题,一经发现&…

ChatGPT疯狂生成「辣鸡」内容,Stack Overflow气急,连夜封杀!

时下爆火的ChatGPT,被网友们用来生成海量答案。而Stack Overflow已经不堪其扰,发起「追杀」:应封尽封! OpenAI的新模型ChatGPT才诞生没几天,已经成为广大网友的「装逼利器」。 它的回答不说正确不正确,乍一…

轻松掌握RecyclerView缓存机制

在 Android 应用程序中,RecyclerView 是一个非常重要的控件。它被广泛使用,因为它可以帮助我们展示大量的数据,同时也能够提供流畅的滑动体验。然而,如果我们不小心处理好 RecyclerView 的缓存机制,就可能会导致性能下…

chatgpt赋能python:Python内存管理:如何清理内存

Python内存管理:如何清理内存 Python作为一种高级编程语言,在各种应用领域都得到了广泛的应用。作为一种解释型语言,Python有着自动垃圾回收器的优点,但在长时间运行的应用程序中,Python可能会占用大量内存&#xff0…

[chat-GPT]解决OpenAI‘s services are not available in your country问题

OpenAI‘s services are not available in your country 按照网上的教程一步步配置chat-GPT,一直换不同国家的梯子也无济于事,各种搜索尝试,终于解决 解决方法 1.换浏览器 我换了firefox 一开始用的谷歌浏览器 2.清楚当前使用的浏览器所有…

最新版ui成语填空答题,成语接龙小程序源码,修复登录接口问题

这类的成语接龙填词游戏,之前我就见过朋友在玩,自带裂变属性,引流、广告效果都是一绝。强制分享广告,可拆随机金额红包,广告配置、激励配置等都在后台即可配置管理,无需翻改代码。朋友运营过的东西&#xf…