大模型预测,下一个token何必是文字?

明敏 金磊 发自 凹非寺
量子位 | 公众号 QbitAI

太快了太快了…

大模型的生成技能,已经到了普通人看不懂的境界!

它可以根据用户过去5年的体检报告,生成未来第1年、第2年、第3年的体检报告。

你看,这个生成的过程,是不是像极了ChatGPT,根据历史单词预测下一个单词。

图片

它能查看过去7天机组子部件的运行情况,生成未来3天每小时的子部件报告 。

图片

还能基于历史水文数据和未来7天气象数据,生成未来第1天、第2天……至第7天的每小时降水分析报告,包括详细降水量、降水分布。

图片

如今,大模型的生成内容,早已不只是文字/图像/视频了

如上生成的这些报告分析涉及诸多专业知识,普通人很难基于自己的知识储备评价其合理性和正确性。

最多只能评价一句:不明觉厉!

怎么说呢?“AI似乎正在生成一切”。

LLM+行业数据,路走错了?

简单理解大模型,就是Predict the Next “X”。ChatGPT是Predict the Next “Word”。

但行业需要的往往不是预测下一个字。

比如对于慢性病患者的健康管理规划,它需要基于一系列生理指标数据,从医学角度进行数据预测。举个不恰当的例子,这更像是用数学方法解题。

如果在大语言模型基础上投喂大量专业的医学语料,更像是用语文方法读题。尽管能理解相关的术语和指标,可是给出的预测结果大概率不准确。因为问题本身超出了“语言”范畴,不能用语文方法求解

如果“X“的模态从“文字Word”变成了“体检报告”,模型则可以根据历史体检报告数据去预测下一个体检报告,这才是一个健康管理大模型。

图片

它的逻辑更像是“种瓜得瓜、种豆得豆”。即输入“X”、输出“X”。

这里的“X”可能包含水文数据、健康报告、设备监测数值、设计推演等不同样式的专业数据。

它能基于音乐厅的几何模型和房间数据,从声源发射5000Hz频率射线,生成射线分布图,找到听觉最佳的音源摆放位置。

图片

如何预测“X”?

所以,这些能预测下一个X的行业大模型,如何构建出来?

通过刚刚发布的先知AIOS 5.0。其核心特点是基于各行各业场景的X模态数据,构建行业基座大模型。

解决了当前行业大模型只能将行业文本数据喂给大语言模型、生成下一个字的问题,让大模型能来到的领域更加广泛。

图片

先知是AI公司第四范式的核心产品。2015年,先知AIOS 1.0版本首次发布,通过高维、实时、自学习框架提升模型精度;2017年,先知AIOS 2.0版本利用自动建模工具HyperCycle,降低模型开发门槛;2020年发布的先知AIOS 3.0版本规范AI数据治理和上线投产;2022年,先知AIOS 4.0版本引入北极星指标,更大化发挥AI应用价值。

AIOS 5.0版本则从生成式AI+行业这一角度出发,给行业大模型提出了一种新思路。

而在公认的大模型应用落地元年里,行业大模型的发展和影响一定是此前的数倍。这种更具规模化的动向,由此也形成了AIGC趋势的下一个范式。

One More Thing:AIGC迈向新范式?

从图片、文字、视频,再到健康、水利……我们不难看出AIGC现在正以迅猛的速度朝着AI生成一切的方向飞奔。

通常来说,一切事物的发展似乎都需要一些范式来推动,而且不是新范式取代旧范式,而是它们之间互补使其更加深入和全面。

正如科学研究中的四种范式一般,即实验归纳、理论推演、计算机仿真和数据密集型科学发现,它们相互补充,共同推动了科学研究的进步。

那么若是以这种逻辑来看待AIGC,似乎类似的四种范式也已经开始出现。

AIGC的第一范式以文本生成为核心,通过智能客服、内容续写等应用,展示了AI在理解和生成自然语言方面的能力。这一阶段的AIGC技术,为后续的发展奠定了基础,使得机器能够与人类进行有效的交流和互动。

AIGC的第二范式将应用领域扩展到了图像生成

如生成对抗网络(GAN)、变分自编码器(VAE)等,可以学习从随机噪声生成逼真图像的映射。并能将输出结果用于艺术创作、图像增强、虚拟场景生成等领域。这一范式进一步展现了AI的想象力。

AIGC的第三范式则是聚焦在了视频生成,例如Gen2,例如Sora。

视频生成一定程度上反映了AI对于世界的理解。从Sora诞生以来,能否理解世界?是否是世界模拟器的说法一直争论不休。因为如果确定Sora可以理解世界,将意味着AGI大门正式开启。

图片

而AIGC的第四范式,就是以行业为主,技术将全面渗透到各个行业之中。

这一阶段的核心任务是将AI技术与行业知识深度融合。今年作为大模型应用落地的元年,我们看到AIGC技术开始在医疗、教育、金融等关键领域发挥重要作用。

具体怎么做才能更快推进AIGC扎入行业?各路玩家都还在不断尝试中。以大语言模型为底座?还是直接训练行业大模型?不同路线都有各自的底层逻辑,谁的路线更能跑通,还言之过早。

但可以确定的是——

在AI生成一切的进程中,那些能够率先利用AI技术的个人和行业,将能够更早地享受到技术带来的红利。他们将有机会引领行业变革,塑造未来的社会和经济格局。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/293701.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Mybatis-Plus分页查询时碰到`total`有值但`records`为空

个人原因:Mybatis-Plus分页插件设置了maxLimit单页条数 // 分页插件配置 PaginationInnerInterceptor paginationInnerInterceptor new PaginationInnerInterceptor(DbType.MYSQL); paginationInnerInterceptor.setMaxLimit(200L); // 单页分页条数限制(默认无限…

webpack项目打包console git分支、打包时间等信息 exec

相关链接 MDN toLocaleString child_process Node.js strftime 格式 代码 buildinfo.js const { execSync, exec } require("child_process"); // exec: 在 Windows 执行 bat 和 cmd 脚本// execSync 同步 // exec 异步// exec 使用方法 // exec(git show -s,…

Python基础之Class类的定义、继承、多态

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一、class类1.类属性操作(增删改)2.类方法操作 二、类的继承1、语法2、方法重写 二、类的多态 一、class类 、三部分组成 1、类名&#xff…

黑马HTMLCSS基础

黑马的笔记和资料都是提供好了的,这个文档非常适合回顾复习。我在黑马提供的笔记上做了一些微不足道的补充,以便自己复习查阅。该笔记比较重要的部分是 表单,http请求 第一章. HTML 与 CSS HTML 是什么:即 HyperText Markup lan…

使用Pilotfish扩展Sui执行能力

Pilotfish第一个多机智能合约执行引擎,使Sui网络的验证节点可以利用多台机器,并在负载增加时自动扩展以执行更多的交易。这一目标实现不会影响可靠性或功能完整性。 Pilotfish可以从内部执行机器的故障中恢复,并支持Sui的全面动态操作。其流…

分享react+three.js展示温湿度采集终端

前言 气象站将采集到的相关气象数据通过GPRS/3G/4G无线网络发送到气象站监测中心,摆脱了地理空间的限制。 前端:气象站主机将采集好的气象数据存储到本地,通过RS485等线路与GPRS/3G/4G无线设备相连。 通信:GPRS/3G/4G无线设备通…

计算机网络链路层

数据链路 链路是从一个节点到相邻节点之间的物理线路(有线或无线) 数据链路是指把实现协议的软件和硬件加到对应链路上。帧是点对点信道的数据链路层的协议数据单元。 点对点信道 通信的主要步骤: 节点a的数据链路层将网络层交下来的包添…

Dockerfile和Docker-compose

一、概述 Dockerfile和Docker Compose是用于构建和管理 Docker 容器的两个工具,但它们的作用和使用方式不同。 Dockerfile Dockerfile 是一个文本文件,用于定义 Docker 镜像的构建规则。它包含一系列指令,如 FROM(指定基础镜像…

【蓝桥杯第十三届省赛B组】(详解)

九进制转十进制 #include <iostream> #include<math.h> using namespace std; int main() {cout << 2*pow(9,3)0*pow(9,2)2*pow(9,1)2*pow(9,0) << endl;return 0; }顺子日期 #include <iostream> using namespace std; int main() {// 请在此…

安全SCDN的威胁情报库对DDOS防护有什么好处

目前网络攻击事件频频发生&#xff0c;DDoS&#xff08;分布式拒绝服务&#xff09;攻击已成为各种企业&#xff08;小到区域性小公司大到各种跨国公司&#xff09;的主要威胁&#xff0c;DDoS 攻击可能会对企业造成重大损害和破坏&#xff0c;比如对目标公司的业务造成产生不利…

吴晓波频道:构建知识付费领域的数据飞轮

更多技术交流、求职机会&#xff0c;欢迎关注字节跳动数据平台微信公众号&#xff0c;回复【1】进入官方交流群 知识付费正在完成新阶段的转变。 知识付费的概念可以追溯到 20 世纪 80 年代的彼得德鲁克&#xff0c;他在《后资本主义》一书中提出“知识经济”&#xff0c;指出…

IDEA跑Java后端项目提示内存溢出

要设置几个地方&#xff0c;都试一下吧&#xff1a; 1、默认是700&#xff0c;我们设置大一点&#xff08;上次配置了这儿就解决了&#xff09; 2、 3、 4、-Xmx4g

redolog 和 binlog 的区别以及两阶段提交

最近在学习MySQL架构的时候&#xff0c;关于执行器&#xff0c;存储引擎的具体操作那里&#xff0c;有些地方不是很懂&#xff0c;我仔细思考了一下&#xff0c;发现我对两阶段提交这个过程比较模糊&#xff0c;所以我特意写一篇文章来说一下两阶段提交。 比如说一条更新语句&…

接口自动化框架搭建(九):接入钉钉消息通知

1&#xff0c;jenkins安装钉钉插件 2&#xff0c;在钉钉群聊设置机器人 3&#xff0c;jenkins配置钉钉 根据情况选择&#xff1a; 除了这些&#xff0c;其他不用配置&#xff0c;配置完成点击确认 4&#xff0c;项目配置 添加后保存 5&#xff0c;测试下效果 构建完成后&a…

免费开源的 AI 绘图工具 ImgPilot

免费开源的 AI 绘图工具 ImgPilot 分类 开源分享 项目名: ImgPilot -- 通过提示词及涂鸦生成图片 Github 开源地址&#xff1a; GitHub - leptonai/imgpilot: Turn the draft into amazing artwork with the power of Real-Time Latent Consistency Model 在线地址&#xff…

Go语言学习Day6:数组与切片

名人说&#xff1a;莫愁千里路&#xff0c;自有到来风。 ——钱珝 创作者&#xff1a;Code_流苏(CSDN)&#xff08;一个喜欢古诗词和编程的Coder&#x1f60a;&#xff09; 目录 1. 数组① 什么是数组② 数组的声明③ 初始化数组的几种方式④ 遍历数组元素⑤ 数组为值类型⑥ 数…

Excel 粘贴回筛选后的单元格不能完全粘老是少数据 ,有些单元格还是空的

环境&#xff1a; excel2021 Win10专业版 问题描述&#xff1a; excel 粘贴回筛选后的单元格不能完全粘老是少数据 有些单元格还是空的 复制选择筛选后A1-A10单元格 &#xff0c;定位条件&#xff09;&#xff08;仅可见单元格&#xff09;来访问&#xff0c;或者你可以使用…

牛角工具箱源码 轻松打造个性化在线工具箱

&#x1f389; Whats this&#xff1f; 这是一款在线工具箱程序&#xff0c;您可以通过安装扩展增强她的功能 通过插件模板的功能&#xff0c;您也可以把她当做网页导航来使用~ 觉得该项目不错的可以给个Star~ &#x1f63a; 演示地址 https://tool.aoaostar.com &#x1f…

MySQL 高级语句(一)

一、MySQL查询 1.1 排序 1.1.1 排序语法 1.1.2 order by案例 1.2 区间判断及查询不重复记录 1.2.1 区间判断 1.2.2 查询不重复记录 1.3 对结果进行分组 1.3.1 group by 语法 1.3.2 group by 案例 1.4 限制结果条目 1.4.1 LIMIT 语法 1.4.2 LIMIT 案例 1.5 设置别名…

分治——归并排序算法

例题一 解法&#xff08;归并排序&#xff09;&#xff1a; 算法思路&#xff1a; 归并排序的流程充分的体现了「分⽽治之」的思想&#xff0c;⼤体过程分为两步&#xff1a; ◦ 分&#xff1a;将数组⼀分为⼆为两部分&#xff0c;⼀直分解到数组的⻓度为 1 &#xff0c;使…