我们距离AGI还有多远?

关于HBM那份纪要的其他反馈

上篇文章发了一篇HBM纪要小部分内容(星球更新了另一部分),收到很多业内大佬们的反馈,包括颗粒计算、封装订单划分等等,以及是不是某通某电的一个专家。其中倒是出现一个非共识的说法,引用下:

“XX现在其实还做不出,或者说技术还落后,技术底子还是差了点。反而另一家YY的HBM和DRAM进展不错在one厂完成了小规模量产,third期除了GKJ其他可以实现100%国产。两家给了国产几大设备厂大量研发攻坚任务,尤其是TSV高深宽比和孔内镀膜,技术难度和价值量最大。”

某家Broker sales评论美股

2月份的科技资金流入由PANW和NVDA引领,这两家公司成为我们客户当月买入最多的单一股票。此外,在被动投资科技方面非常活跃,因为QQQ达到了多年来的月度流入高点,我们客户的流入量也达到2021年9月以来最高。M7继续带领标普500的上涨是否可持续?在2023年的前三个季度,SPX的上涨(+11.7%)中94%来自M7的推动(+11.0%),这意味着剩下的493只股票基本每涨。但自2023年10月以来,M7的贡献下降到了35%,M7上涨了25.3%,为SPX的反弹贡献了6.4%,而剩下的493只股票上涨了16.1%,为SPX的反弹贡献了12.0%。从产业角度,现在可能是AI行情的初期,可以想想1990年代初的早期互联网时代、以及1990年代末的dot.com时代,每个阶段都持续了多年。实际上,围绕M7的乐观情绪有助于改善整体市场情绪,就比如最近的上涨已经扩大到M7之外的科技股。从资金看,美国共同基金在2月转为流入,SPX前50股票在2月至今的每一天都是positive call skew,意味着个人投资者的乐观情绪,在为看涨期权支付溢价。此外个人投资者在16个月连续卖出之后1月转为买入,2月继续呈现买入,且他们自2022年5月以来的95周中有93周都在积累现金,总计9660亿美元,如果利率开始下降,有很大的空间将资金转移到股票。但另一方面,不确定来自FOMC 3月20日的下一次会议。

MS拍的世芯Alchip的收入拆分

说实话,如果你去考古比如2010年前Wallstreet对谷歌meta apple之类的预测模型,和今天实际对比下,会发现错得离谱,为啥,线性预测,你我本能的思维方式,但大家也知道,事物的发展一定是非线性的。因此你说AWS给500、750、然后到25年可能的确小年放个800,再然后呢?从scaling law本身指数型算力需求+推理占比提升+自制需求提升+未来某一天cowos放量,我不太买账这种线性外推拍出来的数(虽然我心里也没个准...),但隐约感觉大方向是继续上调。何况你也不知道有什么新增客户后面会冒出来,这些都不可预测。有时候得接受预测的无能...

戴尔电话会透露英伟达B200

戴尔CFO替英伟达“非官方”披露了B200发布时间为2025年(如下图)。按照H100和H200的时间差也差不多(H100 是22年GTC H200是 23年11月)这也不算什么惊喜,市场对B200也有预期,只不过这是第一次被产业链公司公开提及。另一个重点是提到B200功耗会在1000W以上(H100是700W),且CFO来了句“你真的不需要直接液冷来达到这种能量密度”。Tom' Hardware刚刚发了文章对此做了分析,按照散热的普遍系数,芯片面积的散热通常最高约为每平方毫米 1W,而B系列双芯片设计,面积妥妥上1500平方毫米了,因为3nm,可能再打个折,1000W-1500W之间。但按照CFO下面的话,直接浸润式液冷也不是必须,综合考虑前后成本投入和技术成熟度,估计B系列上冷板、风冷也还会持续一段时间虽然一定是未来,但也需要给产业点时间。另一位大佬说B100会降频控在700W。

退一步看目前的市场,现在叙事的确朝着马斯克之前的暴论方向走,“现在是算力紧缺,未来是电力紧缺(PUE)”,step down transformer、cooling、IDC租赁、存储、甚至可能蔓延到IDC相关的各种基础设施。也就是Gavin Baker说的,“相比于软件,更多对AI的追逐转向了Power、utility、industrials等等”  2月份软件指数+2%,而SOX+15%(from F姐)。

Altimeter Jamin Ball 谈软件复苏

第四季度的ARR净新增创新高,从一些已经发报的公司earning上得到了验证,开始看到宏观逆风的减弱。从业绩和股价反应来看,FOMO的情绪在Software一点不比semi和hardware差,除了业绩miss太多的(SNOW),以及突然来个惊吓的(PANW)...但你看PANW之后修复,所以你说SNOW会怎么走?

关于推理芯片的一篇长文,提炼下干货:

OpenAI把复杂精细的算法管理变成了Self Attention这种简单算法+硬件暴力堆料的方式搞成了,直接O(n^2)的方式算上下文关联度就完事儿了,于是实现AGI的问题很大一部分简化成了芯片和系统设计的Scaling问题了,而芯片行业恰恰是人类所有工业体系里面Scaling技能点最牛逼的,等上下文长度Scaling起来又能把AGI涌现到什么程度我都不敢想。

注:1.解释了芯片在这次AGI淘金中的价值;2. 部分解释了为什么说scaling law可以通往AGI

未来长远来看,MOE和KV稀疏化是加速AGI Scaling从算法层面最有效的途径,其实也是从粗放式逐渐过渡到精细化管理静态和动态权重,从而可以创造在芯片Scaling基础上进一步更快加速超长上下文和超大模型的低成本Scaling,而对于硬件的容量需求会进一步扩大,同时随着稀疏化程度提高,使得Memory Hierarchy可能重新变得在系统层级更有意义

今天的Infra层面还远没有演进到对硬件系统如此高效的程度,多模态进一步加剧复杂程度。不同模态的流量潮汐、计算特点以及计算、内存、带宽资源占用情况,都会进一步加剧整个系统对于弹性的需求。

实际上LLM的推理对Infra层面的调度设计的复杂性压根不在transformer本身,而是在“大”模型产生的各自带宽流量问题,精细化利用高速内存和带宽资源催生的潜在的算子需求也已经开始爆炸,甚至复杂度是远高于原先的朴素算子的。这些算子和调度分别是在微观层面和宏观层面对硬件资源的极致利用,在今天这种对算力、带宽、容量、互联需求全都拉爆的应用上,这种极致利用会变得更加重要。而这些复杂的软件系统对LLM系统的设计增加了巨大的难度和工作量,似乎给所有NVidia的竞争者设置一层层障碍

所以实际上NVidia对大模型推理这种对算力、内存容量、内存带宽、互联带宽、IO带宽、灵活性、可编程性都提出了极其变态的需求的场景应对方案就是在这些维度都做到第一,以一种统一的芯片形态保证了在综合维度的竞争力,当然这也是NVidia对于所有场景的统一策略,这个策略当然没错,NVidia今天大力提升显存带宽也是为了绞杀AMD在这两个维度的短期优势。

Alex Irpan的《我们距离AGI还有多远?》 from拾象

越来越多证据表明,即使仅通过计算规模增加和使用正确数据集,也能把不成熟的技术原型转化为成熟的产品。我现在完全信仰计算的力量,并且认为要想实现AGI,计算的占比是80%,剩下20%是理论创新。

如果模型不会陷入自我复制的循环,模型进步最终将不再取决于人类的智力努力,而是取决于投入到系统中的FLOPs计算资源的数量。即使合成标签(synthetic labels)比真实标签准确度更差,但它的成本也低,能大量用于模型训练。我认为未来合成数据和模型自我监督都会投入使用,到时的场景也许是这样:人类的直接反馈仅仅被用来引导或初始化奖励模型,或者对已有的数据进行合理性检查,而不是直接被用来训练模型。其他一切都将由模型自主生成和自我监督,然后不断反馈,不再依赖于人类直接的指导或监督。

在AI领域,模型永远无法完全实现人们的所有预期,但模型的能力却在持续扩展,而且从不倒退。今天的AI技术水平将会是未来几年的低点,因为AI还会继续进化。即使所有VC都失败,LLM不再流行,我们依然拥有了目前已经训练好的模型和衍生出的思想。技术的发展是不可逆转的,我们都应该好好思考这一点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/269754.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

植树节活动如何联系媒体投稿宣传?

植树节活动联系媒体投稿宣传的步骤如下: 明确宣传目标与内容: 确定植树节活动的核心宣传信息,如活动目的、意义、时间、地点、参与方式等。 准备相关的图片、视频或宣传册等素材,以便媒体能够更好地理解和传播活动信息。 选择适合的媒体渠道: 根据目标受众和宣传目的,选择适…

什么是jwt

jwt是JSON Web Token,由3部分构成: 头部Header:头部包含了两部分,token 类型和采用的加密算法(可为none,后端应限制加密算法,不以这里为准)。 载荷Payload:这部分才是重要…

UD效果广告

1.定义 全称Unidesk,是由阿里旗下大数据运营平台“阿里妈妈”推出的数字营销引流平台。UD投放将其他媒体的流量通过相关的广告创意导入到天猫店铺。 2.UD投放优化技巧 (1)不起量排查: 可以从账户问题、计划数量不足、计划设置…

一台服务器,最大支持的TCP连接数是多少?

一个服务端进程最大能支持多少条 TCP 连接? 一台服务器最大能支持多少条 TCP 连接? 一、原理 TCP 四元组的信息:源IP、源端口、目标IP、目标端口。 一个服务端进程最大能支持的 TCP 连接个数的计算公式:最大tcp连接数客户端的IP…

Jmeter函数助手函数--计数器详解

函数 作用 ${__counter(,)} 计数器,每次加1 ${__dateTimeConvert(,,,)} 时间格式转换 ${__intSum(,,)} 整数相加 ${__P(,)} 获取属性 ${__setProperty(,,)} 设置属性 ${__Random(,,)} 随机数 ${__threadNum} 线程编号 ${__time(,)} 获取当前时间戳…

【博图TIA-Api】通过Excel自动新建文件夹和导入FB块

【博图TIA-Api】通过Excel自动新建文件夹和导入FB块 说明思路准备获取Excel表格内文件名和FB块名等信息新建文件夹部分筛分获取的文件夹数据,去掉重复内容创建文件夹 导入FB块导出FB块的xml文件查找需要放置的文件夹导入块 说明 续上一篇文章,这次是根据…

广东有哪些媒体资源?如何邀请媒体报道

传媒如春雨,润物细无声,大家好,我是51媒体网胡老师。 广东拥有丰富的媒体资源,包括电视台、广播电台、报纸、网络媒体等。以下是一些广东地区的媒体资源: 广东有哪些媒体资源?如何邀请媒体报道 电视台&…

信钰证券|飞行汽车概念走势活跃,金盾股份“20cm”涨停

飞翔汽车概念5日盘中走势活泼,到发稿,金盾股份“20cm”涨停,万丰奥威涨超6%,光洋股份涨逾5%,商络电子、星源卓镁涨近4%。 金盾股份强势涨停,公司近来在出资者互动渠道表示,公司和清华大学联合研…

鸿蒙Harmony应用开发—ArkTS声明式开发(通用属性:文本通用)

文本通用属性目前只针对包含文本元素的组件,设置文本样式。 说明: 从API Version 7开始支持。后续版本如有新增内容,则采用上角标单独标记该内容的起始版本。 属性 名称参数类型描述fontColorResourceColor设置字体颜色。 从API version 9开…

day12_SpringCloud(Gateway,Nacos配置中心,Sentinel组件)

文章目录 1 Gateway组件1.1 Gateway简介1.2 Gateway入门1.3 网关路由流程图1.4 路由工厂1.5 过滤器1.5.1 过滤器简介1.5.2 内置过滤器1.5.3 路由过滤器1.5.4 默认过滤器1.5.5 全局过滤器1.5.6 过滤器执行顺序 2 Nacos配置中心2.1 统一配置管理2.2 Nacos入门2.2.1 Nacos中添加配…

Nodejs 第四十九章(lua)

lua Lua是一种轻量级、高效、可嵌入的脚本语言,最初由巴西里约热内卢天主教大学(Pontifical Catholic University of Rio de Janeiro)的一个小团队开发而成。它的名字"Lua"在葡萄牙语中意为"月亮",寓意着Lua…

文件操作与IO(3) 文件内容的读写——数据流

目录 一、流的概念 二、字节流代码演示 1、InputStream read方法 第一个没有参数的版本: 第二个带有byte数组的版本: 第三个版本 搭配Scanner的使用 2、OutputStream write方法 第一个版本: 第二个写入整个数组版本: …

Unity使用UnityWebRequest读取音频长度不对的解决方法

在开发的过程中碰到这样一个问题,有的音频文件通过UnityWebRequest读取出来后,AudioClip的Length会不对,比如本身有7秒,读出来只有3秒。代码如下: IEnumerator TestEnumerator() {UnityWebRequest www UnityWebReque…

linux kernel物理内存概述(五)

目录 概述 一、快速路径分配 1、get_page_from_freelist 2、rmqueue()函数 二、慢速路径分配 1、分配流程 三、direct_compact 概述 物理内存分配步骤 1、初始化,参数初始化 2、内存充足,快速分配 get_page_from_freelist 3、内存压力大,慢速…

Android 拍照本地图片选择框架适配

前言 通常技术方案的选择、会带来后续一些不可控的东西,这也是没法避免的,程序开发者中同时面对、测试、领导、产品各种要求。同时在网络上查找的资料也只是很旧的,不一定适合新设备,需要推倒重新弄 1、解决方案通过意图选择器做…

后端项目访问不了

问题: 后端启动不了,无法访问网站 原因: 1.防火墙没有关 2.有缓存 3、项目没有启动 4、docker没有启动 解决: 先查看进程:docker ps,必须有三个 详细查看:docker ps -a exited代表没有开启…

Java 简单模拟银行存取钱

模拟银行存取钱 一、实验任务 在银行办理业务时,通常银行会开多个窗口,客户排队等候,窗口办理完业务,会呼叫下一个用户办理业务。本实验要求编写一个程序模拟银行存取钱业务办理。假如有两个用户在存取钱,两个用户分别…

Zynq—AD9238数据采集DDR3缓存千兆以太网发送实验(二)

Zynq—AD9238数据采集DDR3缓存千兆以太网发送实验(前导) Zynq—AD9238数据采集DDR3缓存千兆以太网发送实验(一) Zynq—AD9238数据采集DDR3缓存千兆以太网发送实验(三) 五、实验目的 本次实验使用电脑上的…

分析开源机器学习框架TensorFlow

TensorFlow是一个开源的机器学习框架,由Google开发和维护。它提供了一个灵活的编程环境,可用于构建和训练各种机器学习模型。TensorFlow的基本概念和使用场景如下: 张量(Tensor):在TensorFlow中&#xff0c…

Unity引擎关于APP后台下载支持的实现问题

1)Unity引擎关于APP后台下载支持的实现问题 2)Prefab对DLL中脚本的引用丢失 3)Unity DOTS资源加载问题 4)UnitySendMessage和_MultiplyMatrixArrayWithBase4x4_NEON调用导致崩溃 这是第376篇UWA技术知识分享的推送,精选…