SSI用量子计算来玩AI

刚到家,早上说今天回来要写SSI为什么这么牛B,那就必须得写

SSI是什么公司?

Safe Super Intelligence

就是中间这个秃子的公司

Image

Image

ilya 前openAI 首席科学家(现在的mark chen确实有点水)

Daniel Gross、Ilya Sutskever、Daniel Levy(从左至右)

我们的blog不是玩人物传记,所以必须快速解释SSI为什么牛B,为什么什么产品都没发布,公司就不到10人就估值30B 美刀?

因为要拿量子计算做AI

没错,你没听错,而且现在已经开始了,只不过是GPU+QPU(量子计算单元混合部署的模式)

提到量子计算,大多数人想到的因式分解来暴力破译密码,要不就是拿量子态模拟化工生物啥的(因为世界是量子的,传统计算比如GPU要模拟一个真实的量子行为,比如CRP蛋白质反应,得老鼻子GPU了,可不是alapha fold那种预测能实现得难度,量子计算就很擅长这个)

但是其实量子计算也贼擅长矩阵计算,你们知道吗?

解释一下

手先:

比如你有3个bit位

|0/1|,|0/1|,|0/1|

这个大家都知道,给电压和没电压,让电路成不同得态,产生0/1bit,这就是传统计算机 (CPU/GPU)都一样

比如1.5V得一个 core,理想情况下 1.5V是1, 0 V就是逻辑0呗

但是实际操作上,比如你1.2也给你算1,这就是计算机得底层纠错能力,但是这玩意好纠错,有个误差就行,大差不差,所以传统计算算得就能用

但是量子就不一样了

比如你有3个Qbit位(量子bit位)

|0/01/1|,|0/01/1|,|0/01/1|

它可以同时存在0,1

这个01得玩意我们叫叠加态,数学公式如下

|ψ⟩ = α|0⟩ + β|1⟩

就比如你扔硬币,它属于一直再转得状态,说又是0,又是1让人不好理解,其实就是0到1得一个概率分布

测量塌缩: 当我们对量子比特进行测量时,叠加态会 塌缩 (collapse) 到其中一个基态,也就是 0 或 1。 测量结果是随机的,但概率由概率幅 α 和 β 决定。 就像硬币落地,旋转状态消失,变成明确的正面或反面。

叠加态的优势: 叠加态是量子计算强大能力的核心。 它可以让量子计算机同时处理 0 和 1 的所有可能性,从而实现并行计算,解决经典计算机难以解决的复杂问题。

另外量子bit又纠缠作用,说白了就能一起变

比如刚才这3个bit,可以表达为 000到111,也就是从0到7,8个数字,但是你从0到7,你要1个bit ,一个bit得变化,也就是要算8次

但是量子bit就折腾1次,这只是3个bit,如果更多呢?其实是个指数级别的算力降低

比如我们题目里面说的拿量子计算机做AI

AI其实目前玩的就是矩阵乘

比如一个BSH* HH,算力消耗就是BH^2S

最大头就是H,也就是模型的hidensize,现在一般要8192起吧?

如果要用2对数来算其实就是13

也就是用13个量子bit就可以表达8192这个hidensize

那你算算你模型就可以多小了,你消耗的算力和能量就会多小?

AGI的一个重要的实现部署能力就是低功耗!(人脑只有40瓦的灯泡耗电量的故事,我就不讲了)

有人说我草,态牛B了,那为什么不都用量子计算机呢?第一因为它的算法目前看就这几个比传统计算机有优势,就跟现在GPU不能完全替代CPU一样,QPU就是GPU和CPU的另外一个U,以后大家还是合作的工作的状态

另外刚才我讲了传统计算机有自己的控制误差底层纠错能力,但是Qbit就不太行,它的能量太小了,比如用超导的系统来做,一个量子Qbit就只有1个光子的能量而已,贼脆弱,特别容易收到环境干扰和内部误差的影响

而SSI的工作就是在缩小GPU集群的基础上旁边怼一个QPU集群,两个集群有高速通路,然后共同形成一个神经网络来进行训练(哪层受到量子错误的干扰会比较少,放在QPU合适呢?留个悬念大家自己想去)

所以SSI还啥也没弄出来呢,就能给到30B的估值

这个其实到不是太新的概念,以前就用quantum enhanced AI,不过没想到SSI真的开始实现了,ilya确实NB!

当然因为它叫safe吗?肯定也不只这一块,但是我主要对这块敢兴趣,光这个就值30B也并不过分,这要是成了,300B也是它

最后说一下MS前几天推出的量子芯片Majorana和google的Willow啥区别

Image

其实Willow是老方案就是超导,超导,量子态稳定,但是条件有点苛刻,可以说是按着既定路线走下去,媳妇熬成婆的案例(google现在创新真的越来越乏力),现在可以玩105个Qbit了

另外MS这个其实更惨,它的方案叫拓扑量子bit,其实都差点做成废案。。。

但是没想到真折腾出来了,它的特点是基于马约拉纳粒子(Majorana Zero Modes, MZMs)的拓扑超导体材料(砷化铟+铝),利用量子态的拓扑性质保护信息,理论上更稳定且错误率更低 ,错误率低原因是:

拓扑结构天然抗干扰,奇偶性存储信息减少环境噪声影响,逻辑量子比特寿命达毫秒级。

错误率中位数低于0.1%(单比特门0.035%,双比特门0.33%)

但是!

它只有8个qbit比起Willow来讲确实有点寒颤,但是它理论也是可以玩百万qbit的,而且尚未大规模验证纠错效率。就不知道以MS的心性能不能坚持到做出百万qbit那天

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22940.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【分布式数据一致性算法】Gossip协议详解

在分布式系统中,多个节点同时提供服务时,数据一致性是核心挑战。在多个节点中,若其中一个节点的数据发生了修改,其他节点的数据都要进行同步。 一种比较简单粗暴的方法就是 集中式发散消息,简单来说就是一个主节点同时…

文档检索服务平台

文档检索服务平台是基于Elasticsearch的全文检索,包含数据采集、数据清洗、数据转换、数据检索等模块。 项目地址:Github、国内Gitee 演示地址:http://silianpan.cn/gdss/ 以下是演示角色和账号(密码同账号)&#xf…

【YOLOv8】YOLOv8改进系列(2)----替换主干网络之FasterNet(CVPR 2023)

主页:HABUO🍁主页:HABUO 🍁YOLOv8入门改进专栏🍁 🍁如果再也不能见到你,祝你早安,午安,晚安🍁 【YOLOv8改进系列】: 【YOLOv8】YOLOv8结构解读…

Linux信号

目录 1. 信号的概念搞定(输出结论,支撑我们的理解) 补充知识 2.信号的产生 补充知识 3.信号的保存 4.阻塞信号 1. 信号其他相关常见概念 2. 在内核中的表示 3. sigset_t 4. 信号集操作函数 sigprocmask sigpending 5. 信号的…

NI Multisim仿真实现39计数器

功能需求 39进制计数器。 功能分析 (1)时钟信号产生电路:用555定时器产生时钟脉冲 2)计数器: 用两片74160先串接起来构成一个百进制计数器;再用置数法接成39进制计数器。(可用开关控制计数器…

DeepSeek R1/V3满血版——在线体验与API调用

前言:在人工智能的大模型发展进程中,每一次新模型的亮相都宛如一颗投入湖面的石子,激起层层波澜。如今,DeepSeek R1/V3 满血版强势登场,为大模型应用领域带来了全新的活力与变革。 本文不但介绍在线体验 DeepSeek R1/…

Android Binder机制

Binder是IPC(进程间通信)的一种机制,它允许不同的应用或系统服务在不同的进程中安全地交换数据。Binder的核心原理是基于客户端-服务器模型(C/S架构)。 一、Binder的定义 1. Binder是Android中的一个类,它继承了IBind…

医疗AI领域中GPU集群训练的关键技术与实践经验探究(上)

医疗AI领域中GPU集群训练的关键技术与实践经验探究(上) 一、引言 1.1 研究背景与意义 在科技飞速发展的当下,医疗 AI 作为人工智能技术与医疗领域深度融合的产物,正引领着医疗行业的深刻变革。近年来,医疗 AI 在疾病诊断、药物研发、健康管理等诸多方面取得了显著进展,…

MariaDB 历史版本下载地址 —— 筑梦之路

MariaDB 官方yum源里面只有目前在维护的版本,而有时候对于老项目来说还是需要老版本的rpm包,国内很多镜像站都是同步的官方仓库,因此下载老版本也不好找,这里主要记录下从哪里可以下载到历史版本的MariaDB rpm包。 1. 官方归档网…

特辣的海藻!2

基础知识点 整型数字-->字符数字 方法一:使用Character.forDigit()方法 Character.forDigit(int num, int radix) 该方法可以将整型数字转换为对应的字符形式。radix表示进制 Tips: ● 需要转换的整型数字必须在 0 到 radix-1 的范围内,…

RoCEv2 高性能传输协议与 Lossless 无损网络

目录 文章目录 目录RoCERoCEv2 协议栈RoCEv2 需要 Lossless NetworkLossless Network 拥塞控制技术网络拥塞的原因PFC 基于优先级的流量控制PFC Deadlock(死锁)的问题PFC Storm(风暴)的问题ECN 显式拥塞通知拥塞控制ECN 拥塞控制滞…

win10把c盘docker虚拟硬盘映射迁移到别的磁盘

c盘空间本身就比较小、如果安装了docker服务后,安装的时候没选择其他硬盘,虚拟磁盘也在c盘会占用很大的空间,像我的就三十多个G,把它迁移到其他磁盘一下子节约几十G 1、先输入下面命令查看 docker 状态 wsl -l -v 2、如果没有停止…

论文笔记:Autonomy-of-Experts Model

202501 arxiv 1 intro MoE中常被忽视的一个关键问题是路由器的决策过程与专家执行之间的分离 路由器无法直接评估专家的能力,因此它对专家的选择基本上是没有标签的预测如果路由器做出了错误的预测,选择的专家可能会试图处理这些令牌,但未能…

deepseek 清华大学[1-5版]全集

1、文件概览 1、清华大学《DeepSeek:从入门到精通》 2、清华大学《Deepseek如何赋能职场应用?》 3、清华大学《普通人如何抓住DeepSeek红利》 4、清华大学《DeepSeekDeepResearch让科研像聊天一样简单》 5、清华大学《DeepSeek与AI幻觉》 6、天津大学《深度解读Deepseek:原理…

【Git 学习笔记_27】DIY 实战篇:利用 DeepSeek 实现 GitHub 的 GPG 秘钥创建与配置

文章目录 1 前言2 准备工作3 具体配置过程3.1. 本地生成 GPG 密钥3.2. 导出 GPG 密钥3.3. 将密钥配置到 Git 中3.4. 测试提交 4 问题排查记录5 小结与复盘 1 前言 昨天在更新我的第二个 Vim 专栏《Mastering Vim (2nd Ed.)》时遇到一个经典的 Git 操作问题:如何在 …

H5 火柴人科目三和GitHub获取仓库点星星的用户列表发生了艺术的碰撞

先看效果,代码写的比较乱,有待优化 效果 https://linyisonger.github.io/H5.Examples/?name./089.%E7%9C%8B%E6%98%9F%E6%98%9F%E7%9A%84%E8%88%9E%E8%80%85.html 思路 看起来很简单,实则也不是很难,就是需要思路要打开。 一…

阿里云k8s服务部署操作一指禅

文章目录 DockerFile镜像操作阿里云k8s服务部署 DockerFile # 使用 JDK 17 官方镜像 # linux架构:FROM --platformlinux/amd64 openjdk:17-jdk-slim # arm架构:openjdk:17-jdk-slim FROM --platformlinux/amd64 openjdk:17-jdk-slim# 设置工作目录 WORK…

【算法】游艇租贷

问题 ⻓江游艇俱乐部在⻓江上设置了 n 个游艇租聘站&#xff0c;游客可以在这些租聘站租 ⽤游艇&#xff0c;然后在下游的任何⼀个租聘站归还。游艇出租站 i 到 j 的租⾦为 r(i, j)&#xff0c;1 ≤i< j≤n&#xff0c;设计⼀个算法&#xff0c;计算从出租站 i 到 j 所需的…

AnythingLLM安装包下载+CUDA安装包下载地址,提升GPU性能【语义熔炉网】

一、安装包下载地址 1. AnythingLLM安装包 &#xff08;支持Windows/macOS/Linux&#xff0c;部分用户反馈需科学上网&#xff09;国内镜像备份&#xff08;含DeepSeek相关工具&#xff09;&#xff1a;www.mix688.com/118.html 2. CUDA安装包 国内镜像&#xff08;若官网访…

【大模型】蓝耘智算平台部署DeepSeek-R1大模型使用详解

目录 一、前言 二、蓝耘智算平台介绍 2.1 蓝耘智算平台是什么 2.2 平台优势 2.3 应用场景 2.4 对DeepSeek 的支持 2.4.1 DeepSeek 简介 2.4.2 DeepSeek 优势 三、蓝耘智算平台部署DeepSeek-R1操作过程 3.1 注册账号 3.1.1 余额检查 3.2 部署DeepSeek-R1 3.2.1 获取…