苹果智能和人工智能最大化

苹果智能和人工智能最大化

除了苹果公司,还没有人真正使用过苹果的智能功能。它要到秋天才会分阶段发布,即使到那时,它也无法在80%或90%的iPhone安装基础上运行,因为它需要只有iPhone 15 Pro才能使用的设备上处理功能。没有什么能像演示一样好(除了最初的iPhone),苹果可能会再次搞砸开发者的激励措施,而这一切可能并不像看起来那么好。我们会找到答案的。

但与此同时,如果你从演示和截图中退后一步,看看苹果真正想做的是什么,你会发现苹果指出了生成式人工智能中的大多数关键问题和杠杆点,并提出了一个与所有炒作和宣传截然不同的理论。

“AI Maximalist”的观点是,具有多模式和“多代理”能力的通用聊天机器人将能够接管各种复杂的多阶段任务和问题,这些任务和问题目前需要许多不同的专门编写的软件,并且还能够在一个单一的通用界面中自动完成以前无法在软件中完成的全新复杂任务。聊天机器人可能会用“软件已死”的提示取代所有的软件。正如我在这里所写的,我对此持怀疑态度,但苹果提出了相反的观点:生成式人工智能是一种技术,而不是一种产品。

我认为,苹果是在传递一种观点,即生成式人工智能和ChatGPT本身是一种大宗商品技术,在以下情况下最有用:

嵌入到一个系统中,提供关于用户的更广泛的上下文(可能是搜索、社交、设备操作系统或垂直应用程序)

分解成单独的功能(同上),这些功能本质上更容易作为小型节能模型在边缘的小型节能设备上运行(由用户支付,而不是您的资本支出预算)——这也很好,因为……

如果每次用户按下“OK”时我们都有边际成本,而且我们需要一群新的核电站来为所有这些提供动力,那么这些东西永远不会适用于大众市场。

首先,苹果已经建立了一个没有聊天机器人的LLM。苹果已经建立了自己的基础模型,(在它发布的基准测试中)可以与市场上的任何其他模型相媲美,但是你无法将原始提示直接插入模型并获得原始输出-总是有一组按钮和选项来塑造你的要求,并且它们以不同的方式呈现给用户不同的功能。在大多数这些功能中,根本没有可见的bot。你不会问一个问题然后得到回复:相反,你的邮件会被优先处理,或者你按下“摘要”,摘要就会出现。你可以在Siri中输入一个请求(Siri本身只是苹果模型的众多功能之一),但即使这样,你也不会得到原始模型的输出:你得到的是GUI。LLM被抽象为API调用。

在这里插入图片描述

这意味着苹果的基础模型不会像Gemini那样建议在披萨上涂胶水,因为你根本无法让它回答这类开放式问题。苹果将其视为一种能够实现新特性和功能的技术,在这种技术中,设计和产品管理决定了技术的功能和用户看到的东西,而不是你要求的神谕。

相反,“oracle”只是一个功能。苹果正在划分“环境模式”和“世界模式”。苹果的模型可以访问你手机上关于你的所有内容,为这些功能提供动力,这些都是私有的,无论是在设备上还是在苹果的“私有云”上。但是,如果你想知道如何处理你在杂货店购物的照片,那么这就不再是关于你的背景了,苹果将把它发送给第三方世界模型——今天的ChatGPT。一个世界模型确实有一个开放式的提示,它会给你原始的输出,它可能会告诉你在披萨上涂胶水,但这显然是不同的体验,你应该有不同的期望,当然,这也是OpenAI的品牌风险,而不是苹果的。与此同时,这个世界模型没有得到你的背景,只有你的一次性提示。

我们还没有看到苹果的上下文模型到底有多有效,但原则上它看起来确实很站得住脚。OpenAI和其他新公司的云模型(Anthropic, Mistral等)都没有你的电子邮件,信息,位置,照片,文件等等。如果你使用Android,谷歌确实有一个世界模型,并且可以访问你的环境,但这在美国显然是少数(而Android基地比iPhone基地更少能够在当地做任何事情)。微软的人工智能个人电脑有一些这样的背景,尤其是在工作环境中,但对大多数人来说,智能手机是拥有所有真实背景的主要设备,而不是个人电脑。Meta有这样的背景吗?也许是其中的一部分。在某个时候,这里将会有一场有趣的反垄断对话。但杠杆的关键在于,你需要先有自己的十亿规模的平台,然后才能建立这个平台:你不可能从零开始,用一个网站。

另一方面,OpenAI在这种关系中的立场有多站得住脚?不是很。

去年5月,一份泄露的谷歌备忘录声称LLMs没有护城河,因为每个人基本上都有相同的访问训练数据的权限,而且会有很好的开源模型。这就是目前的情况:唯一的护城河就是资本和英伟达的芯片(目前),而且根据你的计算方式,有六到十几个顶级模型,OpenAI领先,但还不够。苹果并没有声称它的新款基础机型在所有方面都是最好的,但对于它想提供的功能来说,它似乎已经足够好了。这不会像搜索或操作系统那样发挥作用——目前还没有明显的赢家通吃的迹象。苹果可以建立自己的基础模型——这只是钱的问题。

因此,OpenAI被(显然)“免费”分发给数亿苹果用户,为此它承担了所有的推论成本,作为交换,OpenAI有机会向付费订阅用户追加销售(尽管看看苹果在WWDC上的所有演示,我们还不清楚它将如何做到这一点)。但它也被视为一个可互换的插件。这与谷歌每年向苹果支付200亿美元成为默认搜索引擎的做法非常相似。苹果的人工智能主管John Giannandrea在本周的发布会结束后明确地做了这样的比较——“我认为这有点像Safari处理搜索引擎的方式”——Craig Federighi说他认为可能会有不同的“世界模型”用于不同的问题。通过暗示,苹果可能会向一个世界模型发送航班问题,向另一个世界模型发送烹饪问题。

但是,网络搜索是正确的比较,还是我们应该看看地图?苹果认为,试图打造一个像谷歌一样优秀的搜索引擎毫无意义,而且其他公司也没有真正做到这一点。另一方面,苹果确实开发了地图,虽然一开始搞砸了,但苹果地图现在至少“足够好”,因为除了资本之外,没有真正的护城河。很明显,OpenAI不是新的谷歌:不会有一个赢家。

当然,苹果自己构建的运行在私有云上的基础模型是一个“世界模型”,你可以向它索要披萨食谱——只是到目前为止,苹果还决定不提供那个UI。苹果让OpenAI承担了创造披萨胶配方、制造错误率和滥用他人问题的品牌风险,而苹果则在安全距离之外观察。下一步,可能是接受必应和谷歌对默认位置的竞标,但与此同时,越来越多的用例将悄悄地从第三方转移到苹果自己的模式上。毕竟,是苹果自己的软件决定了查询的去向,以及哪些查询需要第三方的帮助。

当然,这些都不是什么新鲜事物——很明显,当Llama 3问世时(如果不是更早的话),llm将是以边际成本出售的商品,问题将是你在上面构建什么产品——因此OpenAI聘请了Kevin Weil作为产品主管。但苹果也认为,一整类LLMs产品将被构建在云LLMs无法到达的地方,或者它们只是一个API调用的地方。

这让我想到了一个更广泛的问题。有句老话说,科技行业的每个人都在试图将别人的产品商品化,或者免费赠送自己的产品,或者两者兼而有之。Meta将免费提供Llama(包括模型和权重,目前甚至在其应用程序中嵌入免费查询),而超规模化者则希望对模型收费,因为Meta希望这是廉价的商品基础设施,并且它将在服务和功能上脱颖而出。苹果也在做类似的事情。运行Apple Intelligence的许多计算都在终端用户设备中,由用户付费,而不是苹果的资本支出预算,而且Apple Intelligence是免费的。(我们不知道苹果私有云的成本是多少,也不知道本地查询和云查询的可能组合。)英伟达上季度销售了250亿美元的人工智能芯片,超大规模厂商今年可能会在数据中心上花费1500亿美元左右,但全球智能手机市场超过4000亿美元,个人电脑市场超过2000亿美元,你的用户为此付出代价。这些数字显然没有直接可比性,但这是一个相关的比较。没有人能确切地知道几年后会是什么样子——模型会变得更大,效率也会更高,边缘会变得更快——但有一些非常强大的动机会让设备上尽可能多的东西。

商品化往往也是一种整合。曾经有一段时间,“拼写检查”是一个独立的产品,你必须花几百美元购买,市场上有几十个竞争产品,但随着时间的推移,它首先被集成到文字处理器中,然后是操作系统。同样的事情也发生在机器学习的最后一波浪潮中——风格转移或图像识别在五分钟内是产品,然后成为功能。今天“总结这个文档”是人工智能,你需要一个每月20美元的云LLMs,但明天操作系统将免费提供这些服务。“人工智能就是一切还不能用的东西。”

我也很好奇这对英伟达意味着什么。正如我经常仔细指出的那样,实际的芯片和数据中心分析师经常谈论英伟达的护城河,无论是在芯片本身,还是在为开发人员构建的软件上。苹果足够大,可以走自己的路,就像它把Mac搬到自己的芯片上一样:它控制着芯片上的软件和api,这些是开发者网络效应的基础,它拥有世界级的芯片团队,并有与台积电合作的特权。今天还有谁能与之相比?谷歌tpu吗?许多其他科技公司,甚至是大公司,似乎不太可能构建自己完全定制的从硅到gui的AI堆栈。改变的地方在于模型运行的地方:完整的基础模型还不适合一部手机,但是,从构建模型和“预言”到功能的实际用例越多,推理就越能更快地转移到边缘。苹果再次指出了这个问题。

最后,所有这些仍然只是论文。这些在18个月前都行不通,我们的产品还不适合市场。在许多发达国家,多达一半的人口已经尝试过生成人工智能,但其中一半从未尝试过第二次。这是对新事物的伟大认识,但这不是牵引力。我们不知道产品是什么,也不知道市场是什么,也不知道科学是什么,一切都在快速变化。在代理或错误率方面可能会有新的突破,从而完全改变用例。

与此同时,在位者总是试图把新事物变成一种特色。谷歌和微软花了18个月的时间在他们的产品上到处都是LLMs,每家企业SaaS公司也是如此:我的老同事Steven Sinofsky说,“互联网上的每个文本框都将获得LLMs”。苹果正在做一些稍微不同的事情——它为你在手机上做的所有事情提出了一个单一的上下文模型,并以此为基础提供功能,而不是在公司的各个不相关的地方添加不相关的llm功能。但它仍在努力将这种“颠覆性”的新技术变成一种功能,并试图将ChatGPT放在一个盒子里,限制在一组相当狭窄的用例中,并与Anthropic或Gemini互换。

正如我一开始所说的,这是关于生成式人工智能未来的核心问题——这是一种新的通用工具,一家公司的一款产品可以完成数百家公司的数百个软件的工作,还是一种通用技术,可以在数百家或数千家公司的产品中实现功能?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/356656.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

现在这个行情,又又又要开始准备面试了~~

亲爱的程序员朋友们: 这些资料曾经帮助过许多有志之士顺利拿下抖音、快手、阿里等大厂的Offer,现在也希望它们能为你的面试旅程助力! 关注【程序员世杰】回复【1024】惊喜等你来拿! 截图 关注【程序员世杰】回复【1024】惊喜等你来拿&#xf…

车辆轨迹预测系列 (三):nuScenes数据集详细介绍-1

车辆轨迹预测系列 (三):nuScenes数据集详细介绍-1 文章目录 车辆轨迹预测系列 (三):nuScenes数据集详细介绍-1一、数据集准备1、解压2、安装nuscenes-devkit3、介绍 二、架构内容解释1、category 类别2、attribute 属性3、visibility 可见性4、instance …

包含网关的概念及案例演示

包容网关 知识点讲解 包容网关可以看作排他网关和并行网关的结合体。与排他网一样,可以在外出顺序流上定义条件,但与排他网关不同的是, 进行决策判读时,包容网关所有条件为true的后继分支都会被依次执行。如果所有分支条件都为fa…

IMU用于飞行坐姿校正

为了提升长途飞行的舒适度并预防乘客因不良坐姿导致的身体不适,来自荷兰上海两所大学的研究团队携手开发出一种创新的“舒适穿戴”设备,专为识别飞行中的坐姿设计。 研究团队制作了两种原型设备:一种追求极致舒适,另一种为紧身设…

干货!!SSAS模型刷新步骤

白茶在上一篇文章PowerBI迁移到SSAS向小伙伴们介绍了如何将已经开发好的PowerBI模型迁移到SSAS整个操作过程,与此同时也带来了新的问题,那就是SSAS的模型该如何刷新呢? 配套工具 SSMS Visual Studio SSIS SSIS[1]的全称是SQL Server Inte…

桂电人工智能学院大数据实验,使用 Docker 搭建 hadoop 集群

桂电人工智能学院大数据实验,使用 Docker 搭建 hadoop 集群 第一步 安装 Docker, Windows 上可以使用 Docker Desktop 下载地址:https://www.docker.com/products/docker-desktop/ 安装过程自行谷歌 安装好的标志:打开终端 运行docker p…

JetBrains PyCharm 2024 mac/win版编程艺术,智慧新篇

JetBrains PyCharm 2024是一款功能强大的Python集成开发环境(IDE),专为提升开发者的编程效率和体验而设计。这款IDE不仅继承了前代版本的优秀特性,还在多个方面进行了创新和改进,为Python开发者带来了全新的工作体验。 JetBrains PyCharm 20…

Nuxt快速学习开发 - Nuxt3静态资源Assets

Nuxt 使用两个目录来处理样式表、字体或图像等资产。 public/目录内容按原样在服务器根目录中提供。 assets/目录包含您希望构建工具(Vite 或 webpack)处理的所有资产。 public/目录 public目录用作静态资产的公共服务器,可在您的应用程序定…

PDF标准详解(三)—— PDF坐标系统和坐标变换

之前我们了解了PDF文档的基本结构,并且展示了一个简单的hello world。这个hello world 虽然只在页面中显示一个hello world 文字,但是包含的内容却是不少。这次我们仍然以它为切入点,来了解PDF的坐标系统以及坐标变换的相关知识 图形学中二维…

colima配置docker镜像源

只在 colima ssh 环境下修改 docker 配置文件是无效的,我们需要修改 colima 配置文件才能使 docker 镜像源生效。 此时你需要进入到~/.colima/default目录下编辑colima.yaml文件。该文件是 colima 的配置文件。内容如下图所示,我这里配置了许多家的镜像源…

换电脑后导入git本地仓库记录

导入本地仓库tig记录 换了新电脑,将旧电脑的数据盘查到新的笔记本之后发现,使用pycharm 读取不到本地的git提交记录了,我没有将本地git上传到远程仓库的习惯,这可抓马了,硬盘插回去的话也太麻烦了。试了 vscode 提示设…

如何恢复电脑硬盘删除数据?提供一套实用恢复方案

在数字化时代,电脑硬盘中存储的数据对于个人和企业来说都至关重要。然而,有时我们可能会不小心删除了一些重要文件,或者因为某种原因导致数据丢失。这时候,恢复硬盘上被删除的数据就显得尤为重要。本文将为您提供一套实用的电脑硬…

国企:2024年6月中国移动相关招聘信息

中国移动研究院: AI中心-大模型数据工程师 工作地点:北京市、西安市2 发布时间 :2024-06-18 学历要求:硕士研究生及以上 招聘人数:招聘若干人 专业要求 计算机、人工智能、软件工程、数学等相关专业 工作职责 1、负责处理和清洗大规模、多来源的数据集,保证数…

Python武器库开发-武器库篇之ThinkPHP 2.x 任意代码执行漏洞(六十三)

Python武器库开发-武器库篇之ThinkPHP 2.x 任意代码执行漏洞(六十三) PHP代码审计简介 PHP代码审计是指对PHP程序进行安全审计,以发现潜在的安全漏洞和风险。PHP是一种流行的服务器端脚本语言,广泛用于开发网站和Web应用程序。由…

解决 执行 jar 命令 控制台乱码

Springboot项目,编码为utf8 打包后,为了在控制台运行时不乱码,需要在控制台中依次执行以下命令: 第一步: chcp 65001第二步: java -jar -Dfile.encodingutf-8 你的.jar

Stable Diffusion 3 大模型文生图实践

windows教程2024年最新Stable Diffusion本地化部署详细攻略,手把手教程(建议收藏!!)_stable diffusion 本地部署-CSDN博客 linux本地安装教程 1.前期准备工作 1)创建conda环境 conda create --name stable3 python3.10 2)下…

如何在不同的操作系统中查看路由器的IP地址?这里有详细步骤

如果你曾经需要访问路由器的设置页面来进行一些配置更改,你知道你需要路由器的IP地址才能访问。如果你忘记了这个IP地址是什么,下面是如何在几乎所有平台上找到它的。 为什么路由器的IP很有用 在网络世界中,默认网关是一个IP地址,当流量被发送到当前网络之外的目的地时,…

分行业二氧化碳排放数据

分行业二氧化碳排放量 资源名称:分行业二氧化碳排放量 数据来源:中国能源统计年鉴 时间范围:1995-2018年指标:八类能源和总量:煤炭、焦炭、原油、汽油、煤油、柴油、燃料油、天然气

windows设置开机启动项

将文件放到下面路径即可实现每次开机启动 C:\ProgramData\Microsoft\Windows\Start Menu\Programs\Startup

《珊瑚岛》是一款什么类型的游戏 苹果电脑如何玩到《珊瑚岛》

在众多电子游戏中,有些游戏因其独特的游戏体验和丰富的内容而脱颖而出,《珊瑚岛》便是其中之一。在游戏中你将离开宝京前往珊瑚岛,种植农作物、饲养动物、和岛民成为朋友。您不仅可以振兴该岛小镇,还可以保护和修复周围的珊瑚礁。…