第一代AIGC硬件悄然爆发

文 | 智能相对论

 

作者 | 叶远风

看起来,这可能是一副正常的黑框眼镜,你戴上去彬彬有礼、斯斯文文;

实际上,它里边还装了一个“小伙伴”,你随时可以与它交流,谈天说地或者提出各种问题接受它的帮助;你化身为了科技极客,成为科幻片里带着有超能力的“小跟班”闯荡世界的酷炫主角……

这款眼镜是天猫精灵最近爆出的一款升级了大模型的智能随身眼镜工程机版本。

从官方透露的信息看,这个新型随身终端demo内置了AIGC能力,可以通过连续的语音交互实现对用户的全天候陪伴。

从B站博主透出的视频来看,对话、记录、生活技巧……以骨传导的方式,在没有人注意到的情况下,大量的交互就已经轻松实现。

逛街时需要寻找优质餐厅时,只要问一问,答案就传到了脑子里,带上一脸疑惑的朋友,出发;

减肥大计还没成功,又疑惑美食的热量时,可以马上在耳旁获得恰当食物的推荐,不用担心热量超标;

躺在沙发上吹着空调玩着王者荣耀,想知道辅助位该怎么玩时,小伙伴已经帮你应该玩什么英雄、怎么玩都安排好了……

尽管人工智能喊了几十年,但AIGC的到来,可能还是第一次能够让普通人直接感受到技术的澎湃力量。

实际上,除了天猫精灵的智能随身眼镜,AIGC硬件过去一段时间内已经出现集中化涌现的浪潮。

百度小度全面接入文心一言,甚至借势推出面向垂直领域的智能手机产品;

科大讯飞的星火一经发布,就宣布接入旗下的学习机产品以及智能办公产品;

此外,华米在其新款Amazfit Falcon运动智能手表上上线了ChatGPT表盘,拥有众多智能终端产品的小米更是爆出要自研大模型接入其生态产品中。

在国外,苹果批准了其AppleWatch硬件产品接入AIGC能力,智能眼镜公司Innovative Eyewear宣布将推出首款支持ChatGPT的智能眼镜。

而上述天猫精灵智能眼镜在开售日当天直接登上了天猫平台同品类热销榜第一。

这些都表明,第一代AIGC硬件正迎来爆发,这种爆发也展示了AIGC垂直化下的个人化、随身化产品发展路径和价值。

大模型想离“用户”更近

ChatGPT、通义千问、文心一言、讯飞星火……

大模型产品过去一段时间集中涌现,各自都刷了一波存在感,好不热闹。

实际上,这些能够聊天交互的产品,只是厂商们用最直观的方式向业界秀出自家大模型的技术肌肉罢了。

它们背后支撑的大模型,在打出影响力后走入垂直领域实现商业化,是共同的追求。

AIGC的大时代,走在前面的企业已经在探索更多场景。

而在商业化这件事上,厂商们的倾向各不相同——直观上,分为进入B端企业提供服务以及面向C端创新产品两种路径。

到底是朝向B端还是去C端,也引发过一系列的讨论甚至争论。

这波浪潮的源头OpenAI,倾向于面向企业提供服务,收取订阅费,来快速实现数亿美元的营收目标。

这也成为不少国内厂商的选择。

而实际上,大模型的原本含义就是“预训练的大参数量算法模型”,它本质的意义体现在“预训练”上,能够经过微调就快速适应对应的场景,在不需要提供大量数据喂养的情况下就能形成一个可落地的应用,从而在提升AI能力的同时加速AI创新的速度。

但从大模型的技术落地来说,垂直化是生来就有的基因。

在企业级服务十分旺盛的欧美,OpenAI优先选择了面向企业们收订阅费。

而在中国市场,虽然随着To B数字化、智能化服务的高速发展,厂商最终也需要全面面向企业提供服务,它们还多了一项选择,那就是依靠蓬勃发展的C端市场,在各类C端产品或服务上,展现AIGC的能力。

过去已经发展了很多年的智能终端,具备商业化的三大优势:大市场容量、深度服务的价值潜力、易于通过语音助手实现AIGC能力嫁接。

简单说,市场大、潜力深、好上手,容易得到普遍选择。

这一点,也得到研究机构与厂商实践的共同证明。

中国信通院在《AIGC与ChatGPT:现状、趋势及治理》中认为,智能语音助手将是重要的AIGC应用方向;

国盛证券在其研究报告中提到,智能助理将成为下半年的超级应用,大模型让人类可以指挥搭载在智能音箱、耳机、汽车等各种设备中智能助理帮自己完成各种任务。

智能随身眼镜这类陪伴式产品,底层支撑就是智能语音助手。

此前,百度的智能音箱已经传出要搭载AIGC能力,讯飞星火大模型一经发布就直接应用到了其学习机硬件产品上,让学生用户可以直接与学习机英文聊天。

在推出智能随身眼镜前,天猫精灵也已经在4月份公开首个接入千问大模型的智能硬件demo。

过去市场上出现过的所有智能化硬件终端,都可以“再造一遍”。

音箱、耳机、汽车、手机,甚至所有的智能家居,都可以通过搭载语音助手实现“AIGC化”。

国盛证券说智能助理/AI伙伴或将是下一个超级应用,丝毫不夸张。

只不过,更进一步看,在诸多智能终端中,并不是所有产品都能快速凸显。

那些承袭“可穿戴设备”概念的随身终端们,借AIGC,或将率先落地展现出新的价值。

三大条件齐备,大模型再造智能终端

一个AIGC智能终端的落地,无非看三个方面:

产品属性是不是契合AIGC、能碰撞出最大价值,这直接决定市场接受度;

技术是不是能够跟上,这决定产品功能品质;

赛道是不是有强烈的动因去融合AIGC,这决定长远的商业化深度。

而以智能随身眼镜为代表的随身终端,在诸多智能终端中,当下无疑更贴合这些要求。

1、产品属性:声音带来更直接的价值落地

在漫威电影《钢铁侠》中,AI管家贾维斯帮助钢铁侠管理大大小小的事务。

这一设定被众多电影沿用,几乎每个科幻片,都能看到一个形影不离的设备陪伴在主角身边,提供各种帮助,甚至不执行任务只是单纯“接受倾诉”。

OpenAI的创始成员Andrej Karpathy也曾表示,他要创立一个“贾维斯”。

声音交互+全能+随身,成为“贾维斯”们共同的特点。

在所有智能终端设备中,因为种种限制,声音交互成为最常用、最便捷、最直接产生AIGC价值的方式。

而“随身”又让这种价值实现变得更加高频,让“助手”价值与日常生活更加紧密贴合。

毕竟,人们的活动范围总是在变,但随身设备一直在身边。

可以看到,虽然天猫精灵的智能随身眼镜在产品形式上更像是AR眼镜,但至少在当下,它本质上还是走的声音交互+随身的路子,是一个被“科幻化”方式隐藏的耳机。

国盛证券在其报告中也认为,在户外、旅途或者需要私密性的场景,最合适的语音智能载体是耳机,“因为人类物理条件限制,耳机在未来可见维度内都是优质入口。”

上班“摸鱼”,开会帮助录音记录会议纪要,逛街帮忙寻找吃喝玩乐好地方,甚至深夜接受倾诉、成为社恐用户的好朋友……

天猫精灵试图打造的,就是科幻片中那个形影不离的生活与工作伙伴。

2、技术供给:全链条技术已经储备完成

在每一个大模型产品的发布会现场,正常的演示过程往往都是输入文字然后AIGC创作一个答案呈现出来。

这就带来一个问题:当AIGC进入随身终端,需要声音交互的时候,除了大模型本身的能力,还需要一系列技术的支持来构成技术链条:

感知阶段,ASR技术,将听到的语音转成文本输入给大模型;

决策+创造阶段,NLP(即大模型本体),接受信息后创造内容输出;

表达阶段,TTS技术,将文本转化成自然流畅的语音传递给用户。

对智能随身眼镜来说,这还没完,要带来私密的声场,还需要配合精密的骨传导技术。

只有具备一系列技术储备的玩家,才有资格上桌,这里没有什么黑马的机会。

天猫精灵的智能随身眼镜,一方面需要搭载千问大模型的场景化应用,另一方面也离不开这些年来依靠智能音箱在ASR、NLP、TTS技术上的长期积累。

作为一款创新产品,其背后的新工程技术研发也值得关注。

比如这次用到的骨传导技术采用了所谓“振子专利技术”,优化了骨传导发声装置的连接模式,让振动响应更加稳定、更小噪音、更低失真。

而且,植入的组件还需要小型化,保证可以安放进9.9mm的镜腿之中。

科技和体验,都拒绝笨重。

当然,天猫精灵有了这一系列技术储备,并不仅仅应用于眼镜,未来在耳机、头盔等穿戴设备中也有用武之地。

如果智能随身眼镜取得成功,未来可以期待更多随身终端的AIGC创新。

3、变革需求:AIGC契合了赛道突破自我的需要

很长一段时间以来,可穿戴设备处在概念火热但产品进展缓慢的处境当中。

随身终端搭载大模型,实现AIGC能力后,更多价值创造的可能性就出现了。

陪伴、闲聊、推荐餐厅、网上购物、办公、检索信息……一个随身设备都能提供。

中国信通院云计算与大数据研究所内容科技部副主任刘硕,把这种AIGC给原有赛道的价值改变,称为“破坏式创新”——AIGC对随身终端的价值,不再是基于原有产品逻辑的优化,而是一种打破后的“再造”。

智能随身眼镜给AR带来的改变就是如此,反过来,也受这种变革需求的驱动。

以旅游场景为例,以前的AR眼镜能够在看到一家酒店后提供相应的信息供决策已经很了不起,现在,内置的“小伙伴”可以通过语音分析用户需求、检索网络信息、为用户做出建议,甚至帮助用户操作下单,完成旅游计划的构建。

有理由相信,更多不温不火的随身终端甚至智能终端赛道亟待这样的创新。

随身终端的AIGC竞逐,仍在回归行业本身

搭载AIGC的随身终端带来了全新的效率和场景需求满足能力,激发了新的市场空间,不仅能够为用户提供具体的服务,还在创建一个拥有多维度参与力量的生态系统。

智能终端,一直在各种方式、路径,在各种工作、生活场景中向用户提供丰富的服务。

AIGC的加入,或许还能让过去的智能终端产品竞争摆脱同质化。

例如,在传统声音交互的典型智能终端——智能音箱的产品角逐中,很难说厂商间有什么太大的差异——以数据库、知识图谱的方式回应用户需求,各个产品基本上“你有我也有”。

但当大模型成为新的底座基础设施,并将AIGC能力输送到随身终端后,各个产品能力的强弱将形成巨大的差异化。产品角逐将变为硬实力角逐。

*本文图片均来源于网络

#智能相对论 Focusing on智能新产业新服务,这是智能的硬件 NO.217深度解读

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/40942.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt赋能python:小黑框:Python程序员必备利器

小黑框:Python程序员必备利器 如果您是一名Python程序员,小黑框(Terminal)一定不陌生。小黑框是一种基于文本的用户界面,通常用于执行命令行任务,编写或调试代码等。Python程序员可以通过小黑框完成许多任…

游戏开发中防外挂的那些事儿

对于一个要上线的游戏,防外挂是必须的,历史上因为外挂而造成大量玩家流失的游戏数不胜数。随着游戏研发技术的发展,对外挂的预防业内其实做的已经越来越好了。下面总结一下防外挂的基础知识,以及我们的移动模块为防外挂做了哪些工…

游戏反外挂技术原理讲解

永远在路上 没有破解不了的反外挂系统,反外挂是一个对抗过程,需要不断升级。我们反外挂小组会采取对抗方式提升防御,也会研究竞品来获取灵感。反外挂也是非常有意思的,可以学到很多很多底层知识。 善战者无赫赫之功 反外挂&#x…

各网游的外挂是如何做出来的?

每一个致力于学习黑客技术的人,最后都分为三种人。 第一种:入侵,各种入侵,玩的就是入侵的快感,或者恶作剧的喜感,或者那种有特殊“窥视”癖好的人……别误会,小编我是喜欢“恶作剧,…

干货!什么是游戏外挂,外挂的种类及实现原理

外挂,原指一切用来破坏游戏程序正常游戏数据和逻辑的工具或破解版。比如可以修改游戏内存数据的修改器,又比如可以修改网络数据包的抓包工具。这类外挂或多或少会影响游戏的内存数据、文件数据、网络数据,甚至代码逻辑。 但随着外挂市场的发…

游戏外挂怎么做?

文章目录 1.什么是游戏外挂2.外挂的分类及实现原理2.1 辅助类外挂2.2 专用插件类外挂2.3 通用工具2.4 内存修改器2.5 变速器2.6 按键精灵2.7 模拟器2.8 破解版 转载自:Anti-Cheat Expert 游戏安全专家 干货!什么是游戏外挂,外挂的种类及实现原…

哈夫曼树 例题

假设某棵二叉树有N个叶结点。给定这些叶结点的权值,求所有可能的二叉树中带权路径长度(WPL)的最小值。 注: 结点的带权路径长度(WPL):结点的权值乘以该结点的深度(假设根节点的深度…

svn更新/提交代码提示错误 , 进行清理下“破除写锁操作“

1.如果svn提交或者更新代码有--进行清理下"破除写锁操作"--此提示,一般情况下右键,然后选择进行确定就可以 2.如果还不行的话,在项目下的 .svn 文件夹里面新建文件夹,命名为tmp,然后重新更新,提交,就会发现问题解决了

2022年深圳杯数学建模A题代码思路-- 破除“尖叫效应”与“回声室效应”,走出“信息茧房”

问题重述: 在全新的信息传播格局下,如何破除“尖叫效应”与“回声室效应”,走出“信息茧房”,是当前迫切需要解决的现实问题,即如何从信息传输的顶层设计、推荐算法的公平性和广大网络用户的责任担当等方面&#xff0…

钉钉最新点赞破除限制方法(

我不是标题党! 首先,放图片((( 时间这里是录视频的时间,2021-8-27,不是标题党! 上方法! 主要原理:利用抓包抓到的点赞api端口,实现持续点击或…

亚马逊云科技 Build On -Serverless低代码平台初体验-快速完成vue前端订单小程序

文章目录 一、我所认识的低代码平台二、Serverless的使用场景三、拖拉跩实现build on 的Serverless1. 使用图像界面创作方法2. 拖拉跩模块实现搭建3. 实时测试流程是否正确4. 最终的设计和流程图 四、创建端到端的基于vue的前端图形化界面六、总结与活动链接 一、我所认识的低代…

一小段Python代码,破解加密zip文件的密码

Python 有一个内置模块 zipfile 可以解压 zip 压缩包。先来测试一波:创建一个测试文件,压缩,设置解压密码为123。 import zipfile# 创建文件句柄 file zipfile.ZipFile("测试.zip", r) # 提取压缩文件中的内容,注意密码…

开源治理工具选一个

随着开源技术在云计算、大数据、AI领域的不断运用,不断破除技术壁垒,让企业快速建立自身的应用,在开源软件基础一,自主研发部分代码,便可以推出企业自身品牌的产品,开源技术的应用极大的推动了云计算、大数…

机器人微控制器编程(CoCube)-破除定势

从课程到生活; 从书本到理想; 从程序到生态; 从个体到集群; 从特殊到一般; 从传统到现代; 从技术到科学; 从理论到工程; 从基础到高阶。 …… 课程归根结底,是为学生服务…

复制浏览器html代码吗,网页文字不能直接复制?只需简单几招即可轻松破除限制,想学吗?...

原标题:网页文字不能直接复制?只需简单几招即可轻松破除限制,想学吗? 想必大家在网上都遇到这样的问题,网页文字受到限制无法直接复制,这该如何是好呢? 既不想登录注册又想直接复制走内容&#…

LR低代码快速开发平台 高效调整企业组织架构

组织架构以及围绕组织架构的设计、实施和变革,是企业管理永恒的话题,它上承公司的业务战略和运营模式,下接业务流程和信息系统建设,重要性不言而喻。数字化变革浪潮之下,商业模式的颠覆、价值链的重塑都需要由相匹配的…

自己动手写编译器:通过语法编译构建语法树并实现中间代码生成

上一节我们手动构造了语法树,然后调用各个节点实现中间代码生成。语法树的构建由语法解析完成,本节我们要完成语法解析逻辑,在语法解析过程中构造语法树,然后再像上一节那样实现中间代码生成。 这里我们再次回顾一下左递归&#…

安卓原神QQ机器人搭建教程

1,下载安装Termux 下载地址:https://f-droid.org/packages/com.termux/ 滑到下面点击这个 2,打开Termux,安装Ubuntu 安装模拟权限git,python,执行下面命令 pkg install proot git python -y 3&#xff…

如何在windows电脑上完成原神签到、祈愿抽卡分析等功能

一款开源的游戏辅助工具——原神助手。支持原神签到、祈愿抽卡分析、查看便签状态和游戏详细数据等。 开发者自述也是偶然间接触到《原神》,于是一发不可收拾,爱上这款游戏了。 在游戏中,如果要查看角色信息等内容,就必须需要登…

不同服务器的ps4账号吗,原神PC与PS4互通数据吗 不同平台数据互通分析

原神最近上线了pc版本,那么,你知道PC与PS4互通吗?这是很多玩家关心的问题,不同的平台,数据能否互通呢?比如说,不同平台是否可以一起玩,不同平台帐号是否可以切换,下面就为…