AI玩具来了,它怎么样?

90后的我们,是AI时代的见证者。20后的小孩,才是AI时代的原著民。当ChatGPT们改变着大人的工作方式,我觉得,是时候让孩子们的玩具也更聪明些了吧。于是,在六一前夕,我用市面上的AI语音对话套件给娃DIY了一套她人生中首款搭载了语言大模型的对话玩具,并在深度体验后对AI玩具有了一些新看法。

AI对话玩具的原理类似于智能音箱,以STT + LLM + TTS架构为主。玩具会先把用户的语音转换成文字信息(STT),该文字信息交由语言大模型后生成反馈性的文字信息(LLM),文字最终又会被转换成语音信息发送给用户(TTS)。这就是基本的工作流程。

我选用的是FoloToy设计的八爪鱼AI套件。该套件提供了一个小型电路板以及成熟的AI语音对话方案。用户可以根据自己喜好设计适配的玩具外壳、定制专属的提示词。需要说明的是,该套件出厂前已经内置了若干卡通形象,用户根据其官网的步骤是可以直接进行对话体验的。而更为灵活,更具个性化的配置,例如,定制人物形象的“角色提示词”、定制人物的开场白、定制人物的音色、选择AI大模型类型等,才需要用户进入到“自建服务器”模式下进行操作。此模式才是最具趣味性的,我的玩具定制也是基于此。

我的想法很简单:在“自建服务器”模式下写入专属提示词,首先让玩具记住我孩子的名字,这样玩具和孩子交流的时候就会显得相互很熟络也有互动感;其次,让玩具“伪装”成孩子最喜欢的一个动画角色,并且以该角色的立场来回答问题,这样就增加了孩子对玩具本身的热爱程度。

但就是这个“自建服务器”模式,对非技术人员非常不够友好。它需要用户会独立进行服务器部署。虽然官网提供了详细的教程材料,但是文章里全是黑话和暗语。"VPS"、"Debian"、"全局使用"、"TCP端口"......正常人就不可能看懂嘛。市面上很多类似的教程都是如此,它们都是建立在一定专业知识储备基础上的,而从过往的经历来看,这个壁垒就是我获取新知过程里最大的阻碍。       

当然,现在不一样了,AI帮我踏平了这个鸿沟。我利用国产“ChatGPT”的王者:Kimi,很容易就搞清楚了FoloToy教程里各类名词以及它们之间的关系,不需要花里胡哨的提示词,直接问某个名词是什么意思即可。如若还不理解,让其用类比的手法来解释下就基本能满足临时学习的需要。遇到某些确实复杂的知识点,再加上一些追问就更易理解了。余下的就是根据视频教程傻瓜式的模仿操作,具体过程不再赘述。结果就是,熬了两个晚上,我几乎是一次性完成了服务器的部署。尽管如此,我依旧建议,如果能让用户以更简单的形式定制prompt:优化说明文档、降低定制prompt的使用门槛,必定会扩宽更大的用户群体。

按住对讲按钮,冰冷的电路板突然就可以让我和AI进行对话了,作为小白,这进度也直接惊艳到了我自己。AI时代,知识壁垒真的正在消失,阻碍人类获取新知最大的障碍可能只是自己的意愿。

完成了服务器部署基本就是解决了整个DIY过程里最难的一部分。剩下的就是根据设想写一段独一无二的提示词,最后再配上一个喜欢的玩具外壳。新一代的AI玩具就诞生了。

作为初代的AI玩具,我对其效果还是很满意的。体验下来,它是真“聪明”。不仅能轻松招架孩子的十万个为什么,还在于,它的答案不乏风趣和童真,比大部分成人回答的都好。相较于某某兔们极为有限的对话空间,AI玩具甚至在对话过程中会带出孩子的小名,这让其更显人性。当然瑕疵也存在,如延迟高、说话没有任何感情,这些从技术角度上讲后面都能解决。反而我发现,当前通用语言大模型固有的一些缺点:无法处理复杂流程、“七秒钟”的记忆、文本长度的限制等,在AI玩具的场景下,反而不会是问题。短文本、低轮询是对话类玩具的特点,这样的场景非常契合语言大模型的功能特点。语言大模型真的很适合“对话”型玩具,玩具搭载AI大模型将是一个必然的趋势。

但语言大模型本身也并不是灵丹妙药,因为prompt决定了玩具到底灵不灵。现在我手里的初代AI玩具的效果强依赖于提示词。但有过AI使用经验的人都知道,语言大模型并不是一个有着清晰逻辑的线性控制系统。虽然你给它设定了一堆约束,但模型依旧会“跑题”,我在使用过程中就不止一次碰到了“会讲故事的老师”说自己“我是Kimi,你的人工智能助手”。这说明,普通用户用提示词将模型固定成单一的形象这个行为本身并不太靠谱。更不用说,提示词没优化好出现token不够用的健忘行为。当号称智能的玩具一旦失手一次,就很难挽回挑剔的小孩。从这个角度讲,更具商业化的AI玩具应需要微调过的垂直类大语言模型和更专业的提示词来保证效果的一致性。这些可能需要大厂或者大资金的参与,而未来,开放prompt词可能不会是一个主流的做法。

AI玩具的核心竞争力也不是大模型而是差异化。其实,当终于可以在玩具上定制我想要的形象时,我反而不知道该如何制定一个与众不同的prompt了。无外乎是,会讲故事的叔叔、能解惑的老师、可以讲笑话的姐姐等传统儿童对话机已有的或包含的形象。而从孩子的角度,这个AI玩具似乎没有什么特别的改变,她可能甚至都没能感受出这个玩具更“聪明”了。低龄孩子本身就处在善恶对错的探索期,让他们感知到“聪明”一点似乎还有点强人所难。于是,当我将“用心”调教过的玩具拿给我孩子后,和大多数传统玩具一样,她先是好奇地玩了几次,后来就再没有碰过。

玩具的变革,AI技术是底层驱动力,创新才是最直接的推力。简单的语音对话,只能是AI玩具最初级的形态,可以预想到,搭载了AI大模型的智能硬件在未来还有很大的发展空间。市场上已经出现的虚拟女友、亲人数字分身等应用,在赋予其硬件真身后,会充满了想象,这些都可能是未来AI玩具丰富形态的一种。简单模仿和改变,是初期时的探索和试验,想做出好的AI玩具可能还需要时间和想象。

但我依然觉得,大模型驱动下的玩具产业大有搞头。技术上,需要更多微调过、适用儿童教育的可控模型。产品上,则需要更多传统产品人进来“蹚浑水”。当前,AI玩具的技术门槛其实并不高,FoloToy是敏锐的先行者,凭借几款经典产品在圈内已是风头十足。值得警惕的是,面对拥有更多资金和用户基础的传统厂商,留给它的时间真不多了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/351174.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

简单的基于Transformer的滚动轴承故障诊断(Pytorch)

递归神经网络在很长一段时间内是序列转换任务的主导模型,其固有的序列本质阻碍了并行计算。因此,在2017年,谷歌的研究人员提出了一种新的用于序列转换任务的模型架构Transformer,它完全基于注意力机制建立输入与输出之间的全局依赖…

Docker-Portainer可视化管理工具

Docker-Portainer可视化管理工具 文章目录 Docker-Portainer可视化管理工具介绍资源列表基础环境一、安装Docker二、配置Docker加速器三、拉取Portainer汉化版本镜像四、运行容器五、访问可视化界面 介绍 Portainer是一款开源的容器管理平台,它提供了一个直观易用的…

Jmeter多个请求按照比例并发压测的几种方式

🍅 视频学习:文末有免费的配套视频可观看 🍅 点击文末小卡片 ,免费获取软件测试全套资料,资料在手,涨薪更快 一、需求 在压测的过程中,为了能够压测整个链路,通常需要多个接口进行并…

基于Matlab停车场车牌识别计时计费管理系统 【W2】

简介 停车场车牌识别计时计费管理系统在现代城市管理中具有重要意义。随着城市化进程的加快和车辆数量的增加,传统的人工管理停车场的方式已经难以满足效率和精确度的要求。因此引入车牌识别技术的自动化管理系统成为一种趋势和解决方案。 背景意义 提升管理效率&a…

linux 部署瑞数6实战(维普,药监局)sign第二部分

声明 本文章中所有内容仅供学习交流使用,不用于其他任何目的,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关!wx …

诊断解决方案——CANdesc和MICROSAR

文章目录 一、CANdesc二、MICROSAR一、CANdesc canbeded是Vector汽车电子开发软件Nun Autosar标准的工具链之一。 canbeded是以源代码的形式提供的可重用的组件,包括CAN Driver,交互层(IL),网络管理(NM),传输层(TP),诊断层(CANdesc) , 通信测量和标定协议(CCP,XCP) 和 通信控…

【C++】C++入门的杂碎知识点

思维导图大纲: namespac命名空间 什么是namespace命名空间namespace命名空间有什么用 什么是命名空间 namespace命名空间是一种域,它可以将内部的成员隔绝起来。举个例子,我们都知道有全局变量和局部变量,全局变量存在于全局域…

联想电脑电池只能充到80%,就不在充电了,猛一看以为坏了,只是设置了养护模式。

现在电池管理模式有三种: 1)常规 2)养护 3)快充 好久没有用联想的电脑了,猛一看,咱充到了80%不充了,难道电池是坏的?我们要如何设置才可以让其充电到100%呢? 右下角…

贪心算法学习五

例题一 解法(贪⼼): 贪⼼策略: 我们的任何选择,应该让这个数尽可能快的变成 1 。 对于偶数:只能执⾏除 2 操作,没有什么分析的; 对于奇数: i. 当 n 1 的时候…

如何使用ios自带语音转文字工具?

ios自带语音转文字是iOS系统中自带的语音转文字功能主要应用于以下几个方面: 1. 语音输入:在iOS的任何文本输入框中,通常都有一个麦克风图标,点击后可以进行语音输入,系统会将你的语音实时转换成文字。 2. Siri&…

1. NAS和SAN存储

NAS和SAN存储 一、存储设备1、根据工作方式2、DAS 直接附加存储3、NAS存储4、SAN存储 二、模拟配置SAN存储1、创建虚拟机、安装openfiler2、访问openfiler webUI3、创建RAID设备4、开启iSCSI服务5、配置SAN存储设备共享空间5.1 设置IQN 6、业务服务器连接使用存储6.1 安装客户端…

JDK17 你的下一个白月光

JDK版本升级的非常快,现在已经到JDK20了。JDK版本虽多,但应用最广泛的还得是JDK8,正所谓“他发任他发,我用Java8”。 但实际情况却不是这样,越来越多的java工程师拥抱 JDK17,于是了解了一下 JDK17新语法&a…

C#开发-集合使用和技巧(二)Lambda 表达式介绍和应用

C#开发-集合使用和技巧 Lambda 表达式介绍和应用 C#开发-集合使用和技巧介绍简单的示例:集合查询示例: 1. 基本语法从主体语句上区分:1. 主体为单一表达式2. 主体是代码块(多个表达式语句) 从参数上区分1. 带输入参数的…

69. UE5 RPG 使用Gameplay Cue 实现技能表现效果

在上一章中,我们实现了敌人的攻击技能的特效和音效。如果我们在多人模式下打开,发现,其它客户端看不到对应的效果。 造成这种问题的原因是因为敌人的技能是运行在服务器端的,它只复制到拥有它的客户端,而敌人的效果对于…

仿FC数学金刚游戏介绍

简介 Math Monkey是Simple2l工作室开发的第二款小游戏,灵感来源于FC游戏平台的数学金刚游戏。小学时玩FC游戏是业余时间最期待的事情,还记得有一次和玩伴玩游戏时已经晚上了,于是约定再玩一把就各回各家,没想到又连玩了N把每一把…

Postman下发流表至Opendaylight

目录 任务目的 任务内容 实验原理 实验环境 实验过程 1、打开ODL控制器 2、网页端打开ODL控制页面 3、创建拓扑 4、Postman中查看交换机的信息 5、L2层流表下发 6、L3层流表下发 7、L4层流表下发 任务目的 1、掌握OpenFlow流表相关知识,理解SDN网络中L…

Jira,一个强大灵活的项目和任务管理工具 Python 库

目录 01初识 Jira 为什么选择 Jira? 02安装与配置 安装 jira 库 配置 Jira 访问 获取 API token: 配置 Python 环境: 03基本操作 创建项目 创建任务 查询任务 更新任务 删除任务 04高级操作 处理子任务 搜索任务 添加附件 评论任务 05实战案例 自动化创建…

001 Spring介绍

文章目录 特点1.方便解耦,简化开发2.AOP编程的支持3.声明式事务的支持4.方便程序的测试5.方便集成各种优秀框架6.降低Java EE API的使用难度7.Java源码是经典学习范例 好处什么是耦合和内聚耦合性,也叫耦合度,是对模块间关联程度的度量内聚标…

react-day1

1.react是什么呢? react是由Meta公司开发,是一个用于构建web和原生交互界面的库 2.react 项目修改文件保存后 ,不能实时更新,需要: 在和package.json文件同目录的地方,新建.env文件:里面加入…

MySQL数据操作与查询- 连接查询

一、引入 1、为什么需要使用连接查询? 查询信息的来源如果来自多张表,则必须对这些表进行连接查询。 2、连接查询的分类 内连接和外连接。 二、内连接 1、概述 将两张表的记录组合在一起,产生一个新的结果。 (1&#xff09…