大模型智能体智能玩具智能音箱构建教程 wukong-robot

大模型智能体智能玩具智能音箱构建教程 wukong-robot

news/2024/12/25 0:56:57/文章来源:https://blog.csdn.net/qq_25439417/article/details/137129714

视频演示

10:27

一、背景

继上文《ChatGPT+小爱音响能擦出什么火花？》可以看出大伙对AI+硬件的结合十分感兴趣，但上文是针对市场智能音响的AI植入，底层是通过轮询拦截，算是hack兼容，虽然官方有提供开发者接口，也免不了有许多局限性（比如得通过特定指令唤醒），不利于我们去探索研究。

那不如我们自己开发一个智能音响？甚至尝试去实现我们之前的讨论“给GPT4一个完善的硬件环境，比如接一个摄像头，周围景象根据摄像头的图片帧数据流识别内容，转换成肢体语言，操控硬件肢体”。这样仔细想想，是不是有点类似漫威钢铁侠中贾维斯的味道？

因此需求确定了，尝试做一个虚拟管家。让电脑成为一个贾维斯，具备智能音响的所有功能的同时，更AI化：「充分利用电脑强大的性能（本地操作文件、摄像头及语音设备、请求接口能力、启动各种服务做联动等等），接入ChatGPT做大脑中枢进行控制，实现类贾维斯效果。」

二、原理

有幸发现了@wzpan开发的一个开源智能音响项目: wukong-

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/289794.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【Web应用技术基础】CSS(6)——使用 HTML/CSS 实现 Educoder 顶部导航栏

【Web应用技术基础】CSS(6)——使用 HTML/CSS 实现 Educoder 顶部导航栏

第一题：使用flex布局实现Educoder顶部导航栏容器布局 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>Educoder</title><script src"https://cdn.staticfile.org/jquery/1.1…

阅读更多...

C/C++语言学习路线: 嵌入式开发、底层软件、操作系统方向（持续更新）

C/C++语言学习路线: 嵌入式开发、底层软件、操作系统方向（持续更新）

初级：用好手上的锤子 1 【感性】认识 C 系编程语言开发调试过程 1.1 视频教程点到为止 1.2 炫技视频看看就行 1.3 编程游戏不玩也罢有些游戏的主题任务就是编程，游戏和实际应用环境有一定差异（工具、操作流程），在…

阅读更多...

Unity AI Navigation自动寻路

Unity AI Navigation自动寻路

目录前言一、Unity中AI Navigation是什么？二、使用步骤1.安装AI Navigation2.创建模型和材质3.编写向目标移动的脚本4.NavMeshLink桥接组件5.NavMeshObstacle组件6.NavMeshModifler组件三、效果总结前言 Unity是一款强大的游戏开发引擎，而人工智能&a…

阅读更多...

ssm网上订餐管理系统开发mysql数据库web结构java编程计算机网页源码eclipse项目采用线性算法

ssm网上订餐管理系统开发mysql数据库web结构java编程计算机网页源码eclipse项目采用线性算法

一、源码特点 ssm 网上订餐管理系统是一套完善的信息系统，结合springMVC框架完成本系统，对理解JSP java编程开发语言有帮助系统采用SSM框架（MVC模式开发），系统具有完整的源代码和数据库，系统主要采用B/S模…

阅读更多...

移动端开发思考:Uniapp的上位替代选择

移动端开发思考:Uniapp的上位替代选择

文章目录前言跨平台开发技术需求技术选型uniappFlutterMAUIAvalonia安卓原生 Flutter开发尝试Avalonia开发测试测试项目新建项目代码MainViewMainViewModel 发布/存档 MAUI实战，简单略过打包和Avalonia差不多总结前言作为C# .NET程序员，我有一些移动…

阅读更多...

C++优先队列——priority_queue，函数对象，labmda表达式，pair等

C++优先队列——priority_queue，函数对象，labmda表达式，pair等

头文件：#include<queue> 内部使用堆来实现，在需要或得最大的几个值或最小的几个值而不关心整个数组的顺序时非常好用。用法： priority_queue<int, vector<int>, greater<int>>q; 第一个参数为堆中存储的元素。 …

阅读更多...

Jmeter调用测试片段 —— 模块控制器

Jmeter调用测试片段 —— 模块控制器

可以使用模块控制器调用测试片段。模块控制器提供了一种在运行时将测试片段替换为当前测试计划的机制。测试片段可以位于任何线程组中。 1、打开一个Jmeter窗口，添加好线程组、用户定义变量、模块控制器、测试片段、察看结果树。 2、用户定义变量同样定义好访问ip及…

阅读更多...

linux离线安装jenkins及使用教程

linux离线安装jenkins及使用教程

本教程采用jenkins.war的方式离线安装部署，在线下载的方式会遇到诸多问题，不宜采用一、下载地址地址：Jenkins download and deployment 下载最新的长期支持版由于jenkins使用java开发的，所以需要安装的linux服务器装有jdk环…

阅读更多...

对话 Mines of Dalarnia： Web3 游戏创新，社区驱动与公链共建

对话 Mines of Dalarnia： Web3 游戏创新，社区驱动与公链共建

作者：stellafootprint.network 嘉宾：Manfred Pack，Mines of Dalarnia 游戏开发总监采访者：Alex Cooper，Footprint Analytics 北美社区与 BD 负责人在区块链游戏领域，去中心化和玩家经济正在颠覆传统游戏…

阅读更多...

3D模型格式转换案例 | CDM Tech如何应用HOOPS Exchange提升AR产品性能？

自2016年成立以来，CDM Tech一直致力于为汽车行业设计度量产品和提供其他解决方案，以满足主要的德国本土汽车制造巨头的需求。然而，随着时间的推移，他们开始将目光转向增强现实（AR）技术，并最终将…

阅读更多...

【C语言】宏定义

【C语言】宏定义

1. 预定义符号 C语言设置了一些预定符号，可以直接使用，预定义符号也是在预处理期间处理的。 __FILE__ //进⾏编译的源⽂件 __LINE__ //⽂件当前的⾏号 __DATE__ //⽂件被编译的⽇期 __TIME__ //⽂件被编译的时间 __STDC__ //如果编译器遵循ANSI C&…

阅读更多...

Convex and Semi-Nonnegative Matrix Factorizations

Convex and Semi-Nonnegative Matrix Factorizations

我们提出了非负矩阵分解（NMF）主题的几种新变体。考虑形式为X FG^T的因子分解，我们关注的是G被限制为包含非负元素的算法，但允许数据矩阵X具有混合符号，从而扩展了NMF方法的适用范围。我们还考虑了基向量F被约束为数据…

阅读更多...

电脑突然死机怎么办?

电脑突然死机怎么办?

死机是电脑常见的故障问题，尤其是对于老式电脑来说，一言不合电脑画面就静止了，最后只能强制关机重启。那么你一定想知道是什么原因造成的吧，一般散热不良最容易让电脑死机，还有系统故障，比如不小心误删了系…

阅读更多...

Mini-Gemini: Mining the Potential of Multi-modality Vision Language Models

Mini-Gemini: Mining the Potential of Multi-modality Vision Language Models

Mini-Gemini: Mining the Potential of Multi-modality Vision Language Models 相关链接：arxiv 关键字：Vision Language Models、Multi-modality、High-Resolution Visual Tokens、High-Quality Data、VLM-guided Generation 摘要在这项工作中&#x…

阅读更多...

【使用matlab绘制音频数据的时域图和频域图】

【使用matlab绘制音频数据的时域图和频域图】

使用matlab绘制音频数据的时域图和频域图虚拟的数据集见附件一、读取数据并设置参数 close all;clear all;colordef black 设置参数 filedir D:\Projects\MATLAB\data name 2024-03-28.txt % disp(filedir);Fs 8192; %采样率，即单位时间的样本个数&#xff…

阅读更多...

设计模式-设配器模式

设计模式-设配器模式

目录 🎊1.适配器模式介绍 🎃2.适配器类型 🎏3.接口适配器 🎐4.类的适配器 🎎5.优缺点 1.适配器模式介绍适配器模式（Adapter Pattern）是作为两个不兼容的接口之间的桥梁。这种类型的设…

阅读更多...

解码“零信任”，如何带来信任感？

解码“零信任”，如何带来信任感？

零信任的“信任”来源，并非凭空而生，而是建立在严格、细致且持续的验证、策略之上。它不仅能够提升企业的安全防护能力，也在加速安全技术的创新与演进。推动创新零信任理念激活网络安全身份和访问管理革新。零信任理念“永不信任&#…

阅读更多...

OpenHarmony实战开发-List组件的使用之设置项

OpenHarmony实战开发-List组件的使用之设置项

介绍在本篇CodeLab中，我们将使用List组件、Toggle组件以及Router接口，实现一个简单的设置页，点击将跳转到对应的详细设置页面。效果图如下： 相关概念 CustomDialog：CustomDialog装饰器用于装饰自定义弹窗。List&…

阅读更多...

$Machine Learning机器学习之统计分析$

Machine Learning机器学习之统计分析

目录前言机器学习之统计分析统计学的主要目标包括： 统计学核心概念： 统计基础： 训练误差： 常见的损失函数： 正则化和交叉验证博主介绍：✌专注于前后端、机器学习、人工智能应用领域开发的优质创作者、秉…

阅读更多...

uniApp使用XR-Frame创建3D场景(3)光源投影的运用。

uniApp使用XR-Frame创建3D场景(3)光源投影的运用。

上一篇讲解了如何在uniApp中创建xr-frame子组件并创建简单的3D场景。这篇我们讲解光源在场景中的运用以及相关属性。在子组件 xr-start的index.wxml文件中我们加入如下代码 <xr-scene render-system"alpha:true" bind:ready"handleReady"><xr…

阅读更多...

最新文章

推荐文章