报名丨Computer useVoice Agent :使用 TEN 搭建你的 Mac Assistant

在这里插入图片描述

与 TEN 相聚在「LET’S VISION 2025」大会,欢迎来展位上跟我们交流。这次我们还准备了一场聚焦「computer use」的工作坊,功能新鲜上线,线下首波体验!

📅 TEN 展位:2025年3月1日-2日

TEN workshop:2025年3月2日 13:30开始

📍 上海浦东鲜花港

TEN Framework 是一个主流对话式 Voice Agent 开源框架。基于 TEN 框架构建的实时对话 AI 引擎 TEN Agent,为开发者提供快速、高效的工具来构建实时对话式 AI Agent,以提供低延时、可打断的交互体验。

目前已集成 Deepseek、Gemini 2.0、OpenAI Realtime、RTC 等多种模型及组件,同时适配 Dify、Coze 主流编排工具。

项目地址
github.com/TEN-framework/TEN-Agent

往期文章

使用 TEN Agent+Deepseek 快速搭建语音助手

这场工作坊将带领大家尝试搭建自己的「Jarvis」,用语音来控制 Mac 操作。

工作坊适合人群

本课程面向具备一定编程基础的开发者:

• 会用命令行、git 和 docker;

• 需熟悉 macOS 基础开发知识;

• TEN 支持使用 C++、Go、Python 开发,有python/web开发经验者佳。

工作坊目标

TEN 是一个可方便开发 Voice Agent 的开源框架,本次工作坊将带领大家尝试搭建自己的「Jarvis」,用语音来控制 Mac 操作。

• 了解搭建 Voice Agent 的基本框架。

硬件与软件准备

硬件要求:

• 电脑。

软件要求:

• 提前下载安装 docker 和 docker compose;

我们会提供如下key:

• agora RTC key;

• LLM/TTS key。

阅读资料

• TEN 的Github仓库:

https://github.com/TEN-framework/TEN-Agent;

• 可预先体验 TEN Agent demo:

https://agent.theten.ai/

工作坊安排

基于 TEN 的 Computer use 实践(0.5小时)

实战:使用 TEN 搭建你的 Mac Assistant(2-3.5小时)

阶段一:了解熟悉 TEN 框架基础开发逻辑;

阶段二:在 Mac 上本地部署 Mac Assistant demo,使用 TEN Agent 控制你的 Mac 操作;

阶段三:高级挑战,自定义 tool,为 Mac Assistant 添加新的功能。

报名

1.报名工作坊需要预先购买大会门票(持有 BOOTH PASS 展区门票无法报名工作坊),RTE开发者社区 专属门票优惠 购买请扫描下方二维码。

在这里插入图片描述

2.拥有大会门票后,扫描下方二维码报名,选择“Computer Use & Voice Agent Practice: Build Your Mac Assistant with TEN”场次的工作坊”。名额有限,先到先得。

在这里插入图片描述

在这里插入图片描述

更多 Voice Agent 学习笔记:

多模态 AI 怎么玩?这里有 18 个脑洞

AI 重塑宗教体验,语音 Agent 能否成为突破点?

对话 TalktoApps 创始人:Voice AI 提高了我五倍的生产力,语音输入是人机交互的未来

2024,语音 AI 元年;2025,Voice Agent 即将爆发丨年度报告发布

对话谷歌 Project Astra 研究主管:打造通用 AI 助理,主动视频交互和全双工对话是未来重点

这家语音 AI 公司新融资 2700 万美元,并预测了 2025 年语音技术趋势

语音即入口:AI 语音交互如何重塑下一代智能应用

Gemini 2.0 来了,这些 Voice Agent 开发者早已开始探索……

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/18116.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

日常故障排查 - Linux常用命令

系统负载相关 top命令 使用top命令可以查看正在运行的系统中的动态实时视图信息,显示系统摘要信息,以及Linux内核当前正在管理的任务列表。其支持静态输出,也支持交互式输出,还可以在启动之前读取响应的配置文件来决定如何显示进…

C++算法竞赛基础语法-9

快速排序是一种高效的排序算法,由C. A. R. Hoare在1960年提出,基本思想是分治法(Divide and Conquer)策略,通过递归将一个大问题分解为若干个较小的子问题,然后合并这些子问题的解来解决原始问题 快速排序…

如何在 Elasticsearch 中设置向量搜索 - 第二部分

作者:来自 Elastic Valentin Crettaz 了解如何在 Elasticsearch 中设置向量搜索并执行 k-NN 搜索。 本文是三篇系列文章中的第二篇,深入探讨了向量搜索(也称为语义搜索)的复杂性以及它在 Elasticsearch 中的实现方式。 第一部分重…

【算法专场】哈希表

目录 前言 哈希表 1. 两数之和 - 力扣(LeetCode) 算法分析 算法代码 面试题 01.02. 判定是否互为字符重排 ​编辑算法分析 算法代码 217. 存在重复元素 算法分析 算法代码 219. 存在重复元素 II 算法分析 算法代码 解法二 算法代码 算法…

cpu温度多少正常?cpu温度过高怎么办

CPU温度是指中央处理器的工作温度,它是影响电脑性能和稳定性的重要因素。如果CPU温度过高,会导致电脑卡顿、死机、自动关机、甚至损坏CPU。因此,了解CPU温度的正常范围和降温的方法,对于保护电脑和提高效率是非常有必要的。 一、C…

Git指南-从入门到精通

代码提交和同步命令 流程图如下: 第零步: 工作区与仓库保持一致第一步: 文件增删改,变为已修改状态第二步: git add ,变为已暂存状态 bash $ git status $ git add --all # 当前项目下的所有更改 $ git add . # 当前目录下的所有更改 $ g…

盛铂科技 SCP4006/4018/4040:国产袖珍式功率计 射频微波功率探头 平均功率计

在通信、电子测量等领域,功率计是确保信号稳定、系统高效运行的关键设备。盛铂科技自主研发的 SCP4000 系列自带 USB 接口的袖珍式 CW 信号平均功率计,以其卓越的性能、高性价比和便捷的操作,在众多同类产品中脱颖而出,成为行业内…

IntelliJ IDEA 2024.1.4版无Tomcat配置

IntelliJ IDEA 2024.1.4 (Ultimate Edition) 安装完成后,调试项目发现找不到Tomcat服务: 按照常规操作添加,发现服务插件中没有Tomcat。。。 解决方法 1、找到IDE设置窗口 2、点击Plugins按钮,进入插件窗口,搜索T…

【个人开发】deepseed+Llama-factory 本地数据多卡Lora微调

文章目录 1.背景2.微调方式2.1 关键环境版本信息2.2 步骤2.2.1 下载llama-factory2.2.2 准备数据集2.2.3 微调模式2.2.4 微调脚本 2.3 踩坑经验2.3.1 问题一:ValueError: Undefined dataset xxxx in dataset_info.json.2.3.2 问题二: ValueError: Target…

SEO短视频矩阵系统源码开发概述

一、功能特性 多账号、多平台一键授权管理:该系统支持抖音、快手、小红书、B站和视频号等平台的账户集成,实现统一管理。批量视频发布及定时发布功能:用户能够通过系统进行大规模视频的批量上传和设定具体发布时间。AI混剪技术生成原创内容&…

Linux 服务器部署deepseek

把手教你在linux服务器部署deepseek,打造专属自己的数据库知识库 正文开始 第一步:安装Ollama 打开官方网址:https://ollama.com/download/linux 下载Ollama linux版本 复制命令到linux操作系统执行 [rootpostgresql ~]# curl -fsSL http…

DeepSeek-VL2 环境配置与使用指南

DeepSeek-VL2 环境配置与使用指南 DeepSeek-VL2 是由 DeepSeek 公司开发的一种高性能视觉-语言模型(VLM)。它是 DeepSeek 系列多模态模型中的一个版本,专注于提升图像和文本之间的交互能力。 本文将详细介绍如何配置 DeepSeek-VL2 的运行环…

EasyRTC轻量级SDK:智能硬件音视频通信资源的高效利用方案

在智能硬件这片广袤天地里,每一份资源的精打细算都关乎产品的生死存亡。随着物联网技术的疾速演进,实时音视频通信功能已成为众多设备的标配。然而,硬件资源的捉襟见肘,让开发者们常常陷入两难境地。EasyRTC,以它的极致…

Github Action自动流翻译README文档【CI/CD】

翻译自述文件操作 一、自述文件翻译 英语简体中文繁体中文印地语法语阿拉伯 GitHub Action 将自述文件翻译成任何语言 这是一个 GitHub Action,可以自动将你的 repo 中的自述文件翻译成指定的语言。 二、设置 添加工作流文件到您的项目(例如.githu…

张弛语言课退费动漫配音与人物的深度剖析退费

在动漫的奇幻世界里,精彩的画面固然吸睛,而配音更是赋予角色灵魂的关键要素,它与人物之间存在着千丝万缕的紧密联系。 《火影忍者》中的鸣人,他的配音充满活力与朝气,声音高亢且坚定,将鸣人的热血、乐观和…

Nginx负载均衡

一。Nginx负载均衡的算法以及过程 二。nginx四层负载均衡的配置(四层) 1.vi /etc/nginx/conf.d/lb.conf 比较常见:weight:设置权重,backup:当其他主机全部用不了,这个作为备份 2.systemctl r…

Python爬虫实战:股票分时数据抓取与存储 (1)

在金融数据分析中,股票分时数据是投资者和分析师的重要资源。它能够帮助我们了解股票在交易日内的价格波动情况,从而为交易决策提供依据。然而,获取这些数据往往需要借助专业的金融数据平台,其成本较高。幸运的是,通过…

json-schema 的编辑器

最近在找一个 json-schema 的编辑器,在网上找了找,以下两个项目用的比较多 一、两款json-schema-editor 1、vue-json-schema-editor-visual 一个高效易用的基于 Vue Element UI 的 json-schema 编辑器。 git地址:https://github.com/gis…

记一次Self XSS+CSRF组合利用

视频教程在我主页简介或专栏里 (不懂都可以来问我 专栏找我哦) 目录:  确认 XSS 漏洞 确认 CSRF 漏洞 这个漏洞是我在应用程序的订阅表单中发现的一个 XSS 漏洞,只能通过 POST 请求进行利用。通常情况下,基于 POST 的…

API网关基础知识总结

什么是网关? 微服务背景下,一个系统被拆分为多个服务,但是像安全认证,流量控制,日志,监控等功能是每个服务都需要的,没有网关的话,我们就需要在每个服务中单独实现,这使…