python虚拟数字人直播间带货

本开源项目名为“数字人控制器”。意为,本项目可以充当时下流行的虚拟人、虚拟主播、数字人,等仿人形数字形象的内核部分。

​ 使用UE、C4D、DAZ、LIVE2D等三维引擎软件开发的数字形象可以与本“数字人控制器”对接,从而实现虚拟主播、数字导游、数字助手等。我们提供UE4对接的demo,但我们更鼓励用户自行实现喜欢的数字形象。

​ 当然,若不考虑外观形象的话,本“数字人控制器”其实也可以独立使用的,可以充当一个语音助理。NLP可以自由切换AIUI、ChatGPT及Yuan1.0。

目前最新版本是2.0。在新版本里我们提出一个全新的架构。在这个架构下每个人都可以把Fay控制器搭建在自己个人电脑上(未来,或许我们会提供终端),让你电脑成为你数字助理的载体。你的所有设备(手表、手机、眼镜、笔记本)随时可以与你的数字助理通讯,数字助理将通过电脑为你处理数字世界里的所有事情。(贾维斯?Her?) 

2023.02: 1、提供chatgpt及yuan1.0作为选择。

2023.01: 1、控制器pc内网穿透,音频输入输出设备远程直连; 2、提供android 音频输入输出工程示例代码; 3、提供python音频输入输出工程示例代码(远程PC、树莓派等可用); 4、补传1.0语音指令音乐播放模块(暂不支持远程播放); 5、重构及补充若干工具模块:websocket、多线程、缓冲器、音频流录制器等; 6、修复1.x版本的多个bug; 7、集成看板娘;

2022.12: 1、上传bin目录(用于直播互动);

2022.11: 1、更新抖音直播获取粉丝互动数据的xpath;

2022.10.27: 1、更新mac上的麦克风参数; 2、解决mac上无法重启问题; 3、上传brew安装脚本。

2022.10.17: 1、更新语音指令; 2、补充人设语法;

语音指令

  • 关闭核心 关闭 再见 你走吧
  • 静音 静音 闭嘴 我想静静
  • 取消静音 取消静音 你在哪呢? 你可以说话了
  • 播放歌曲(暂不能用需更换音乐库) 播放歌曲 播放音乐 唱首歌 放首歌 听音乐 你会唱歌吗?
  • 暂停播放 暂停播放 别唱了 我不想听了

环境

  • Python 3.8.0 +

  • Chrome 浏览器 (若不开启直播功能,可跳过)

安装

安装依赖

pip install -r requirements.txt

配置 ChromeDriver (若不开启直播功能,可跳过)

  1. Chrome 浏览器进入 chrome://settings/help 查看当前版本
  2. 下载对应版本 ChromeDriver
  3. 解压zip并拷贝至 ./bin 目录
  4. 编辑 system.conf 配置 ChromeDriver 路径

配置应用密钥

  1. 查看 AI 模块

  2. 浏览链接,注册并创建应用,将应用密钥填入 ./system.conf 中

启动

启动数字人图像控制器

python main.py

图形界面

人设

数字人属性,与用户交互中能做出相应的响应。

交互灵敏度

在交互中,数字人能感受用户的情感,并作出反应。最直的体现,就是语气的变化,如 开心/伤心/生气 等。

设置灵敏度,可改变用户情感对于数字人的影响程度。

接收来源

抖音

填入直播间地址,实现与直播间粉丝交互

麦克风

选择麦克风设备,实现面对面交互,成为你的伙伴

socket远程音频输入

可以接入远程音频输入,远程音频输出

商品栏

填入商品介绍,数字人将自动讲解商品。

当用户对商品有疑问时,数字人可自动跳转至对应商品并解答问题。

配合抖音接收来源,实现直播间自动带货。

AI 模块

启动前需填入应用密钥system.conf

代码模块描述链接
./ai_module/ali_nls.py阿里云 实时语音识别实时语音识别_语音转文字_实时会议记录_人工智能-阿里云
./ai_module/ms_tts_sdk.py微软 文本转语音 基于SDK文本转语音 – 真实 AI 语音生成器 | Microsoft Azure
./ai_module/xf_ltp.py讯飞 情感分析情感分析 - 自然语言处理 - 讯飞开放平台
./utils/ngrok_util.pyngrok.cc 外网穿透(可选)http://ngrok.cc
./ai_module/yuan_1_0.py浪潮源大模型(NLP 3选1)源1.0-超大规模预训练模型-浪潮信息
./ai_module/chatgpt.pyChatGPT(NLP 3选1)*******
./ai_module/xf_aiui.py讯飞自然语言处理(NLP 3选1)AIUI开放平台

与远程音频输入输出设备连接(非必须,外网需要配置http://ngrok.cc ngrok tcp通道的clientid)

控制器与采用 socket(非websocket) 方式与 音频输出设备通讯

内网通讯地址: ws://127.0.0.1:10001

外网通讯地址: 通过http://ngrok.cc获取

消息格式: 参考 remote_audio.py

与数字形象通讯(非必须,控制器需要关闭“面板播放”)

控制器与采用 WebSocket 方式与 UE 通讯

通讯地址: ws://127.0.0.1:10002(已接通)

消息格式: 查看 WebSocket.md

目录结构

.
├── main.py					# 程序主入口
├── fay_booter.py			# 核心启动模块
├── config.json				# 控制器配置文件
├── system.conf				# 系统配置文件
├── ai_module
│   ├── ali_nls.py			# 阿里云 实时语音
│   ├── ms_tts_sdk.py       # 微软 文本转语音
│   ├── xf_aiui.py          # 讯飞 人机交互-自然语言处理
│   └── xf_ltp.py           # 讯飞 性感分析
├── bin                     # 可执行文件目录
├── core                    # 数字人核心
│   ├── fay_core.py         # 数字人核心模块
│   ├── recorder.py         # 录音器
│   ├── tts_voice.py        # 语音生源枚举
│   ├── viewer.py           # 抖音直播间接入模块
│   └── wsa_server.py       # WebSocket 服务端
├── gui                     # 图形界面
│   ├── flask_server.py     # Flask 服务端
│   ├── static
│   ├── templates
│   └── window.py           # 窗口模块
├── scheduler
│   └── thread_manager.py   # 调度管理器
└── utils                   # 工具模块├── config_util.py      ├── storer.py└── util.py

项目下载地址:https://download.csdn.net/download/zxj19880502/87459025 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/37828.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

怎么用Elai智能数字人来直播带货?

随着直播带货的火爆,越来越多的商家和品牌想要借助这一新兴的营销方式来提升销量和品牌影响力。但是,直播带货也面临着一些挑战,比如真人主播的成本高、稳定性差、风险大等。那么,有没有一种更好的解决方案呢?Elai智能…

AifbdScore智能AI曲谱乐谱播放识别SDK midi曲谱 应用开发 五线谱 六线谱 四线谱播放

【功能介绍】 会发声的曲谱 移调或改变谱号内置合成器可以在选定节拍速度下播放全部或是单一范例乐器。 访问曲谱的图形音乐信息全部演奏数据使用迭代器获取已排序的小节和音符,包含MIDI音高、毫秒计时的开始和音长、节拍速度、拍号等等,小节被正确排序…

全民K歌下载伴奏(tkm格式转化)

已《キセキ》为例 1.在全民K歌选择自己想要的伴奏,只要加载好了之后就可以找到缓存文件。 2.在手机找到缓存 3.如图,图中两个tkm格式文件一个是原版,一个是伴奏。接下来就是转换格式问题。 4.根据我经验,au不支持tkm格式&#xf…

tt作曲家简谱打谱软件_掌握作曲家的技巧和窍门

tt作曲家简谱打谱软件 Composer has revolutionized package management in PHP. It upped the reusability game and helped PHP developers all over the world generate framework agnostic, fully shareable code. But few people ever go beyond the basics, so this post…

html5 midi,源码:MIDI 文件生成音乐乐谱(Midi To Sheet Music)

MIDI 文件生成音乐乐谱 资源下载此资源下载价格为2D币,请先登录 资源文件列表 MidiToSheetMusic-master/LICENSE.txt , 18520 MidiToSheetMusic-master/Makefile , 1181 MidiToSheetMusic-master/README.md , 1129 MidiToSheetMusic-master/img/NotePair.ico , 26918 MidiToSh…

android切换原唱伴唱,切换伴奏和原声/设置KTV播放列表

三、 灵活切换伴奏和原声 当酷我音乐盒开始播放歌曲的KTV后,切换到“正在播放”窗口就可以欣赏到原版的KTV画面了,默认情况下播放的是原人原唱。如果要切换到伴奏声道,唱卡拉OK时,在播放窗口下方有一个“伴唱”按钮,点…

Guitar Pro8.0.1吉他制谱打谱软件

Guitar Pro是一款专业的吉他编曲、打谱软件,Guitar pro的特点是它几乎涵盖了所有的乐谱形式,包括四线谱、五线谱、六线谱等等,最新的Guitar Pro8.1版本还新增了简谱,我们可以在GuitarPro8.1中使用简谱进行演奏。Guitar pro支持在制…

在线乐谱协作编辑器composing.studio

什么是 composing.studio ? composing.studio 是使用 Rust、WebAssembly 和 TypeScript 构建的在线实时协作音乐编辑器,采用了 ABC 记谱法,允许任何人创建简单的音乐作品,具有即时乐谱渲染和实时音频播放。任何人都可以通过创建一…

【高效便捷】乐谱格式转换器,让你的曲谱全都在线!

如果你是一位音乐人,那么一定会遇到需要在不同终端或软件之间转换乐谱格式的情况。乐谱格式转换器作为一款桌面端软件,支持各种乐谱格式之间的互转,而且它还有以下特点: 1.超全功能:乐谱格式转换器是一款图形化界面的…

通过线路输入功能快速创建吉他谱

通过线路输入功能快速创建吉他谱 关键词:GTP;吉他软件 Guitar Pro 是一款功能强大的乐谱演奏和制作神器,它能帮助我们学习和演奏歌曲,提高弹唱技术,为我们喜欢的歌曲制作伴奏等等。它有多种方式供我们制作曲谱&#…

AI智能曲谱识别|乐谱识别识音SDK|人声数拍SDK|智能钢琴、MIDI音乐、打谱、曲谱乐谱播放识别SDK、音序器、合成器、播放器软件

智域智联科技致力于用“智能化教学 音乐软件模块”及“在线教育AiScore 平台”赋能传统音乐教育,使音乐教 育机构智能化教育转型成为可能。 AifbdScore是一个跨平台的声音识别和评 测库,运用人工智能深度学习算法采集各 种乐器不同音高的时域、频域特征训…

Overture打谱软件免费安装下载版介绍

现在市面上的打谱软件越来越多,选择哪一个成为了最头疼的问题。一千个人心中有一千个个哈姆雷特。我们只有根据自己的需求,通过多方面的比较才能选出最适合自己的那一个。 Overture (一)排版 我们打开一份MIDI格式乐谱 这是没有…

只需 1 分钟,这个网站用 AI 分离歌曲的人声、伴奏和乐器声

整理:Just 出品:AI科技大本营(ID:rgznai100) 疫情期间,在家待着闲来无事,一些技术人员就喜欢以技术的方式找点乐子,顺带赚钱最好了。 将歌曲中的人声和乐器声分离是一件让想使用音乐伴奏的人头疼…

【音乐生成】乐谱生成

文章目录 介绍与研究动机数据集方法实验结果 介绍与研究动机 论文链接:AN EXPLORATION OF GENERATING SHEET MUSIC IMAGES 传统的音乐生成任务的输出格式以MIDI、WAV为主,本文研究的格式却是乐谱,那么乐谱形式的音乐相较MIDI格式的音乐有哪些…

宠物喂食器,基于涂鸦智能的解决方案

宠物喂食器,基于涂鸦智能的解决方案 作品描述作品介绍硬件部分软件部分 开发流程代码编写1. 产品创建2. MCU SDK 移植3. 时间系统实现4. 快速喂食功能实现5. 余粮检测功能6. 已出粮剩余量检测功能7. 计划喂食功能实现8. 手动喂食功能实现9. 小夜灯功能实现10. 语音控…

读书笔记——《2001太空漫游》

阿瑟克拉克神作,任何一个科幻迷都绕不开的一部作品。很早就听说过其大名,因为之前看过电影版的,总感觉少了点新鲜感,这本书就一直在书架上没有拿出来看。但是看过这本书后,我可以很负责任的说,全书都充满新…

仿PC端小红书主页

前端基础阶段 用原生的html和css来写页面是几乎每个初学前端的人第一次接触前端做的事,写出一个好看的前端页面也能让你成就感爆棚,小红书界面用视频做背景看起来高大上其实也是非常简单的几句代码能搞定的具体的如下 小红书页面详情 仿小红书页面,用纯…

chatgpt赋能python:Python海龟图:如何将海龟进行编程,并让它转起来

Python海龟图:如何将海龟进行编程,并让它转起来 Python中的海龟图(Turtle Graphics)是一种基本的图形绘制方法。通过编写Python代码,我们可以控制“海龟”来画出我们需要的任何图形。本文将介绍如何使用Python海龟图绘制旋转的图形&#xff…

TCP通信客户端和服务器端网络编程

一 客户端和服务器端通信的步骤 二 TCP通信的客户端网络编程 TCP协议是严格区分客户端和服务器端的 1. TCP通信的客户端 向服务器端发送连接请求给服务器端发送数据读取服务器端回写的数据 2. 在Java中,提供了java.net包下的Socket类来表示客户端。Socket也叫&q…

收发Hotmail和Yahoo邮件

Hotmail和Yahoo作为国际性的电子邮箱提供商,凭借着完全免费的服务策略和优良的稳定性吸引了大量的用户。可是无法直接用Foxmail等邮件客户端软件收发Hotmail和Yahoo邮箱中的邮件也一直是一个困扰大家的问题。其实,只要进行一些必要的设置,我们…