Fay数字人助理版是fay开源项目的重要分支,专注于构建智能数字助理的开源解决方案。它提供了灵活的模块化设计,使开发人员能够定制和组合各种功能模块,包括情绪分析、NLP处理、语音合成和语音输出等。

Fay数字人助理

Fay数字人助理版是fay开源项目的重要分支,专注于构建智能数字助理的开源解决方案。它提供了灵活的模块化设计,使开发人员能够定制和组合各种功能模块,包括情绪分析、NLP处理、语音合成和语音输出等。Fay数字人助理版为开发人员提供了强大的工具和资源,用于构建智能、个性化和多功能的数字助理应用。通过该版本,开发人员可以轻松创建适用于各种场景和领域的数字人助理,为用户提供智能化的语音交互和个性化服务。

推荐玩法

灵聚NLP api(支持GPT3.5及多应用):Fay数字人集成灵聚NLP api(支持GPT3.5及多应用)_哔哩哔哩_bilibili

集成本地唇型算法:fay数字人助理更新本地唇型算法发布(含新版UE5工程示例)_哔哩哔哩_bilibili

给数字人加上眼睛(集成yolo+VisualGLM):B站视频

给Fay加上本地免费语音识别(达摩院funaar): 给Fay加上本地免费语音识别(达摩院funaar)_哔哩哔哩_bilibili

消费级pc大模型(ChatGLM-6B的基础上前置Rasa会话管理):动手给fay(github数字人开源项目)加上rasa及chatglm:兼顾实时、可控、记忆及大模型的生成能力_哔哩哔哩_bilibili

UE5工程:https://github.com/xszyou/fay-ue5

真人视频三维重建(NeRF):https://github.com/waityousea/xuniren

Fay数字人助理版

注:带货版移到分支fay-sales-edition

助理版Fay控制器使用:语音沟通,语音和文字回复;文字沟通,文字回复。

PC远程助理 PC demo

手机远程助理 android demo

与数字形象通讯(非必须,控制器需要关闭“面板播放”)

控制器与采用 WebSocket 方式与 UE 通讯

下载工程: 百度网盘 请输入提取码

下载windows运行包: 百度网盘 请输入提取码

工程:https://github.com/xszyou/fay-ue5

重要:

Fay(服务端)与数字人的通讯接口: ws://127.0.0.1:10002(已接通)

消息格式: 查看 WebSocket.md

与远程音频输入输出设备连接(非必须,外网需要配置http://ngrok.cc tcp通道的clientid)

控制器与采用 socket(非websocket) 方式与 音频输出设备通讯

内网通讯地址: ws://127.0.0.1:10001

外网通讯地址: 通过http://ngrok.cc获取(有伙伴愿意赞助服务器给社区免费使用吗?)

 消息格式: 参考 remote_audio.py

二、Fay控制器核心逻辑

注:

以上每个模块可轻易替换成自家核心产品。

目录结构

.
├── main.py					# 程序主入口
├── fay_booter.py			# 核心启动模块
├── config.json				# 控制器配置文件
├── system.conf				# 系统配置文件
├── ai_module
│   ├── ali_nls.py			# 阿里云 实时语音
│   ├── ms_tts_sdk.py       # 微软 文本转语音
│   ├── nlp_lingju.py       # 灵聚 人机交互-自然语言处理
│   ├── xf_aiui.py          # 讯飞 人机交互-自然语言处理
│   ├── nlp_gpt.py          # gpt api对接
│   ├── nlp_chatgpt.py      # chat.openai.com逆向对接
│   ├── nlp_yuan.py         # 浪潮.源大模型对接
│   ├── nlp_rasa.py         # ChatGLM-6B的基础上前置Rasa会话管理(强烈推荐)
│   ├── nlp_VisualGLM.py    # 对接多模态大语言模型VisualGLM-6B
│   ├── yolov8.py           # yolov8资态识别
│   └── xf_ltp.py           # 讯飞 情感分析
├── bin                     # 可执行文件目录
├── core                    # 数字人核心
│   ├── fay_core.py         # 数字人核心模块
│   ├── recorder.py         # 录音器
│   ├── tts_voice.py        # 语音生源枚举
│   ├── authorize_tb.py     # fay.db认证表管理
│   ├── content_db.py       # fay.db内容表管理
│   ├── interact.py         # 互动(消息)对象
│   ├── song_player.py      # 音乐播放(暂不可用)
│   └── wsa_server.py       # WebSocket 服务端
├── gui                     # 图形界面
│   ├── flask_server.py     # Flask 服务端
│   ├── static
│   ├── templates
│   └── window.py           # 窗口模块
├── scheduler
│   └── thread_manager.py   # 调度管理器
├── utils                   # 工具模块├── config_util.py      ├── storer.py└── util.py
└── test                    # 都是惊喜

三、升级日志

2023.07.12:

  • 修复助理版文字输入不读取人设回复问题;
  • 修复助理版文字输入不读取qa回复问题;
  • 增强麦克风接入稳定性。

2023.07.05:

  • 修复无法运行唇型算法而导致的不播放声音问题。

2023.06.28:

  • 重构NLP模块管理逻辑,便于自由扩展;
  • gpt:拆分为ChatGPT及GPT、更换新的GPT接口、可单独配置代理服务器;
  • 指定yolov8包版本,解决yolo不兼容问题;
  • 修复:自言自语bug、接收多个待处理消息bug。

2023.06.21:

  • 集成灵聚NLP api(支持GPT3.5及多应用);
  • ui修正。

2023.06.17:

  • 集成本地唇型算法

2023.06.14:

  • 解决多声道麦克风兼容问题;
  • 重构fay_core.pyfay_booter.py代码;
  • ui适应布局调整;
  • 恢复声音选择;
  • ”思考中...“显示逻辑修复。

2023.05.27:

  • 修复多个bug:消息框换行及空格问题、语音识别优化;
  • 彩蛋转正,Fay沟通与ChatGPT并行
  • 加入yolov8姿态识别;
  • 加入VisualGLM-6B多模态单机离线大语言模型。

2023.05.12:

  • 打出Fay数字人助理版作为主分支(带货版移到分支fay-sales-edition);
  • 添加Fay助理的文字沟通窗口(文字与语音同步);
  • 添加沟通记录本地保存功能;
  • 升级ChatGLM-6B的应用逻辑,长文本与语音回复分离。

四、安装说明

环境

  • Python 3.9、3.10
  • Windows、macos、linux

安装依赖

pip install -r requirements.txt

配置应用密钥

  • 查看 AI 模块
  • 浏览链接,注册并创建应用,将应用密钥填入 ./system.conf 中

启动

启动Fay控制器

python main.py

AI 模块

启动前需填入应用密钥

代码模块描述链接
./ai_module/ali_nls.py实时语音识别(非必须,免费3个月,asr二选一)实时语音识别_语音转文字_实时会议记录_人工智能-阿里云
./ai_module/funasr.py达摩院开源免费本地asr (非必须,asr二选一)fay/test/funasr/README.MD
./ai_module/ms_tts_sdk.py微软 文本转情绪语音(非必须,不配置时使用免费的edge-tts)文本转语音 – 真实 AI 语音生成器 | Microsoft Azure
./ai_module/xf_ltp.py讯飞 情感分析情感分析 - 自然语言处理 - 讯飞开放平台
./utils/ngrok_util.pyngrok.cc 外网穿透(可选)http://ngrok.cc
./ai_module/nlp_lingju.py灵聚NLP api(支持GPT3.5及多应用)(NLP多选1)https://open.lingju.ai 需联系客服务开通gpt3.5权限
./ai_module/yuan_1_0.py浪潮源大模型(NLP 多选1源1.0-超大规模预训练模型-浪潮信息
./ai_module/chatgpt.pyChatGPT(NLP多选1)*******
./ai_module/nlp_rasa.pyChatGLM-6B的基础上前置Rasa会话管理(NLP 多选1)动手给fay(github数字人开源项目)加上rasa及chatglm:兼顾实时、可控、记忆及大模型的生成能力_哔哩哔哩_bilibili
./ai_module/nlp_VisualGLM.py对接VisualGLM-6B多模态单机离线大语言模型(NLP 多选1)B站视频

五、使用说明

使用说明

  • 语音助理:fay控制器(麦克风输入源开启、面板播放开启);
  • 远程语音助理:fay控制器(面板播放关闭)+ 远程设备接入;
  • 数字人互动:fay控制器(麦克风输入源开启、面板播放关闭、填写性格Q&A)+ 数字人;
  • 贾维斯、Her:加入我们一起完成。

语音指令

关闭核心静音取消静音
关闭、再见、你走吧静音、闭嘴、我想静静取消静音、你在哪呢、你可以说话了
播放歌曲(音乐库暂不可用)暂停播放更多
播放歌曲、播放音乐、唱首歌、放首歌、听音乐、你会唱歌吗暂停播放、别唱了、我不想听了没有了...

人设

数字人属性,与用户交互中能做出相应的响应。

交互灵敏度

在交互中,数字人能感受用户的情感,并作出反应。最直的体现,就是语气的变化,如 开心/伤心/生气 等。 设置灵敏度,可改变用户情感对于数字人的影响程度。

接收来源

文本输入

通过沟通窗口与助理文本沟通

麦克风

选择麦克风设备,实现面对面交互,成为你的伙伴

socket远程音频输入

可以接入远程音频输入,远程音频输出

相关文章:

1、集成消费级pc大模型(ChatGLM-6B的基础上前置Rasa会话管理):动手给fay(github数字人开源项目)加上rasa及chatglm:兼顾实时、可控、记忆及大模型的生成能力_哔哩哔哩_bilibili

2、(34条消息) 非常全面的数字人解决方案_郭泽斌之心的博客-CSDN博客_数字人算法

3、【开源项目:数字人FAY——Fay新架构使用讲解】 开源项目:数字人FAY——Fay新架构使用讲解_哔哩哔哩_bilibili

4、【开源项目FAY——UE工程讲解】Fay(github数字人开源项目):UE工程讲解_哔哩哔哩_bilibili

5、m1机器安装办法(Gason提供):MacBook Pro m1版本怎么安装python 的pyqt5? - 知乎

6、bilbil主页:xszyou的个人空间_哔哩哔哩_bilibili

商务联系QQ 467665317,我们提供:开发顾问、数字人模型定制及高校教学资源实施服务 开源做到底,周边赚外快 - fay数字人 - 雅恒论坛 - Powered by Discuz!

关注公众号(fay数字人)获取最新微信技术交流群二维码(请先star本仓库

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/55410.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGLM模型部署分享

ChatGPT云炬学长 ​关注 先看结果&#xff1a; 部署问题&#xff1a;显卡太小无法加载使用&#xff0c;期间也换了N个显卡&#xff0c;太穷了!>-< 模型描述&#xff1a; 清华开源项目ChatGLM-6B发布。这一项目可以直接部署在本地计算机上&#xff0c;无需联网即可让你…

UE5引擎入门,第一周总结:简单的旋转魔方小项目

基础知识总结 蓝图节点 1.蓝图中的节点是封装好的函数。这些函数功能强大&#xff0c;但由于数目繁多且内部实现不明&#xff08;注&#xff1a;可能是开发环境问题&#xff0c;转到C代码这一步永远无法执行&#xff09;&#xff0c;总会出现一些不明所以的bug&#xff08;比…

PS学习记录-矢量图和位图

目录 概念说明 矢量图 位图 常见的格式类型 矢量图文件格式举例&#xff1a; 位图&#xff08;标量图&#xff09;文件格式举例&#xff1a; 两种图片的适用范围 两种图片的核心差异 1、缩放保真 2、色彩不同 3、格式 4、常用绘图工具 5、占用空间 6、转化 概念说…

Unity中使用矢量图SVG

1.打开PackageManager 2.点击左上角的号&#xff0c;Add package from git URL 3.输入&#xff1a;com.unity.vectorgraphics 免费下SVG测试地址&#xff1a;https://undraw.co/illustrations

ArcMap将png图像矢量化

一、将png图像转成灰度图 图像为语义分割模型生成的二值索引图像&#xff0c;直接用cv2的灰度读取图像模式&#xff0c;然后再另存。 二、配准 首先在ArcGis中加载带有空间坐标的图像&#xff0c;这里选择的是测试图像对应的。&#xff08;加载图像可以直接拉着拖进来&#…

Android开发中使用矢量图

本文我们将介绍一些关于Android矢量图的相关知识点。最新的项目中要求以矢量图替代传统的.png资源文件&#xff0c;所以特意学习了一下Android中的矢量图相关概念&#xff0c;不得不说矢量图还是一个比较好的适配方案。Android从Android5.0开始引入了对矢量图的支持&#xff0c…

Android使用svg矢量图

可缩放矢量图形,SVG不会像位图一样因为缩放而让图片质量下降。 优点&#xff1a;节约空间与内存&#xff0c;常用于简单小图标 SVG 使用 XML 格式定义图形&#xff0c;标准svg根节点为<svg> 在Android中通过Vector实现对svg的支持&#xff0c;根节点为<vector>。 …

位图和矢量图转换工具推荐

相信做平面设计的大家&#xff0c;都遇到过素材是位图放大后不清晰的情况&#xff0c;十分影响设计的美观。而矢量图是根据几何特性来绘制图形&#xff0c;放大后图像不会失真。所以这篇文章教大家位图转矢量图。 一、使用CorelDRAW CorelDRAW是一款专业的平面设计软件,专注于…

将图片快速转换为矢量地图-半自动地图矢量化工具raster_tracer的使用方法

最近需要根据一幅jpeg地图绘制矢量地图&#xff0c;如果一点一点绘制太麻烦&#xff0c;又不想装庞大的arcgis用arcscan处理&#xff0c;查了些资料&#xff0c;发现深度学习在这方面也没啥进展。最后查到了QGIS有一款半自动地图矢量化工具raster_tracer可以解决这个问题&#…

关于 draw.io 矢量图 SVG 导出的研究

draw.io 是一个简单易用的图表 (diagram) 绘制工具 1, 可以用作一个简单的矢量图绘制工具, 画一些简单的图标或者流程图等等都很适合. 虽然好用, 但是在导出 *.drawio 文件为其他格式时, 大多数时候都需要额外注意. 导出设计时会遇到的问题及原因 对于 PNG 导出, 默认的设置…

【GlobalMapper精品教程】043:图片自动矢量化

本文讲解Globalmapper自动矢量化教程,配套案例数据。 参考教程:ArcGIS实验教程——实验三十三:ArcScan自动矢量化完整案例教程 文章目录 一、加载实验数据二、启动矢量化工具三、矢量化栅格四、矢量化结果五、注意事项一、加载实验数据 打开配套实验数据包中的data043.rar…

C#代码实现矢量画图

要实现C#代码画矢量图&#xff0c;其基本原理是先创建一个容器作为画板&#xff0c;然后创建Line(直线)、PolyLine(多段线)、Rectangle(矩形)或者Ellipse(椭圆)基本绘图对象生成各种矢量图形&#xff0c;最后把这些图形对象添加到画板中即可&#xff0c;一般用Canvas容器作为画…

matplotlib绘图并导出eps矢量图和svg矢量图

matplotlib导出矢量图并解决中文无法正常显示问题 做仿真经常需要输出各种矢量图用于论文插图&#xff0c;下面展示了导出eps矢量图和svg矢量图的方法&#xff1a; import numpy as np import matplotlib.pyplot as pltplt.rcParams[font.sans-serif] [SimHei] # 用来正常显…

知识库AI机器人客服(基于ChatGPT3.5)对接-唯一客服系统文档中心

此功能是利用chatgpt训练企业知识开发个性化客服系统&#xff0c;可以上传自有数据&#xff0c;基于向量数据库与OpenAI Embedding&#xff0c;以及OpenAI chat/completions接口&#xff0c;实现的基于自建知识库的ChatGPT AI客服功能 管理员创建集合 向量数据库集合&#xff0…

Lazada跨境卖家必备的精细化运营工具Ushop BI的智能化选品功能

东南亚跨境电商市场的不断发展壮大&#xff0c;使得东南亚市场成为了许多跨境商家的掘金圣地&#xff0c;而Lazada作为东南亚市场的两大跨境电商平台之一&#xff0c;其发展潜力是不容小觑的&#xff0c;许多商家入驻Lazada平台是希望可以在这里将店铺做大做好&#xff0c;那俗…

跨境电商选品重要吗?

选品很重要&#xff01; 跨境电子商务选择的核心要求&#xff1a;优质商品&#xff0c;价格优势&#xff0c;符合跨境销售特点&#xff0c;满足目标海外市场需求&#xff0c;突出自身特色竞争优势。 跨境电商是如何选择产品的&#xff1f; 这个问题也很流行&#xff0c;应该考虑…

注册kaggle帐号及kaggle绑定手机收不到验证码的问题

由于自己在这上面折腾了不少时间&#xff0c;故写下这篇博客&#xff0c;希望对大家有用。 一、注册kaggle帐号 点击进入kaggle网站 kaggle网站 1.点击sign in 2.如果有雅虎、google、facebook账户的话&#xff0c;是可以直接登录的。如果没有这些账户&#xff0c;就点击Reg…

解决新用户注册Kaggle无法显示验证码的问题

解决新用户注册Kaggle无法显示验证码的问题 老板近期要求做一个比赛&#xff0c;需要注册Kaggle账户&#xff0c;但是在注册界面会无法出现人机验证&#xff0c;在这里记录一下解决的过程&#xff1a; 1.注册无法验证 2.尝试插件解决 为了解决这个问题&#xff0c;我参考了很…

手机验证码接收注册新账户

在写注册的时候想使用手机号进行验证&#xff0c;用来保证用户的安全性操作&#xff0c;因为以前使用的是邮箱验证&#xff0c;太麻烦了。所以在网上找到了一个比较好的第三方提供短信送达服务&#xff0c;有的还需要企业用户认证&#xff0c;这里我选择的是网易云的短信服务。…

我看CHATGPT: 为啥谷歌掉了千亿美金

两个月前&#xff0c;我试着想用 ChatGPT 帮我写篇文章《eBPF 介绍》&#xff0c;结果错误百出&#xff0c;导致我又要从头改一遍&#xff0c;从那天我觉得 ChatGPT 生成的内容完全不靠谱&#xff0c;所以&#xff0c;从那天开始我说我不会再用 ChatGPT 来写文章&#xff08;这…