音视频进阶教程|如何实现游戏中的实时语音

1 游戏实时语音功能简介

1.1 游戏实时语音概念解释

  • 范围:收听者接收音频的范围。
  • 方位:指收听者在游戏世界坐标中的位置和朝向,详情可参考 5.5 初始化设置 中的“步骤 1”。
  • 收听者:房间内接收音频的用户
  • 发声者:房间内发送音频的用户。

1.2 游戏实时语音功能描述

ZEGO Express SDK 从 2.11.0 版本起,新增游戏语音模块,主要包括:范围语音、3D 音效、小队语音。适用于吃鸡类游戏、元宇宙类场景。

在吃鸡类游戏中,小队语音提供编队功能,在游戏开始前和开始后都可以更换小队,开发者无需关注流分组以及推拉流的实现,直接实现小队语音功能。

在吃鸡游戏和元宇宙场景中,提供 3D 音效能力,在收听发声者音效时,有方向感距离感,让场景感受更真实。

实现游戏中的范围语音

房间内的收听者对音频的接收距离有范围限制,若发声者与自己的距离超过该范围,则无法听到声音。为保证语音清晰,附近超过 20 人发声时,只能听到离自己最近的 20 个发声者的声音。

假如设置音频接收距离的最大范围为 R,若发声者离收听者的距离为 r,则:

a. 当 r < R 时,表示发声者在正常范围内,收听者可以听到声音。

b. 当 r ≥ R 时,表示发声者超出了最大范围,收听者无法听到声音。

下图仅以范围语音模式为“全世界”时为例,更多不同模式组合关系下的声音可达情况请参考 5.9 (可选)设置小队语音功能 中的“步骤 2”。

下载 (1).png

游戏实时音视频的3D音效

声音有 3D 空间感且按距离衰减。

游戏小队模式语音

玩家可以选择加入小队,并支持在房间内自由切换“全世界”模式、“仅小队”模式、“隐秘小队”模式。

  • 全世界:玩家可与队友互相通话,同时能与范围内同为全世界模式的玩家互相通话。
  • 仅小队:玩家只能与队友互相通话。
  • 隐秘小队:玩家可与队友互相通话,但只能单向接收范围内全世界模式的玩家的语音。

2 游戏范围语音功能-示例源码下载

请参考 下载示例源码 获取源码。

相关源码请查看 “/ZegoExpressExample/Examples/AdvancedAudioProcessing/RangeAudio” 目录下的文件。

3 游戏范围语音功能实现的前提条件

在实现范围语音之前,请确保:

  • 已在项目中集成 ZEGO Express SDK,实现基本的实时音视频功能,详情请参考 快速开始 - 集成 和 快速开始 - 实现视频通话。
  • 已在 ZEGO 控制台 创建项目,并申请有效的 AppID 和 AppSign,详情请参考 控制台 - 项目管理 中的“项目信息”。

4 范围语音实现的注意事项

使用范围语音功能时请务必关注如下注意事项,以免影响接入。

如果您已经使用 ZEGO Express SDK 的实时音视频功能,需要注意以下事项:

  • 由于范围语音功能模块是基于 ZegoExpressEngine 的推拉流接口功能来实现的,使用时无需关注推拉流的概念。在范围语音场景下,推音频流的概念转变为“开启麦克风”,拉音频流的概念转变为“开启扬声器”。建议您不要在接入范围语音功能的同时再使用 startPublishingStreamstartPlayingStream 接口做推拉流操作,避免效果冲突。

5 实时音视频-范围语音SDK的使用步骤

5.1 范围语音SDK创建引擎

调用 createEngine 接口,将申请到到 AppID 和 AppSign 传入参数 “appID” 和 “appSign”,创建引擎单例对象。引擎当前只支持同时创建一个实例,超出后将返回 null。

/** 定义 SDK 引擎对象 */
ZegoExpressEngine engine;ZegoEngineProfile profile = new ZegoEngineProfile();
/** 请通过官网注册获取,格式为 123456789L */
profile.appID = appID;
/** 64个字符,请通过官网注册获取,格式为"0123456789012345678901234567890123456789012345678901234567890123" */
profile.appSign = appSign;
/** 通用场景接入 */
profile.scenario = ZegoScenario.GENERAL;
/** 设置app的application 对象 */
profile.application = getApplication();
/** 创建引擎 */
engine = ZegoExpressEngine.createEngine(profile, null);

5.2 游戏语音创建范围语音模块

调用的 createRangeAudio 方法创建范围语音实例。

ZegoRangeAudio rangAudio = engine.createRangeAudio();
if (rangAudio == null) {printf("创建范围语音实例模块失败");
}

5.3 监听范围语音事件回调

可以根据需要调用 setEventHandler 接口为麦克风设置事件回调,用于监听麦克风的开启状态 onRangeAudioMicrophoneStateUpdate 通知。

// set range audio event handler
rangeAudio.setEventHandler(new IZegoRangeAudioEventHandler() {@Overridepublic void onRangeAudioMicrophoneStateUpdate(ZegoRangeAudio rangeAudio, ZegoRangeAudioMicrophoneState state, int errorCode) {super.onRangeAudioMicrophoneStateUpdate(rangeAudio, state, errorCode);AppLogger.getInstance().callApi("microphone state update. state: %s, errorCode: %d", state, errorCode);}
});

5.4 登录房间

传入用户 ID 参数 userID 和 userName 创建 ZegoUser 用户对象后,调用 loginRoom 接口,传入房间 ID 参数 roomID 和用户参数 user,登录房间。

  • 同一个 AppID 内,需保证 roomID 全局唯一。
  • 同一个 AppID 内,需保证 userID 全局唯一,建议开发者将其设置成一个有意义的值,可将 userID 与自己业务账号系统进行关联。
  • userID 与 userName 不能为空,否则会导致登录房间失败。
/** 创建用户 */
ZegoUser user = new ZegoUser("user1");/** 开始登录房间 */
engine.loginRoom("room1", user);

当用户已成功登录房间后,如果应用异常退出,在重启应用后,开发者需先调用 logoutRoom 接口退出房间,再调用 loginRoom 接口重新登录房间。

5.5 初始化设置

1. 设置听者自身所在位置和朝向

开发者可以通过调用 updateSelfPosition 接口,设置听者自身的所在位置和方位,或者在自身方位发生变化时更新自己在世界坐标系中的位置和朝向。

  • 在调用 enableSpeaker 打开扬声器之前如果没有调用该接口设置位置信息,则无法接收除小队以外其他人的声音。
  • 自身坐标系三个轴的坐标值可以通过第三方 3D 引擎的旋转角度换算矩阵得到。
参数名描述
position自身在世界坐标系中的坐标,参数是长度为 3 的 float 数组,三个值依次表示前、右、上的坐标值。
axisForward自身坐标系前轴的单位向量,参数是长度为 3 的 float 数组,三个值依次表示前、右、上的坐标值。
axisRight自身坐标系右轴的单位向量,参数是长度为 3 的 float 数组,三个值依次表示前、右、上的坐标值。
axisUp自身坐标系上轴的单位向量,参数是长度为 3 的 float 数组,三个值依次表示前、右、上的坐标值。

下载 (2).png

// 自身在世界坐标系中的坐标,顺序是前、右、上。
float[] position = new float[]{100.0, 100.0, 100.0};
// 自身坐标系前朝向的单位向量。
float[] axisForward = new float[]{1.0,0.0,0.0};
// 自身坐标系右朝向的单位向量。
float[] axisRight = new float[]{0.0,1.0,0.0};
// 自身坐标系上朝向的单位向量。
float[] axisUp = new float[]{0.0,0.0,1.0};rangAudio.updateSelfPosition(position, axisForward, axisRight, axisUp);

2. (可选)设置音频接收距离的最大范围

调用 setAudioReceiveRange 接口设置听者接收音频距离的最大范围,即以自身为起点,3D 空间中以设置的距离为立体空间。设置该范围后,在开启 3D 音效的情况下,声音将会随距离的增加而衰减,直至超出所设置的范围,则不再有声音。小队内的语音,不会受到该值的限制,也不会有 3D 音效。

如果不设置,则表示只能接收本小队内的成员声音,无法接收小队外的所有声音。

rangAudio.setAudioReceiveRange(1000);

3. (可选)设置是否开启 3D 音效

调用 enableSpatializer 接口设置 3D 音效,enable 取值为 true 时表示开启 3D 音效,此时房间内非小队成员的音频,会随着发声者离自身的距离和方向的变化而产生空间感的变化,为 false 时表示关闭 3D 音效。(可随时开启或关闭)

该功能只对小队以外的人生效。

rangAudio.enableSpatializer(true);

5.6 添加或更新发声者位置信息

登录房间成功后,需要通过调用 updateAudioSource 接口,添加或更新发声者的位置信息。

  • 全世界模式下:需要更新房间内,收听者和所有发声者的位置。隐秘小队模式下:需要更新房间内,所有在音频接收范围内,且为全世界模式的发声者的位置。如果未设置发声者位置,或者发声者超出收听者范围,会出现听不到声音的情况。

  • 这里发声者指的是房间内其他人,收听者指的是自己。

  • userID:为房间内其他发声用户的 ID。

  • position:发声者在世界坐标系中的坐标,参数是长度为 3 的 float 数组,三个值依次表示前、右、上的坐标值。

// 用户在世界坐标系中的坐标,顺序是前、右、上。
float[] position = new float[]{100.0, 100.0, 100.0};
// 添加/更新用户位置
rangAudio.updateAudioSource("abc",position);

5.7 设置是否开启麦克风

登录房间成功后调用 enableMicrophone 接口设置是否开启麦克风,当 enable 取值为 true 时表示开启,此时 SDK 将会自动使用主通道推音频流,为 false 时表示关闭。(可随时开启或关闭)

需要通过监听 onRangeAudioMicrophoneStateUpdate 事件回调来获取麦克风更新后的状态。

rangAudio.enableMicrophone(true);

5.8 设置是否开启扬声器

登录房间成功后调用 enableSpeaker 接口设置是否开启扬声器,enable 取值为 true 时表示开启,此时将会自动拉取房间内的音频流,为 false 时表示关闭。(可随时开启或关闭)

当超过最大拉流数限制(目前为 20 路)时,会优先拉取小队内成员音频流(需设置小队模式),再拉取世界内距离自身范围最近的音频流。

rangAudio.enableSpeaker(true);

5.9 (可选)设置小队语音功能

1. 设置队伍 ID

调用 setTeamID 接口可根据需要设置想要加入的小队 ID(可随时变更 ID),设置 ID 后即可直接加入。加入小队后,与同一小队内队员之间的交流不受范围语音和 3D 音效的限制。

rangAudio.setTeamID("123");

2. 设置语音模式

调用 setRangeAudioMode) 接口设置范围语音模式(可随时切换模式),mode 参数取值为 ZegoRangeAudioModeWorld 或 ZegoRangeAudioSecretTeam 时表示可以听到所有处于世界模式的人的声音,取值为 ZegoRangeAudioModeTeam 时表示只能听到同一小队内其他成员的声音。

语音模式参数取值功能描述
全世界WORLD设置该模式后,此用户能与小队成员互相通话,且能与范围内其他全世界模式的人互相通话。
仅小队TEAM设置该模式后,此用户仅能与小队成员互相通话。
隐秘小队SECRET_TEAM设置该模式后,此用户能与小队成员互相通话,且能单向接收范围内全世界模式的人的语音。
rangeAudio.setRangeAudioMode(ZegoRangeAudioMode.WORLD);

不同范围语音模式下,发声者声音的可接收情况有所不同。

  • 假设 A 用户的模式为 “全世界”,则 B 用户在不同范围语音模式下的声音可接收情况如下:
是否在同一小队是否在最大范围内范围语音模式A 能否听到 B 的声音B 能否听到 A 的声音
同一小队全世界(World)
仅小队(Team)
隐秘小队(SecretTeam)
全世界(World)
仅小队(Team)
隐秘小队(SecretTeam)
不同小队全世界(World)
仅小队(Team)
隐秘小队(SecretTeam)
全世界(World)
仅小队(Team)
隐秘小队(SecretTeam)
  • 假设 A 用户的模式为 “仅小队”,则 B 用户在不同范围语音模式下的声音可接收情况如下:
是否在同一小队是否在最大范围内范围语音模式A 能否听到 B 的声音B 能否听到 A 的声音
同一小队全世界(World)
仅小队(Team)
隐秘小队(SecretTeam)
全世界(World)
仅小队(Team)
隐秘小队(SecretTeam)
不同小队全世界(World)
仅小队(Team)
隐秘小队(SecretTeam)
全世界(World)
仅小队(Team)
隐秘小队(SecretTeam)
  • 假设 A 用户的模式为 “隐秘小队”,则 B 用户在不同范围语音模式下的声音可接收情况如下:
是否在同一小队是否在最大范围内范围语音模式A 能否听到 B 的声音B 能否听到 A 的声音
同一小队全世界(World)
仅小队(Team)
隐秘小队(SecretTeam)
全世界(World)
仅小队(Team)
隐秘小队(SecretTeam)
不同小队全世界(World)
仅小队(Team)
隐秘小队(SecretTeam)
全世界(World)
仅小队(Team)
隐秘小队(SecretTeam)

5.10 销毁范围语音模块

当不再使用范围语音模块时可调用 destroyRangeAudio 接口销毁,释放范围语音模块占用的资源。

engine.destroyRangeAudio(rangAudio);

5.11 退出房间

调用 logoutRoom 接口退出房间,退出后将自动关闭麦克风和扬声器(即无法发送自己的音频,也无法收听别人的声音),并清空发声者信息列表。

// 退出房间
engine.logoutRoom("roomID");

5 获取 范围语音 更多帮助

获取本文 实时音视频-范围语音 的开发文档、技术支持,访问即构文档中心开发文档页,适合对语音音效要求较高的小游戏,元宇宙类场景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/26864.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

通过实时语音驱动人像模拟真人说话

元宇宙的火热让人们对未来虚拟世界的形态充满了幻想&#xff0c;此前我们为大家揭秘了声网自研的 3D 空间音频技术如何在虚拟世界中完美模拟现实听觉体验&#xff0c;增加玩家沉浸感。今天我们暂时离开元宇宙&#xff0c;回到现实世界&#xff0c;来聊聊声网自研的 Agora Lipsy…

聊天语音APP开发|聊天语音软件开发-实时音视频技术

聊天语音软件的开发应该是一个以视频和语音直播为核心的社交系统。对于用户来说&#xff0c;更好的视频和语音直播功能可以增强用户的接受感&#xff0c;让用户持续使用。为了方便视频和语音直播的采用体验&#xff0c;减少直播的延时&#xff0c;聊天语音软件的开发将采用实时…

拿到offer提出离职,公司拖30天才放人,但下家公司等不了30天,怎么办?

拿到offer想跳槽&#xff0c;向公司提出了离职&#xff0c;但公司要拖30天才放人&#xff0c;新公司又等不了30天&#xff0c;offer可能就没有了&#xff0c;这就是一位网友面临的两难局面&#xff0c;这种情况有没有什么解决的好办法呢&#xff1f; 有人安慰楼主&#xff0c;下…

怎么说离职原因新的公司比较能接受?

怎么说离职原因新的公司比较能接受&#xff1f; 我来提供一些格式化的应对方法&#xff1b; 1.实际原因&#xff1a;原单位工资太少。离职原因&#xff1a;我认为我自己已经具备了一定的积累&#xff0c;希望可以迈向一个新的台阶。 2.实际原因&#xff1a;跟同事出不来。离…

我提了离职,公司给我涨薪了,还能待下去吗?

金三银四到了&#xff0c;相信不少同学又开始在物色新的公司。 不少同学反映&#xff0c;在提出离职后&#xff0c;公司给自己加了薪&#xff0c;虽然不多。 那“在职员工&#xff0c;提出辞职被挽留&#xff0c;应该留下吗&#xff1f;” 为什么想要离职&#xff1f; 这个问…

是的,我离职了

终于可以敞开说这件事情了&#xff0c;年后的这一个月&#xff0c;我彻底停更了&#xff0c;并不是偷懒了&#xff0c;而是我要找工作。大家也都知道18年的寒冬&#xff0c;很多大厂开始裁员&#xff0c;所以我要更加认真的学习&#xff0c;毕竟跟大厂出来的相比&#xff0c;自…

办理离职手续流程的详细流程(离职交接的标准流程)

1、正式员工办理离职手续流程 若员工自离&#xff0c;需提前一个月向部门领导提出辞职申请&#xff08;即时聊天工具或邮件&#xff09;和《解除劳动合同申请》。 1&#xff09;面谈&#xff1a;一般领导都会先谈话&#xff0c;确定你离职的时间及安排交接人员进行工作交接。 2…

程序员新公司入职被拒 只因离职证明多了一句话!

程序猿&#xff08;微信号&#xff1a;imkuqin&#xff09; 猿妹 整编 新闻报道来自&#xff1a;成都商报 近日&#xff0c;成都一名程序员被新应聘的公司通知入职&#xff0c;然而因为原公司给他出具的一份离职证明上&#xff0c;记载了一句“该员工在项目未完成情况下因个人原…

提交辞职申请时,领导极力挽留,还答应加薪,要不要留下来?

提交辞职申请时&#xff0c;领导极力挽留&#xff0c;还答应加薪&#xff0c;要不要留下来&#xff1f;张工是一名程序员&#xff0c;最近他向领导提交了辞职申请表后&#xff0c;却被领导极力挽留&#xff0c;领导不仅打感情牌&#xff0c;还打加薪牌。就是希望张工能够留下来…

医学影像处理与识别,应用AI模型,探索疾病辅助诊断!

关注公众号&#xff0c;发现CV技术之美 今天&#xff08;2023.1.9&#xff09; arXiv.CV 上有7篇医学影像处理与识别相关论文。不过粗略看来&#xff0c;医学影像类的论文&#xff0c;很多都是直接使用已有模型&#xff08;甚至都不是最先进的模型&#xff09;&#xff0c;加以…

【react从入门到精通】初识React

文章目录 人工智能福利文章前言React技能树什么是 React&#xff1f;安装和配置 React创建 React 组件渲染 React 组件使用 JSX传递属性&#xff08;Props&#xff09;处理组件状态&#xff08;State&#xff09;处理用户输入&#xff08;事件处理&#xff09;组合和嵌套组件写…

JWT续期问题,ChatGPT解决方案

JWT&#xff08;JSON Web Token&#xff09;通常是在用户登录后签发的&#xff0c;用于验证用户身份和授权。JWT 的有效期限&#xff08;或称“过期时间”&#xff09;通常是一段时间&#xff08;例如1小时&#xff09;&#xff0c;过期后用户需要重新登录以获取新的JWT。然而&…

可用数据存量不足,还能怎样向AI模型注入人类智能?

作者 | 王昊 出品 | IDEA研究院 在深度学习发展的第三波浪潮中&#xff0c; ChatGPT引发了人们对人工智能前所未有的关注。它的出现意味着基于指令学习和人类反馈的AI技术成为人工智能领域的关键。然而&#xff0c;当前所展示的能力还远不是AI的最终形态&#xff0c;无论是产业…

玩转ChatGPT:基于Mucloud建立本地知识库

一、写在前面 人们普遍认为GPT有潜力颠覆教育行业&#xff0c;然而这种颠覆会以何种方式呈现呢&#xff1f; 在刘慈欣的科幻世界中&#xff0c;三体人拥有知识遗传的能力&#xff0c;这使得他们的技术迭代成本降至最低。然而&#xff0c;我们人类并未具备这样的特性&#xff…

GPT-4问世;LLM训练指南;纯浏览器跑Stable Diffusion

1.多模态GPT-4正式发布&#xff1a;支持图像和文本输入&#xff0c;效果超越ChatGPT OpenAI的里程碑之作GPT-4终于发布&#xff0c;这是一个多模态大模型&#xff08;接受图像和文本输入&#xff0c;生成文本&#xff09;。主要能力有&#xff1a; GPT-4可以更准确地解决难题&a…

AI炒股:用Claude来分析A股2023年中报业绩预告

Claude是和ChatGPT类似的AI大模型&#xff0c;据测试 AI 的水平能力接近 GPT-4&#xff0c;支持高达 100K token 的上下文。Claude只需要到官方网站注册账号后就可以直接免费使用。不过&#xff0c;目前智能美国和英国的 IP 可以注册和使用。 Claude支持上传文档功能&#xff…

NLP还能做什么?多机构联合发布百页论文,系统阐述后ChatGPT技术链

深度学习自然语言处理 分享来自&#xff1a;机器之心 一切都要从 ChatGPT 的横空出世说起...... 曾经一片祥和的 NLP 社区&#xff0c;被这个突如其来的 “怪物” 吓到了&#xff01;一夜之间&#xff0c;整个 NLP 圈发生了巨大的变化&#xff0c;工业界迅速跟进&#xff0c;资…

NLP还能做什么?北航、ETH、港科大、中科院等多机构联合发布百页论文,系统阐述后ChatGPT技术链

夕小瑶科技说 分享 来源 | 机器之心 一切都要从 ChatGPT 的横空出世说起… 曾经一片祥和的 NLP 社区&#xff0c;被这个突如其来的 “怪物” 吓到了&#xff01;一夜之间&#xff0c;整个 NLP 圈发生了巨大的变化&#xff0c;工业界迅速跟进&#xff0c;资本 “狂飙”&#…

chatgpt赋能python:Python量化数据来源-介绍

Python量化数据来源 - 介绍 Python在金融量化分析领域中得到了广泛的应用&#xff0c;这部分应用通常被称为Python量化金融。Python量化数据来源是Python量化金融分析的基础&#xff0c;只有良好的数据来源才能保证分析的准确性和有效性。 Python具有以其代码简洁易懂、强大的…

GIS可视化—热力图制作与热点分析(一)

本博客知识来源&#xff1a;城市数据派公众号&#xff0c;WeChat ID&#xff1a;udparty。讲师&#xff1a;张海平老师&#xff08;高级城市数据分析师&#xff09;&#xff0c;本文对讲解PPT中的内容进行总结概括&#xff0c;并方便自己以及他人更加直观的了解与学习热力图方面…