2023,谁在引领实时互动进入高清时代?

实践是检验真理的唯一标准,技术是行业进步的核心动能。在实时互动的新时代里,不断进化的声网已然完成自证。 

作者|斗斗 

出品|产业家 

“一个医疗行业的客户,曾向我们提出一个需求,希望在120急救场景下,可以远程看清楚病人的实时状况,使得其做出最恰当的急救措施。”声网CTO钟声告诉我们。

这是他的一个“心结”。

过去很多年中,随着视频分发技术以及终端观看设备的优化,点播内容的画质得到了前所未有的提升,很早就实现了4K超高清。然而,就实时互动领域而言,画质仍落后于常规的点播内容。

背后的原因是,直播高清画质的提升不同于传统终端硬件或点播视频的画质提升,其中有非常大的技术门槛。即使解决清晰度的技术门槛,也会伴随其他影响体验的问题出现,例如卡顿率增高、网络延时增长等等。

实际上,这也正是声网一直在攻坚的方向。作为第一个将实时音视频技术作为一项服务提供给企业和开发者的云服务商,它早已经出现在实时互动画质提升的“窄路”上。

如今,窄路已然被拓宽。“实时互动画质提升,有几个关键技术,今年上半年我们做了重点投入,并对一些客户的直播画质效果进行改进,反馈显示无论是画质体验,还是对业务的赋能,效果都非常显著。”作为声网泛娱乐产品负责人,李斯特告诉产业家。

「实时高清·超级画质」,是时候让更多人看到了。

一、一场“real”的直播有多难?

一组声网统计的数据显示,低清、标清、高清频道内观众人均留长时间分别为290.95s、309.05s、340.12s;次均留存时间分别为255.26s、263.23s、300.73s。清晰可见的是,在高分辨率频道观众的人均、次均留存时长,明显高于中、低分辨率。

画质的清晰与否,正在成为决定直播用户留存数据的关键。

事实上,无论是娱乐直播下单纯的观众,还是电商直播中的消费者,高清画质下真实的观看体验和真实的商品细节,成为一场直播至关重要的能力。

然而想要在实时互动场景中实现高清画质,绝对不一件容易的事情。

“老有粉丝吐槽我的美颜假,但开播时候的参数调整十分复杂;稍微开高清一点就总是网不好,卡成马赛克;这个平台的画质就只能支持这个效果……”

这是声网在对某平台画质问题进行调研时,得到的一些回答。

问题出现在多个方面。首先是带宽传输差异,全球实时带宽差异正在逐渐拉大,直播中心的网络资源难以满足大量用户的视频接入和分发。正如100辆车从“主播驶向观众”,前者路面较宽可实现100辆车并排前行,然而后者路面较窄,只能容纳几十辆甚至更少。所以当车的数量增多时,到达目的地的时间也会被拖延,造成直播时延。

其次设备差异大,碎片化严重,性能不均衡。其实,路不仅有宽窄之分,更有质量优劣之分,当终端设备参数较低时,意味着这条路坑坑洼洼,车随时可能出现拥堵、抛锚等情况,造成直播过程中卡顿。

再有就是直播的平台、设备、环境等制约了好内容生产。每个直播平台都会限制直播的参数,很大程度上,压缩了直播的画质;除此之外,灯光、美颜、滤镜等参数也是直播画质降低的重要因素。简言之,车的质量不行,便无法保证其可以高效率的行驶。

这些固有的瓶颈,让实时互动中的画质提升,似乎变得无解。

而如今,这个问题更被愈加鲜明地摆到台面。即随着电商直播、娱乐直播出海热潮袭来,企业对画质优化要求将更高;其次,在保证清晰度的情况下,同时也需要保证直播的流畅度,以及整体的画质体验;此外,还需要服务商针对直播中的一些新玩法,及时给出相对应的解决方案。

能看到的是,有部分企业已经做出了相应的对策。比如,大部分主播会通过更换终端硬件、灯光、调整平台参数的方式来优化画质,再比如一些平台或是技术服务商则是会通过一些技术手段,实现直播画质的优化。

然而这种策略治标不治本。即当网络不稳定时,卡顿问题仍然难以避免,实时互动的糟糕体验就会“原形毕露”。

换言之,在市场需要一场“real”的直播背后,直播市场更需要的是一个能从底层解决直播画质、体验、玩法等全方面问题的综合方案。

答案在哪?

二、增高10.3%背后

看见「实时高清·超级画质」

10.3%,这是用户留存时长提升百分比,来自声网对客户画质升级前后的数据监测。这个数字背后是声网的「实时高清·超级画质」。

“从我们自己的数据分析,再到客户的数据验证,基本上从两端都可以看到清晰的提升作用。”声网产品市场负责人朱超华对产业家说。

「实时高清·超级画质」究竟是如何解决技术瓶颈的?

“声网的实时高清·超级画质,强调的不止是更清晰、画质更好,而是低码高清,真正实现在同等带宽下更清晰,或同等清晰度下对网络、设备的要求更低,这样才能真正帮助直播产品尤其是出海产品,在面对复杂网络和设备环境时,拥有更好的用户体验。”李斯特总结到。

在直播场景中,很多观众对于直播内容的画质敏感度并不相同。在娱乐直播中,例如美妆、达人表演等内容,观众对人脸画质的敏感度较高;在电商直播中观众对商品细节画质的敏感度较高。

因此,声网基于深度学习的AI视觉感知的前处理,将不同直播内容中,观众敏感度高的内容进行低压缩,敏感度低的内容进行高压缩,实现了30%视频压缩效率增加。“例如原本1M的发送码率,通过AI算法压缩到了0.7M,这样在移动端低端设备上也可以轻松跑起来。”这就解决了互动直播内容传输一方面需要保证画质高 清,一方面又要符合平台参数,保证传输速率兼顾流畅性的瓶 颈。 

再通过多格式视频编码及弱网对抗,使得视频自适应分发。目前,声网新的视频编码标准H.265相 比H.264编码标准,最高可节省50%的带宽。 

以27种采集渲染方式,兼容各类设备采集渲染,得到更优的画面内容。在传输阶段,声网还采用自适应弹性传输算法,适应不同网络环境。继而基于深度学习,修复增强高清画质,在不改变分辨率的情况下,智能调整画质锐度和对比度,让画质看起来更真实有美感。

基于底层技术实力,以及不断优化、迭代技术,使得「实时高清·超级画质」解决方案实现了全平台极致高清、移动端实时多倍超分、视频增强的能力。

另一个更令市场惊艳的点在于声网在AI 算法低消耗方面的调优,可以使得低端机算法自动降级。

根据声网提供的数据显示,「实时高清·超级画质」在终端适配度上,可以基本实现iOS机型全覆盖;Android 机型95%的覆盖率,最低配机型OPPO A3s CPU单核720P单帧耗时仅需2.5ms。

新一代算法能在绝大部分的机型上跑得动,这是以前做不到的。虽然业界可能有发布过类似产品,但很少有能够真正几乎跑通所有高、中、低端机型。”钟声告诉产业家。

实现画质提升和超分等能力,需要运用大量的AI算法,为了适配大部分机型,声网甚至把业界的大模型缩了100万倍。钟声介绍到,“这条道路很艰辛,挑战在于,在模型足够小的同时,要有明显的画质提升效果。过程中路线、方法换过很多次,大家现在看到的超分是打磨的第四个版本,第一版时和现在的机型覆盖率完全不是一个档次,勉强能达到50%。”也正是这种极致“死磕到底”的态度造就了「实时高清·超级画质」在体验质量上的进化。

三、声网:技术筑底,体验护航

在「实时高清·超级画质」的客户中,有一个案例让钟声印象深刻。该客户有两个APP,一个计划采用声网的解决方案,一个计划采用成本更低的CDN方案。

变化发生在该客户上线了声网的方案之后。“他决定另一个APP不用CDN了,也换成声网的方案。因为画质体验明显提升,运营数据增长的不错。”

对于这种变化,钟声深感欣慰,他认为当一个消费升级之后,便很难降级。从这点来看,声网「实时高清·超级画质」正在推动整个直播产业迈进真正的高清时代。

另一个做视频直播的出海客户也发生过类似的转变,该客户出海主要目标区域是土耳其、埃及、甚至叙利亚等中东欠发达国家,由于该地基础设施的不完善,导致平台视频清晰度不高、但卡顿率很高。

“大部分出海企业认为可用性是第一位的,在最开始向他们推广高清的时候,他们觉得如果不能保障低卡顿率和可用性,宁可不要高清。”李斯特介绍,客户最开始对“超级画质”是很抗拒的,但经过声网优化并拿出真实效果之后,就非常认可了。“我们帮这些出海产品做到了视频体验升一档,同时卡顿率降一档。

为了打造极致的直播体验,声网在「实时高清·超级画质」解决方案中,提到了八大模块的体验升级。

具体来看,包括清晰有美感,真实有质感的画质全面升级;人更美,更自然的AI超级美颜。在场景化美颜 API 开发门槛上,由原来300+行代码减至10行,开发时间由7天缩短至3小时,可以快速实现上线;丝滑流畅,用户零感知进出、切换频道体验,直播场景首帧出图低至100ms,  秒开率高达 97%;可实现全行业最优码率编码传输方案,码率最高下降 70%,最低 500K 即可实现 720p 视频流畅体验。

除了以上四点之外,声网还针对1v1 直播、团战 PK等玩法进行体验升级,同时针对PC开播、数据监控、业务收益追踪,一站式升级技术支持等几个方面进行了迭代升级。值得注意的是,这些体验升级的同时,几乎不增加任何成本,「实时高清·超级画质」更是低至一折。

这恰都构成了「实时高清·超级画质」以及声网在客户侧的被青睐。

实际上,这些能力也恰是源于声网多年深耕行业的积累。即在声网服务不同客户的同时,这些企业客户也更在反向赋能声网,帮助这家在中国音视频赛道领跑的企业持续夯实自身的底层和产品飞轮。

对于声网,外界的认知往往会是音视频、RTC/RTE等泛化的市场标签。但在这次「实时高清·超级画质」的发布中,市场能感知到的除了它在技术上的深耕“无人区”,也更能感受到这家领跑的中国音视频服务商的基建属性,从真正的底层视角帮助一众产品进化升级。

实践是检验真理的唯一标准,技术是行业进步的核心动能。在实时互动的新时代里,不断进化的声网已然完成自证。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/75024.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

.net 6 efcore一个model映射到多张表(非使用IEntityTypeConfiguration)

现在有两张表,结构一模一样,我又不想创建两个一模一样的model,就想一个model映射到两张表 废话不多说直接上代码 安装依赖包 创建model namespace oneModelMultiTable.Model {public class Test{public int id { get; set; }public string…

两数相加 II

给你两个 非空 链表来代表两个非负整数。数字最高位位于链表开始位置。它们的每个节点只存储一位数字。将这两数相加会返回一个新的链表。 你可以假设除了数字 0 之外,这两个数字都不会以零开头。 示例1: 输入:l1 [7,2,4,3], l2 [5,6,4] 输…

React Native元素旋转一定的角度

mMeArrowIcon: {fontSize: 30, color: #999, transform: [{rotate: 180deg}]},<Icon name"arrow" style{styles.mMeArrowIcon}></Icon>参考链接&#xff1a; https://reactnative.cn/docs/transforms https://chat.xutongbao.top/

子组件未抛出事件 父组件如何通过$refs监听子组件中数据的变化

我们平时开发项目会使用一些比较成熟的组件库, 但是在极小的情况下,可能会出现我们需要监听某个属性的变化,使我们的页面根据这个属性发生一些改变,但是偏偏组件库没有把这个属性抛出来,当我们使用watch通过refs监听时,由于生命周期的原因还不能拿到,这时候我们可以这样做,以下…

《TCP IP 网络编程》第十五章

第 15 章 套接字和标准I/O 15.1 标准 I/O 的优点 标准 I/O 函数的两个优点&#xff1a; 除了使用 read 和 write 函数收发数据外&#xff0c;还能使用标准 I/O 函数收发数据。下面是标准 I/O 函数的两个优点&#xff1a; 标准 I/O 函数具有良好的移植性标准 I/O 函数可以利用…

安卓:BottomNavigationBar——底部导航栏控件

目录 一、BottomNavigationBar介绍 二、BottomNavigationBar的常用方法及其常用类 &#xff08;一&#xff09;、常用方法 1. 添加菜单项 2. 移除菜单项 3. 设置选中监听器 4. 设置当前选中项 5. 设置徽章 6. 样式和颜色定制 7. 动画效果 8. 隐藏底部导航栏。 9、设…

过程:从虚拟机上添加 git 并成功提交到 GitLab 的全过程

Ⅰ、准备工作&#xff1a; 1、Git 查看&#xff1a; 其一、命令&#xff1a;git --version // 此时就能在虚拟机环境下看到 git 的版本为: git version 2.41.0 其二、如何在虚拟机上安装 git &#xff1a; A、命令 &#xff1a; sudo apt-get install git B、然后再输入虚…

小研究 - 主动式微服务细粒度弹性缩放算法研究(三)

微服务架构已成为云数据中心的基本服务架构。但目前关于微服务系统弹性缩放的研究大多是基于服务或实例级别的水平缩放&#xff0c;忽略了能够充分利用单台服务器资源的细粒度垂直缩放&#xff0c;从而导致资源浪费。为此&#xff0c;本文设计了主动式微服务细粒度弹性缩放算法…

React 之 Redux - 状态管理

一、前言 1. 纯函数 函数式编程中有一个非常重要的概念叫纯函数&#xff0c;JavaScript符合函数式编程的范式&#xff0c;所以也有纯函数的概念 确定的输入&#xff0c;一定会产生确定的输出 函数在执行过程中&#xff0c;不能产生副作用 2. 副作用 表示在执行一个函数时&a…

Docker实战-关于Docker镜像的相关操作(一)

导语   镜像&#xff0c;Docker中三大核心概念之一&#xff0c;并且在运行Docker容器之前需要本地存储对应的镜像。那么下面我们就来介绍一下在Docker中如何使用镜像。 如何获取镜像&#xff1f; 镜像作为容器运行的前提条件&#xff0c;在Docker Hub上提供了各种各样的开放的…

Edge浏览器安装vue devtools

1. 下载地址 GitHub - vuejs/devtools: ⚙️ Browser devtools extension for debugging Vue.js applications. 2. 下载后的压缩包解压并打开文件夹&#xff0c;右键选择&#xff1a;git bush here 3. 安装依赖 npm install 4. 成功安装依赖后打包 npm run build

万界星空科技/免费开源MES系统/免费仓库管理

仓库管理&#xff08;仓储管理&#xff09;&#xff0c;指对仓库及仓库内部的物资进行收发、结存等有效控制和管理&#xff0c;确保仓储货物的完好无损&#xff0c;保证生产经营活动的正常进行&#xff0c;在此基础上对货物进行分类记录&#xff0c;通过报表分析展示仓库状态、…

基于opencv的几种图像滤波

一、介绍 盒式滤波、均值滤波、高斯滤波、中值滤波、双边滤波、导向滤波。 boxFilter() blur() GaussianBlur() medianBlur() bilateralFilter() 二、代码 #include <opencv2/core/core.hpp> #include <opencv2/highgui/highgui.hpp> …

OpenLayers入门,OpenLayers使用fetch加载并显示TopoJson格式区划边界数据并叠加文字标注,动态创建要素样式

专栏目录: OpenLayers入门教程汇总目录 前言 上一章中已经说明了TopoJson格式数据,《OpenLayers入门,OpenLayers加载TopoJson数据,使用行政区划边界作为示例》,大家应该都已经有所了解。 本章在上一章基础上改用fetch加载TopoJson格式数据,并手动解析数据为Feature要素…

【GITHUB】FlipIt – Windows的开源翻页时钟

FlipIt 是一款免费开源的翻页时钟应用&#xff0c;专为 Windows 平台设计。该应用灵感来源于备受喜爱的老牌翻页时钟应用 Fliqlo&#xff0c;后者被公认为经典的翻页时钟屏保。然而&#xff0c;由于 Fliqlo 是基于 Flash 技术开发的&#xff0c;随着微软最近正式禁用 Flash&…

contact.sh:一款专门用于安全漏洞报告的公开资源情报工具

关于contact.sh contact.sh一款专门用于安全漏洞报告的公开资源情报工具&#xff0c;在该工具的帮助下&#xff0c;广大研究人员可以扫描企业域名并搜索企业中的用户账号&#xff0c;并根据安全威胁等级来发送安全漏洞报告。 工具安装 GNU/Linux 在下载该工具之前&#xff…

多线程之NSOperation

套话 与GCD一样&#xff0c;NSOperation也是我们日常开发中经常用到的多线程技术。本文将会介绍NSOperation的基本使用、添加依赖、 初次使用 NSOperation是个抽象类&#xff0c;依赖于子类NSInvocationOperation、NSBlockOperation去实现 下面是开发者文档上对NSOperation…

macOS 虚拟桌面黑屏(转)

转自&#xff1a;macOS重置虚拟桌面、macOS 虚拟桌面黑屏 有几次出现如图的情况&#xff0c;以为是iTerm的问题&#xff0c;但是在关闭软件&#xff0c;重启之后&#xff0c;依旧无效。 后面经过网友告知&#xff0c;才知道是虚拟桌面的问题。 为了清理这个问题&#xff0c;有以…

ELD透明屏在智能家居中有哪些优点展示?

ELD透明屏是一种新型的显示技术&#xff0c;它能够在不需要背光的情况下显示图像和文字。 ELD透明屏的原理是利用电致发光效应&#xff0c;通过在透明基板上涂覆一层特殊的发光材料&#xff0c;当电流通过时&#xff0c;发光材料会发出光线&#xff0c;从而实现显示效果。 ELD…

论文研读|多媒体自动评论生成发展综述

前言&#xff1a;多媒体自动评论生成旨在通过使用生成模型&#xff0c;对给定上下文生成符合情境的评论&#xff0c;近年来&#xff0c;随着图像描述等跨模态工作取得较大突破&#xff0c;相关研究也逐渐展开。评论作为社交平台互动的重要组成部分&#xff0c;在引导舆论、提升…