从腾讯实时音视频发家史,看爆发中的 RTC 将何去何从

作者 | 夕颜

头图 | 下载于视觉中国

出品 | AI 科技大本营(ID:rgznai100)

早在2015年左右,直播和短视频的兴起渗透进普通人的日常生活,人们信息消费的内容已经开始从文字向语音、视频信息转变。而疫情期间全民“家里蹲”的窘境,让直播连麦、视频会议、在线教育、游戏直播、电商直播等实时音视频的需求瞬间爆发。

作为实时音视频应用的底层技术支撑,信息的传递也从IM(即时通讯,Instant Message)、传统的CDN流媒体分发,向着以实时音视频为主的RTC(实时通信,Real-Time Communication)转变。

RTC是一项发展十年有余的技术,如今因为疫情被推上风口,但现阶段主流的应用还是实时音视频。为了解RTC的发展现状与未来,本文将聚焦实时音视频,从业界巨头腾讯的音视频发家史出发,从中洞见国内RTC发展的脉络。

为了更好地了解RTC,我们先从它的概念说起。

RTC、IM、WebRTC、实时音视频有什么区别?

RTC意为实时通信,它已经有了许多比较成熟的技术和应用积累,大家也许并不陌生,但因为都涉及到“实时”两个字,还是有很多人会把IM、实时音视频、WebRTC等相近的概念混淆。RTC究竟与这些词汇有什么区别?

(实时通信架构)

首先,IM和RTC都是一套网络通信系统,其本质都是对信息进行转发。其最大的不同点,是对信息传递的时间规定。从场景上来说,即时通信包括文字聊天、语音消息发送、文件传输、音视频播放等,通俗的说,就像发短信;实时通信的场景包括语音、视频电话会议、网络电话等。通俗的说,就像打电话。另外,即时通信主要要求可靠,保障信息送达,而实时通信主要要求低时延和接通率。从技术环节上来说,即时通信主要包括信息发送和确认,而实时通信则的技术细节则包括采集、前处理、编码、服务端接入、转发、服务端接入、解码、播放和渲染。此外,两者的传输协议也不同,前者最常用的通信协议是TCP、UDP,后者则是视需求而定,RTP、UDP、TCP协议或者类TCP连接协议都有使用。

RTC与WebRTC的概念最容易混淆,但实际上二者并不能划等号,WebRTC针对网页实时通信标准,只提供了基础的前端功能实现。简而言之,WebRTC仅是RTC技术栈中的几个小细分的技术组合。

而RTC最常用的应用场景之一,就是实时音视频,像疫情期间大量爆发的视频会议,就是典型的实时音视频场景。

从腾讯“三网合一”,可以看到什么?

了解了RTC的基本概念后,我们将通过剖析腾讯音视频的发展,以小见大,摸清国内RTC快速发展的背后逻辑。

以腾讯为例,是因为这家公司不仅在音视频领域布局早,且如今在国内音视频产业占据了较大的市场份额。2020年IDC报告显示,腾讯云在中国音视频产业中的解决方案市场份额排第一,覆盖了国内90%的音视频用户,成为腾讯2B业务、向外输出能力和服务的“排头兵”。且随着最近腾讯云音视频在在基础网络层面推出“三合一”的RT-ONE™音视频通信基础网络的动作,RTC能力进一步得到整合。从腾讯音视频技术和业务演进历程,可以一定程度上折射出国内音视频的发展史。

腾讯所谓的“三合一”RT-ONE™音视频通信基础网络,是指融合了自家积累多年的TRTC实时音视频通信网络、IM即时通信网络与CDN流媒体分发网络,其中TRTC网络主要承载腾讯的音视频实时通信业务, 可帮助用户快速搭建低延时的音视频互动解决方案,IM即时通信网络负责即时通信消息和业务信令,CDN则可应对海量大并发直播、点播内容分发。

为什么在这个时间点推出“三网合一”,也是得益于疫情的契机。疫情期间,全民性的线上沟通交流需求让视频会议、电商直播互动、游戏连麦等实时音视频应用爆发,在技术层面上其实既需要有高并发、大带宽的CDN的流量分发,也需要高实时互动的音视频通信,更需要IM信令和通信服务的能力,这3个需求并发,为云厂商提出了新的挑战。早在实时音视频领域有所布局的腾讯把积累的三张网融合在一起,复用底层技术,共建技术能力。举个例子,微信视频号的直播功能上线,准备时间其实只有一个多月的时间,这虽然让人难以相信,但确实是因为复用了腾讯云的TRTC和直播CDN,才会在短时间内完成部署上线。

可以看到,腾讯此次“三网合一”,最大的意义就在于把其TRTC、IM和CDN的能力集中打包给客户,让用户不用在需要建设自己的RTC能力时,再花力气和资源分别对接三种不同的厂商,一站式把这三种能力都带给用户。

这让腾讯成为业界唯一一家同时具备实时通信网络、即时通信网络和流媒体分发网络于一体的云厂商,可以预见,其他厂商要想在竞争激烈的RTC市场占据优势,势必也要模仿腾讯,最终整个RTC领域都将从“内卷”中获益。

国内音视频发展中的几波发展红利

在腾讯音视频21年的发展历程中,正是因为抓住了几次发展机遇,才能水到渠成地成为音视频领域巨头。

腾讯云在音视频领域的发展,粗略可分为三个阶段。

第一个阶段在2015年之前,那时QQ后台部门(当时叫做即时通讯平台部)为了支撑QQ的海量并发和全球互联,其实已经具备了双向视频通话的能力,积累了音视频通信的技术栈。

反观这个阶段,人们的内容消费还主要是以文字和图片为主,在这些场景下主要关注的是图片加载的时延。而稍微先进一些的具有音视频通话能力的应用在市场上虽然也有一些,如移动视频社交应用陌陌等基于SIP或WebRTC的音视频通话软件,但QQ、微信的视频通话,在国内音视频市场中仍然占大头。

到第二个发展阶段(2015-2020年),腾讯开始做能力开放,基于腾讯云品牌对外开放视频相关能力服务。再到2016年,国内迎来了直播风口,腾讯抓住了直播CDN高速发展的红利,特别是游戏直播。再到2017-2018年,以快手、都与、B站为标志,短视频也迎来爆发期,腾讯又及时抓住了CDN流媒体短视频的红利。前后两波红利使得腾讯的CDN流媒体分发网络快速发展,成为中国最大的CDN服务商之一。

(图源:视觉中国)

自此之后,音视频基本上已经从泛娱乐渗透进各个垂直行业,人们内容消费的习惯的改变,让音视频成为各行各业的基础设施。

这个阶段,RTC技术的进展支撑了直播和短视频的爆发,反过来也让RTC技术和应用获得了珍贵的发展机遇。这时候,人们主要关注的是视频的播放是否流畅,而基于WebRTC的低时延视频系统不断优化,甚至出现了支持8K全景的直播产品,如阿里视频云在2018年云栖大会上展示的全球首个8K互联网直播解决方案,超高清视频标准体系建设越来越完善,低延迟、高清的实时互动交流体验已经完全不是问题。

2021年之后,腾讯音视频进入了第三个发展阶段,也就是在疫情催化下的线上需求的爆发,腾讯云再次抓住了在线教育、娱乐、金融和电商直播等在线服务的红利,迅速覆盖主流市场。

实时音视频发展方向与趋势

三次实时音视频的历史发展机遇,腾讯都接住了,自然而然跻身国内RTC头部企业。距离我们最忌一次的新冠疫情把RTC推向了风口,几乎所有人都认为这将是一个潜力巨大的发展领域。

腾讯也是如此,在此期间,腾讯发现了互联网对于IM和实时音视频的需求量意外地巨大,TRTC的用户体量和IM的客户数呈井喷式爆发,他们认为,相信未来两到三年,TRTC个IM这两张网一定会发展成与CDN同等体量和同等技术规模的网络,而在公有云能力和底层设施之间进行大通和共建大有可为,这次机会将是实时音视频发展的一次重大历史机遇和转折点。

据腾讯预估,音视频直播、实时音视频这两个实时相关的领域今年的全球市场规模将达到50亿元,RTC多人互动实时音视频领域虽然现在的体量还较小,但预估今年市场空间将达到15-20亿,未来几年年复合增长率将保持在30%-40%。

整个行业和全球资本对于实时音视频都非常看好,究其根本就在于资本认为实时音视频将和5G、云计算一样,成为未来的核心基础设施之一。再者,除了互联网,大量传统行业进行数字化转型,音视频通信的需求量必然不会小。

以实时音视频为代表的RTC已经在风口上随时起飞这一点毋庸置疑。那么未来,实时音视频未来有哪些发展趋势和方向值得业界格外注意呢?腾讯云副总裁李郁韬给出了自己的预判。

他认为,安全将是实时音视频未来需要重点关注的方向,也即机遇所在。不同于直播,实时音视频的通信安全非常重要,对于隐私的诉求较高,端到端加密,自定义秘钥等加密技术都是未来相关厂商需要提供的能力保障。

另一方面,未来在音视频的服务中,大家关注的指标无非是时延、成本、卡顿率、质量指标,用一套服务就能够把这些需求全部满足是用户希望看到的。腾讯未来可能会进一步发布一些云端或终端的产品,其实都是往这个思路上走。

多样性协议以及不同场景解决方案的组合,也是腾讯未来真正的着力点。之前做直播,主流的协议适配主要是上行协议RTMP,下行协议FLV,而现在很多上行也开始使用类RTP的协议,或者UDP之上的协议来解决弱网的问题。随着腾讯云3张网打通,在上行部分,腾讯云计划逐渐构建比较完善的SRT协议,QUIC后续也会支持。下行也是类似的思路,所有的协议都会平行支持,包括基于WebRTC CDN推出快直播,基于QUIC CDN推出点播加速的CDN产品。

本文以腾讯云音视频的发展历程为例,展示了国内实时音视频发展的现状与未来,数字和成熟的应用案例都说明,以实时音视频为主要应用场景的RTC正遇历史机遇期,谁能抓住这波红利,在RTC竞争中杀出重围,时间会给出答案。

更多精彩推荐  遏制企业数据泄露,大咖切磋云安全的攻防之道Mendix 披露低代码方法论,解读真实技术趋势
张一鸣卸任CEO,立下10年之约,期望突破线性延伸王炸不断,半导体巨头们到底在打什么牌
Python 爬影评,《悬崖之上》好看在哪里点分享点收藏点点赞点在看

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22874.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

腾讯云html5直播开发,腾讯云IM开发 直播 聊天室

2019年6月工作总结 总结时间:2019年6月30日 总结人:韩放 工作内容: 1.哟呵直播开发 2.一乙农场客服商品对接 项目总结: 这个月主要是又做了一个直播类项目,这次主要的不同是根据客户的定制要求完全使用了腾讯IM加腾讯云…

微信团队分享:微信直播聊天室单房间1500万在线的消息架构演进之路

本文由微信开发团队工程师“ kellyliang”原创发表于“微信后台团队”公众号,收录时有修订和改动。 1、引言 随着直播和类直播场景在微信内的增长,这些业务对临时消息(在线状态时的实时消息)通道的需求日益增长,直播…

有哪些值得关注的AIGC细分方向?

(以下内容,来自咱们社群“AI产品经理大本营” 1月12日的团员内部讨论;本文不求大而全,但会有一些大家“没听说过的一手信息input”)‍‍‍‍ 【参与团员】 A:某司 负责 AIGC B:某司 负责 医疗AI…

音视频技术开发周刊 | 282

每周一期,纵览音视频技术领域的干货。 新闻投稿:contributelivevideostack.com。 畅谈音视频未来无限可能,2022音视频技术大会北京站 最新日程公布 2023年3月31日-4月1日,LiveVideoStackCon 2022音视频技术大会北京站,…

chatgpt赋能Python-python_cdo

Python-CDO: 数据处理的超棒工具 Python-CDO是一种极为实用的工具,用于在Python中使用CDO(Climate Data Operators)命令。CDO是一个功能强大的工具,用于处理气候和气象大型数据集,如Satellite and Reanalysis数据。而…

时间序列分析——基于R | 第2章 时间序列的预处理习题代码

时间序列分析——基于R | 第2章 时间序列的预处理习题 1.考虑序列{1,2,3,4,5,…,20} 1.1判断该序列是否平稳 x <- seq(1,20);x ## [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1.2样本自相关系数 max_lag <- 6 acf_x <- acf(x, lag.max max_l…

Google 人机验证(reCaptcha)无法显示解决方案

Google 人机验证无法显示解决方案 第一步 安装插件Chrome/Edge 电脑版Firefox 电脑版 第二步 配置插件原理参考文章 前言&#xff1a;为了防止机器人攻击&#xff0c;国外很多网站都使用了 Google reCaptcha 验证码。reCaptcha 对于国外用户非常的友好&#xff0c;但是… 对于国…

解决谷歌人机验证(Captcha)显示问题

文章目录 前言一、Header Editor 下载、安装与配置1. 插件下载2. 插件安装3. 插件配置 前言 由于谷歌服务在国内不可用&#xff0c;所以正常访问时某些网址时&#xff0c;经常会出现需要人机验证的问题&#xff0c;影响正常使用。在不使用科学上网的情况下&#xff0c;我们可以…

利用Python解决掉谷歌人机验证,全自动识别真的牛啊

一、接触前感受 第一次带我领略yolov5风骚的是这个视频&#xff1a;【亦】警惕AI外挂&#xff01;我写了一个枪枪爆头的视觉AI&#xff0c;又亲手“杀死”了它。 这样一来&#xff0c;我对人工智能打游戏产生了浓厚的兴趣&#xff0c;于是在B站查找人工智能基础&#xff0c;随便…

【开源项目】ChatGPT智能聊天系统后台管理解析

ChatGPT是likeshop近期新研发出来的一款AI智能聊天对话的产品&#xff0c;此系统是基于likeadmin-PHP开发的智能对话系统&#xff0c;ChatGPT是一种基于人工智能技术的聊天机器人&#xff0c;它可以与用户进行自然语言对话&#xff0c;提供各种服务和答案。ChatGPT的核心技术是…

checkra1n越狱工具下载地址

https://checkra.in/releases/ 虚拟机 checkra1n -26和-31错误 不支持虚拟机,需要在黑苹果&#xff0c;Ra1nUSB&#xff0c;Linux下越狱 AMD的黑苹果&#xff0c;错误&#xff0d;31&#xff0c; AMD的CPU使用checkra1n越狱黑苹果会报错-31 适用系统iOS13-13.3.1基本都是…

RabbitMQ快速实战以及核心概念详解

RabbitMQ快速实战以及核心概念详解 一、MQ介绍 1、什么是MQ&#xff1f;为什么要用MQ&#xff1f; ChatGPT中对于消息队列的介绍是这样的&#xff1a; 什么是消息队列 消息队列是一种在应用程序之间传递消息的技术。它提供了一种异步通信模式&#xff0c;允许应用程序在不同…

闰秒终于要取消了!一文详解其来源及影响

导读 | 第27届国际计量大会宣布最迟不晚于2035年取消引入闰秒&#xff0c;这一消息引起轰动。上一次闰秒产生&#xff0c;对Reddit、Mozilla、FourSquare等都产生了一定的问题&#xff0c;其中Reddit宕机时间超过1个半小时&#xff01;本栏目特邀腾讯后台开发工程师陶松桥&…

GPT-5暂时来不了 OpenAI悄然布局移动端

OpenAI彻底用GPT-4带火自然语言大模型后&#xff0c;互联网科技行业的大头、小头都在推出自家的大模型或产品。一时间&#xff0c;生成式AI竞速赛上演&#xff0c;“吃瓜群众”也等着看谁能跑赢OpenAI。 坊间预测&#xff0c;干掉GPT-4的还得是GPT-5。结果&#xff0c;OpenAI的…

悄然招募移动端工程师 OpenAI矛头调向移动端

2022年底&#xff0c;人工智能程序ChatGPT爆火&#xff0c;上线短短两月&#xff0c;就获1亿月度活跃用户&#xff0c;成为历史上增长最快的面向消费者的应用。随后全球的科技巨头都热火朝天地入局自然语言大模型赛道。不过推出ChatGPT的人工智能巨头OpenAI目前并不打算训练GPT…

马斯克宣布打造 ChatGPT 竞品!OpenAI CEO 给他泼了一盆冷水,GPT-5 或将大变

无脑增加 模型规模 已经落伍 当你在 ChatGPT 或者新 bing 里输入一个问题&#xff0c;AI 会调用它的云端大脑&#xff0c;思索一番&#xff0c;生成一段较为合理的回答。 而在 OpenAI 开发 GPT 时&#xff0c;也反复提到了参数正变得庞大&#xff0c;模型的规模也在逐代变得复…

死磕数据库系列(二十六):MySQL 高可用之单主、双主模型组复制配置实践

点关注公众号&#xff0c;回复“1024”获取2TB学习资源&#xff01; 前面我们学习&#xff1a;MySQL 高可用之组复制&#xff08;MGR&#xff09;技术的相关原理知识&#xff0c;今天我将详细的为大家介绍 MySQL 高可用技术组复制的单主、双主两种模型下的原理及配置相关知识&a…

chatgpt赋能python:Python中三角函数的使用

Python中三角函数的使用 介绍 Python是一种非常流行的编程语言&#xff0c;因为它非常易于学习和使用。Python中有很多实用的库和模块&#xff0c;可以帮助开发人员更轻松地完成各种任务。其中包括Python的数学库&#xff0c;其中包括三角函数。 三角函数是最基本的数学函数…

断网了,还能ping通 127.0.0.1 吗?[localhost与127.0.0.1区别]

1.应用场景 主要用于学习了解localhost 与 127.0.0.1的区别&#xff0c; 本质. 以及计算机关于本机地址是如何工作的。 为什么要有这个地址。 2.学习/操作 1.文档阅读 断网了&#xff0c;还能ping通 127.0.0.1 吗&#xff1f; 开发环境- 配置虚拟主机域名/hosts文件 2.整理输…

反调试与反反调试

参考文本 (190条消息) C 反反调试&#xff08;NtQueryInformationProcess&#xff09;_(-: LYSM :-)的博客-CSDN博客 Windows 平台反调试相关的技术方法总结—part 2 - 先知社区 C/C MinHook 库的使用技巧 - lyshark - 博客园 (cnblogs.com) (177条消息) C 反反调试&#x…