未来已来,大模型无处不在。音视频技术人,你准备好了吗?

音视频领域正面临着一场人机交互体验的革命,是算力、连接、显示整个端到端革命的升级,市场也在呼唤着颠覆式的终端,现象级的内容以及全新的产业生态。”

技术是从什么时候开始改变我们的生活的?

dd5133a4e473ce3ea4a5e10e21e28beb.jpeg

打开电视,电影《瞬息全宇宙》为我们带来了一次视听上的顶级盛宴。飞速旋转的图片,背后是技术的把控和加持;

faaa25b805d14fa5dab9fdd18f92b678.gif

手机里,“哪几种人将被人工智能取代?”的新闻在不停弹窗;便利店中,一个个由算法排列的货架会记住你对食物的偏好,并带来超高的销售转化,更不必提 ChatGPT 的高效带给人类的恐慌:我们似乎早已忘记,从 2016 年 Alpha Go 打败棋王的那天起,AI 就准备颠覆世界了。

a8f3260f15c7d9f72df4a7e86a475148.jpeg

cr. Wei-Shen Wang

疫情的结束和 ChatGPT 的出现让技术人卷得更加疯狂:在现有的市场竞争环境下,越来越多的企业开始专注于降本增效;另一方面,对于不断涌现的新技术、新场景,实时音视频的标准化将引导行业迈向更高的服务质量,而海外业务版图的扩大也将驱动行业迎来新一轮的业务增长。据艾瑞咨询报道:

预计到 2024年,实时音视频(RTC)PaaS 市场规模将达到 30 亿元。

未来已来,可答案在哪里?我们似乎还没有看到,但在 LiveVideoStackCon 你一定能看到:

在刚刚结束的北京站,许多人收获了满满的技术干货,看到了音视频的无限可能。

176dfc547d4054069d62c6c308da78f8.jpeg

LVS Con 2022北京站

随着 ChatGPT 的不断迭代,未来是一个模型无处不在的时代,而对于音视频应用和体验的思考,就必须从二维转向三维甚至是更多维,就像被浸泡在了某个空间,周围环绕的都将是未来技术的产物。

LiveVideoStackCon 上海站「沉浸 新视界」的主题正是这一想法的表达。

除了技术本身,如何让技术的产物、产品、方案也能沉浸在生活周围,实时支持我们的生活、体验、社交等等,将是此次活动讨论的重点。

那么,你可能想问,上海站到底讲什么?

本次上海站的「沉浸 新视界」将会在音频、视频、图像等技术的最新思考与应用实践。除了继续探索音视频技术在不同场景下的融合与发展外,还将增添云游戏、AIGC、IoT、元宇宙和数字化行业案例等时下热门的话题。

以下

是目前可以公开的情报

eca268eb0e1a9eb8451994161917f2ea.jpeg

翟爽

上海广播电视台技术中心 

上海东方传媒有限公司转播部副总监

《SMT 在远程制作及虚拟化云端制作的发展实践》

随着流媒体技术、虚拟化技术和云技术的发展,也伴随着疫情等客观因素,远程制作的应用越来越广泛,虚拟化及云端制作也逐渐开始起步,一种全新的转播模式也在被世界各大重要赛事所接受,所认可。远程制作和虚拟化云端制作到底能给客户带来什么,是制作质量的提升,类似于 HDR,4K,8K,三维声给我们带来的全新的视听体验,还是制作成本的大幅减少,这是值得讨论的。

f54de15d6b4f0aa7355fca5d2c3422cc.jpeg

马良

Pinterest 视频架构师

《探讨如何在Pinterest中部署HTTP/3》

本次分享我们将首先介绍 Pinterest 的视频规模和技术栈,不同阶段面临的挑战和演化。接下来介绍 Pinterest 如何定义一个好的视频浏览体验,并建立相关的指标。最后分享 Pinterest 如何部署 HTTP/3,包括 HTTP/3 对视频播放关键指标的影响,以及多 CDN 的问题和解决方案。

18e7d72d8d4339a358818945199da0c1.jpeg

文念

腾讯

高级工程师/云游戏后台开发

《面向超低延迟的多路径传输优化》

随着互联网行业的发展,从文字、语音、图片,视频,再到最近两年非常火爆的直播、视频会议等,整个行业是向着流量越来越大,实时性越来越高的方向发展。和行业内要求最高的视频通话场景相比,云游戏的要求更高,延迟从百毫秒级降低到二十毫秒级,码率从 2Mbps 上升到 30Mbps,这对网络传输的实时性提出全新的挑战。

本文分享主要分为 3 个部分,第一部分介绍实时音视频场景下,数据可靠性和网络不确定性对低延迟高码率系统的挑战;第二部分介绍手机端基于 wifi+4g 双链路的传输方案,以及如何在延迟,码率和低流量消耗下求取最佳平衡;第三部分介绍系统架构设计上,如何支撑灵活的多路径传输。

9a79549b81b1ca4ec1a90ec83f1faf12.jpeg

      陆其明

        瑞声科技

          软件开发总监

“触”手可及的视听新体验——触觉反馈标准及新进展

人类对美好体验的追求是永无止境的。在多媒体应用领域,特别是在 AR/VR 场景下,如何让人们获得更加沉浸的体验?仅仅在视觉和听觉两个方向努力是不够的,还需要触觉、嗅觉、味觉… 本次分享侧重于触觉的介绍,而行业内对触感的应用价值和触感品质的认知是不够的,相关标准的缺失也阻碍了技术的快速普及。

本次分享分三个部分:第一部分介绍触觉的生物学原理、应用价值以及触感设计和表达方法;第二部分介绍触感的软硬件生态现状,以及相关的应用开发技术,力求全平台覆盖;第三部分介绍触感相关国际标准的最新动向和进展。通过以上三个部分的内容,期望大家对触感开始有基本的认知,认可其价值,并且能够快速上手,共同促进应用端的繁荣。

8a1dcc0e055216a6fe0b8fc26e788199.jpeg

付涛

中国移动智慧家庭运营中心 

人工智能专家/多媒体通信算法专家

《家庭场景大模型技术与应用实践》

智慧家庭作为一种新的生活方式,受到越来越多的关注,其核心在于人们渴望从繁琐的家居操作中解脱,把更多精力投入到生活中的精彩和感动中。

对话陪伴,家庭安防,家庭教育,家庭健康,家庭娱乐等模块是智慧家庭的重要组成部分,其中涉及到自然语言处理,计算机视觉,语音处理等多模态复杂 AI 理解和生成技术,为解决人们对智能要求的不断提升,需要利用大规模预训练大模型所涌现出的通用智能,并针对性的做场景化微调适配;具体的,我们利用千亿参数的大模型,并结合家庭场景进行指令微调和对应算法优化,赋能了亿级的智慧家庭用户,其中智能对话,智能安防,家庭教育等覆盖率达到了千万级以上;

本次分享分为 4 个部分,第一部分主要是介绍家庭场景的核心业务,同步引入算法应用的关键问题,第二部分主要是回顾行业大模型的发展现状和主要算法架构,第三部分是我们在家庭场景下大模型的关键技术研发,第四部分主要是大模型的应用实践。

以上只是本次分享内容的冰山一角,后续更多内容细节我们将随时更新。在这里,你不仅可以与业内大佬们进行技术上的心得交流,还可以感受到多媒体生态内的头部公司、顶级玩家对行业当前发展趋势、瓶颈挑战,与对未来规划的深入解读。绝对值得期待! 

fd3b9d7bb3033f3451cb31b41c328d36.jpeg

LVS Con 2022北京站

心动了吗?7 月 28-29 日,上海龙之梦大酒店等你!最后两天的八折优惠实实在在,扫码即可购票!心动不如行动!

8 折购票通道倒计时两天

点击“阅读原文”即可购买

最后,我们期待你也有关于“沉浸”式的音视频话题,直接联系我们,分享给大家吧!


95f19e791edf03af2192a3ec97ff6df0.jpeg

LiveVideoStackCon 2023上海讲师招募中

LiveVideoStackCon是每个人的舞台,如果你在团队、公司中独当一面,在某一领域或技术拥有多年实践,并热衷于技术交流,欢迎申请成为LiveVideoStackCon的讲师。请提交演讲内容至邮箱:speaker@livevideostack.com。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/13102.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

阿里CTO线退出历史舞台/ AI视频公司Runway估值破百亿/ OpenAI确认不用API数据训练…今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 大家好,今天是5月6日,又一个“星期五”。 科技圈更多新鲜事儿,下滑走起~ 阿里CTO线退出历史舞台 据雪豹财经社独家消息,充当各业务技术中台的阿里CTO线近日完成了组织架构的…

快影内测多款AIGC新功能,短视频智能创作时代即将到来?

AIGC作为AI细分之下的重要赛道,迅速在短视频、绘画、音乐创作等领域出圈,吸引了如阿里、字节、百度、美团等多个互联网大厂,并纷纷布局和计划推出AI类的产品。 特别是百度旗下生成式AI产品“文心一言”,已成为不少文字创作者的辅助…

一天搞定50条视频!AI替你打工的流程有人已经跑出来了

梦晨 金磊 发自 凹非寺量子位| 公众号 QbitAI 最近的AI狂欢属于ChatGPT,接下来该轮到AI生成视频了。 想做UP主但又不知道怎么剪视频的人,这下真的可以放开手脚,专心管内容创作,剩下的工作完全丢给AI来生成了。 最重磅的…

免费体验Stable Diffusion deforum文转视频插件,还有deforum API 接口部署介绍!

如何使用 Serverless Devs 和函数计算快速体验部署 Stable Diffusion,这个是小白也能简单体验安装部署的教程.有电脑就能操作,依托阿里云原生服务.不用考虑硬件问题 本篇主要讲解怎么安装跟部署自定义安装插件跟模型.以deforum文转视频插件举例.deforum api 接口 自…

华人团队颠覆CV!SEEM完美分割一切爆火,一键分割「瞬息全宇宙」

作者 | 新智元 编辑 | 自动驾驶与AI 点击下方卡片,关注“自动驾驶与AI”公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心【语义分割】技术交流群 后台回复【领域综述】获取自动驾驶全栈近80篇综述论文! Meta的「分割一切」的横空出世&…

SEEM:微软基于 CV 大模型新作,分割“瞬息全宇宙”

文 | 智商掉了一地 交互式视觉分割新作,具有语义感知的新模型~ 自从 Meta 发布了“分割一切”的 SAM 之后,各种二创如雨后春笋般冒出,昨天微软的一篇论文又在推特上引起讨论,虽然最开始吸引小编的是它的名字——分割“瞬息全宇宙”…

带你简单了解Chatgpt背后的秘密:大语言模型所需要条件(数据算法算力)以及其当前阶段的缺点局限性

带你简单了解Chatgpt背后的秘密:大语言模型所需要条件(数据算法算力)以及其当前阶段的缺点局限性 1.什么是语言模型? 大家或多或少都听过 ChatGPT 是一个 LLMs,那 LLMs 是什么?LLMs 全称是 Large Language…

分享一个ChatGPT提示词技巧

先说原理: 核心点:利用ChatGPT的训练特性模仿功能; 先从网上找10来个优质的提示词; 然后把这些优质提示词“喂”给ChatGPT,目的是让它学会这些优质提示词的套路; 接着,我们再提供一个主题&a…

GPT-4发布!能打败ChatGPT的只有OpenAI自己!

众所周知,chatGPT的对话生成模型用的是GPT3.5,而今发布的GPT4相比GPT3,又有了巨大的升级: 输入仅文本 > 输入文本和图像,具备了强大的识图能力 文字输入限制3k字 > 2.5w字 准确率、对细节的理解能力大幅提升 o…

ChatGPT,音乐,与数据库

小编君是个不务正业,喜欢搞跨界,干啥啥不成的DBA,大概在十一年前就有个不成熟的妄念,能否用计算机来写音乐? ▌用ChatGPT来搞音乐? 音乐是一个个的音符,按照乐理规则排列的。音符之间是否和谐…

吴恩达 ChatGPT Prompt Engineering for Developers 系列课程笔记--08 Chatbot

08 Chatbot ChatGPT的一种重要功能是作为一个聊天机器人,本节将展示如何和ChatGPT进行对话 1) 不同的角色(Roles) 前面几节的课程中,我们通过如下函数调用ChatGPT的接口,输入用户输入的prompt,返回模型生…

大厂对ChatGPT的开发利用和评估案例收录

ChatGPT已经进入各行各业,但是实际在工作中的有哪些应用呢?这里分享互联网一线大厂分享的一些实际使用案例,所有文章收录到 大厂对ChatGPT的开发利用和评估案例收录https://www.webhub123.com/#/home/detail?projectHashid67792343&owne…

ChatGPT专业应用:生成导播规划表

正文共 971 字,阅读大约需要 5 分钟 直播运营必备技巧,您将在5分钟后获得以下超能力: 生成导播规划表 Beezy评级 :A级 *经过寻找和一段时间的学习,一部分人能掌握。主要提升效率并增强自身技能。 推荐人 | Kim 编辑者…

ChatGPT专业应用:生成节目串词

正文共 839 字,阅读大约需要 5 分钟 主持人必备技巧,您将在5分钟后获得以下超能力: 生成节目串词 Beezy评级 :A级 *经过寻找和一段时间的学习,一部分人能掌握。主要提升效率并增强自身技能。 推荐人 | Kim 编辑者 | …

4月份读书学习好文记录

4月份学习记录 找到自己感兴趣的方向,而不是人云亦云,知道自己想要的是什么,而不是一直得过且过! 差距是怎么出现的,四年来的点点滴滴!!! 一个前端大佬的十年回顾 | 漫画前端的前世…

一览 A16z 在 2023 年重点关注的 Crypto 和 Web3 游戏想法

原文来自:a16z 编译:DeFi 之道 隔夜的粥 注:顶级投资机构 a16z 刚刚发布了一份综合关注清单,列出了科技建设者在未来一年可能要解决的“大想法”,这份清单涵盖了消费科技、游戏、AI、Crypto 等多个领域,以下是一些让 a…

让ChatGPT分析下五一出行的数据

这个五一的真的真的真的很火,哪哪都是人人人人人人。 刚好看到官媒发出了五一期间的旅游宏观数据,我们就来简单分析下。 有了ChatGPT以后,就没必要自己亲自动手啦,直接丢给ChatGPT: 好吧,不得不说&#xff…

放大招:三步搞定ChatGPT提示词,轻松写出高质量提问,最新经验分享

在撰写ChatGPT提示语的时候,有一个基本的三层结构,经过在工作和生活上的实践,有助于解决大多数不同类型的任务。 尤其在你的问题有点复杂,想不清楚要怎么问比较好的时候,通过三层结构,让我们有结构的提出问…

ChatGPT旋风如何“卷”到汽车行业?

国产版ChatGPT究竟如何,还需静待上线后才能见分晓。 坐上车,ChatGPT即将驶向风口。 人气爆棚的ChatGPT,最近又把热度带到了汽车行业。 先是,百度即将内测的生成式对话产品“文心一言”的朋友圈不断扩大,吉利、长城、海…

ChatGPT的出现,会帮助汽车行业实现L4级别的自动驾驶吗?

编辑 | 汽车人 原文链接:https://www.zhihu.com/question/583534193 点击下方卡片,关注“自动驾驶之心”公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心【全栈算法】技术交流群 回答一 作者:Naiyan Wang 链接:h…