每周一期,纵览音视频技术领域的干货。
新闻投稿:contribute@livevideostack.com。
畅谈音视频未来无限可能,2022音视频技术大会北京站 最新日程公布
2023年3月31日-4月1日,LiveVideoStackCon 2022音视频技术大会北京站,我们将一同畅谈多媒体生态发展,探讨音视频的未来无限可能,探索行业与新技术的融合碰撞。
ChatGPT背后的核心技术
原本这篇论文是聚焦在自然语言处理领域,但由于其出色的解释性和计算性能开始广泛地使用在AI各个领域,成为最近几年最流行的AI算法模型,无论是这篇论文还是transformer模型,都是当今AI科技发展的一个缩影。以此为前提,本文分析了这篇论文的核心要点和主要创新初衷。
结合ChatGPT的微软New Bing体验到底如何
2 月 7 日,微软 CEO Satya Nadella 在发布会上宣布,发布 ChatGPT 版搜索引擎 New Bing。发布会上 Nadella 称,"It's a new day for search... The race starts today" ,可以看出微软对其 Bing 搜索引擎的全面改革战略意义重大。必应目前仅占全球搜索量的 3%,而谷歌则占 93%,微软难得的机会来宣称技术优势,因为搜索市场面临多年来的首次重大变化,利用集成 ChatGPT 技术,对谷歌在搜索引擎市场长达 20 年的主导地位发起了前所未有的挑战。
打造中国版 ChatGPT,国内有哪些学术力量能抢滩?
本篇旨在从学术研究的角度出发,对国内各大潜在力量在这一波 ChatGPT 竞赛中的位置进行盘点。
复旦邱锡鹏团队发布类 ChatGPT 模型 MOSS,现已暂停内测
当下,ChatGPT 无疑已是全球人工智能领域最炙手可热的现象级模型,MOSS 的出现,是类 ChatGPT 模型在国内的一次尝试,对学术界和产业界来说,都是不小的激励,也为其他研究团队提供了经验,将助力大语言模型的进一步探索和应用。
AIGC全球独角兽大盘点:AI自动画图领域,6家企业上榜
本篇文章将为大家盘点AIGC图片领域的全球独角兽,为产品研发、场景赋能、技术创新、商业模式等提供借鉴。
VR硬件技术的下下下一步——“MEC”
本文将从移动边缘计算的定义、工作原理,衔接到具体在 VR 头显中可落地应用场景,试图解答移动边缘计算在 VR 中的重要性及前景。
Matthew Ball:十多年后AR/VR为何依然发展缓慢?
回顾过去的AR/VR发展,投资人Matthew Ball发表了万字长文,详细分析了我们想知道的许多问题,比如:为什么AR/VR头显还没有取代手机,这项技术差在哪,到底还要走多久?此外,也解释了许多人对AR/VR技术的一些误解。
海量并发低延时 RTC-CDN 系统架构设计(上)
海量并发低延时 RTC-CDN 系统架构设计(下)
本文将重点分享:网易云信如何构建 RTC-CDN 服务架构,深入剖析这套架构是如何解决海量并发、超低延时与低成本三大行业核心诉求,并结合低延时直播和元宇宙两大场景,为大家讲解 RTC-CDN 的核心技术和最佳实践。上篇文章主要介绍:背景介绍,以及构建海量并发流媒体服务架构;下篇文章主要介绍:构建低延时 RTC-CDN 架构、低延时 RTC-CDN 场景化技术实战、总结与展望
发布视频卡顿有延迟?海事卫星加上TA,“船岸互通”不再难
如何突破有限通信带宽的限制,提升远程视频回传速率,当虹科技推出窄带宽条件下智能视频压缩回传解决方案。基于“视频编码”与“AI识别”双引擎,赋能远洋船舶视频传输与智能化转型。
抖音世界杯的画质优化实践
世界杯赛事涉及链路众多,如何保障各链路的画质稳定并进一步提升画质,是一个巨大的挑战。本文主要介绍火山引擎多媒体实验室在世界杯期间画质的相关工作。
3D成像技术介绍
LiveVideoStack邀请到了螳螂慧视的骆晓峰老师,为我们介绍3D成像技术。
AAAI 2023|优图16篇论文速览
今年腾讯优图实验室共有16篇论文入选,内容涵盖了多标签分类、姿态估计、目标检测、HOI、小样本学习等研究方向,展示了腾讯优图在人工智能领域的技术能力和学术成果。本文介绍了腾讯优图实验室入选论文及方法概述。
美团视觉GPU推理服务部署架构优化实践
面对在线推理服务使用的GPU资源不断增加、GPU利用率普遍较低的挑战,美团视觉研发团队决定通过模型结构拆分和微服务化进行优化,他们提出了一种通用高效的部署架构,来解决这种常见的性能瓶颈问题。以“图像检测+分类”服务为例,优化后的服务压测性能指标GPU利用率由40%提升至100%,QPS也提升超过3倍。本文将会重点介绍推理服务部署架构优化的工程实践,希望对大家能有所帮助或启发。
FOSDEM 2023 | 双重展示: FFmpeg 6 和 VLC.js
知名多媒体开发者兼 VideoLAN 总裁 Jean-Baptiste Kempf 回顾了 FFmpeg 5.0 版本和 5.1 版本中的改进,并对 FFmpeg 6.0 新版本中的内容进行了分享,还对 VLC 及其依赖项使用 wasm 编译到 Web 浏览器,并使用 Webcodecs 解码视频进行了演示。
阅读/资源推荐
【作品】WebRTC+ChatGPT实现语音聊天机器人
https://www.bilibili.com/video/BV1ty4y1Z7V1/?spm_id_from=333.999.0.0&vd_source=f0ab33d7a845fb475b17a70478dc9146
活动推荐
【公开课】基于AI和NPU的Codec变革
伴随通信容量(包括5G以及千兆有线网络)的发展,高带宽为更多用户接入超高清视频提供了可能。但是随着用户数量的增加,高质量的压缩方案也是变得更迫切,而边缘计算平台的性能提升也为解码增强提供了算力支持。AI算法的进步则提供了更丰富的计算方式。
时间:2023年3月2日 19:00
报名:扫码关注LiveVideoStack小秘书,获得观看方式。
“中国好SaaS”大赛由中国最大的技术高管社区、钛媒体旗下ITValue在2016年首次发起,基于广泛的行业影响力和高度垂直的信息化决策人社群,帮助有能力、有潜力的SaaS企业高效链接业务需求方和投资机构,助力优质SaaS创业企业获得更多的发展机会。点击【阅读原文】了解更多详细信息,报名参与。