音视频技术开发周刊 | 282

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。

eeb6712e120561655422bd3662241e53.jpeg

畅谈音视频未来无限可能,2022音视频技术大会北京站 最新日程公布

2023年3月31日-4月1日LiveVideoStackCon 2022音视频技术大会北京站,我们将一同畅谈多媒体生态发展,探讨音视频的未来无限可能,探索行业与新技术的融合碰撞。


778aa0488c9f0731b6414b2aa5dc32cf.png

ChatGPT背后的核心技术

原本这篇论文是聚焦在自然语言处理领域,但由于其出色的解释性和计算性能开始广泛地使用在AI各个领域,成为最近几年最流行的AI算法模型,无论是这篇论文还是transformer模型,都是当今AI科技发展的一个缩影。以此为前提,本文分析了这篇论文的核心要点和主要创新初衷。

结合ChatGPT的微软New Bing体验到底如何

2 月 7 日,微软 CEO Satya Nadella 在发布会上宣布,发布 ChatGPT 版搜索引擎 New Bing。发布会上 Nadella 称,"It's a new day for search... The race starts today" ,可以看出微软对其 Bing 搜索引擎的全面改革战略意义重大。必应目前仅占全球搜索量的 3%,而谷歌则占 93%,微软难得的机会来宣称技术优势,因为搜索市场面临多年来的首次重大变化,利用集成 ChatGPT 技术,对谷歌在搜索引擎市场长达 20 年的主导地位发起了前所未有的挑战。

打造中国版 ChatGPT,国内有哪些学术力量能抢滩?

本篇旨在从学术研究的角度出发,对国内各大潜在力量在这一波 ChatGPT 竞赛中的位置进行盘点。

复旦邱锡鹏团队发布类 ChatGPT 模型 MOSS,现已暂停内测

当下,ChatGPT 无疑已是全球人工智能领域最炙手可热的现象级模型,MOSS 的出现,是类 ChatGPT 模型在国内的一次尝试,对学术界和产业界来说,都是不小的激励,也为其他研究团队提供了经验,将助力大语言模型的进一步探索和应用。

b273f6eb8a5cddd81e61e09a2a52d9bd.png

AIGC全球独角兽大盘点:AI自动画图领域,6家企业上榜

本篇文章将为大家盘点AIGC图片领域的全球独角兽,为产品研发、场景赋能、技术创新、商业模式等提供借鉴。

16647f954fa0c67b38144493decae227.jpeg

VR硬件技术的下下下一步——“MEC”

本文将从移动边缘计算的定义、工作原理,衔接到具体在 VR 头显中可落地应用场景,试图解答移动边缘计算在 VR 中的重要性及前景。

Matthew Ball:十多年后AR/VR为何依然发展缓慢?

回顾过去的AR/VR发展,投资人Matthew Ball发表了万字长文,详细分析了我们想知道的许多问题,比如:为什么AR/VR头显还没有取代手机,这项技术差在哪,到底还要走多久?此外,也解释了许多人对AR/VR技术的一些误解。

b2d44d4253abae59063c16c32adb0eff.png

海量并发低延时 RTC-CDN 系统架构设计(上)

海量并发低延时 RTC-CDN 系统架构设计(下)

本文将重点分享:网易云信如何构建 RTC-CDN 服务架构,深入剖析这套架构是如何解决海量并发、超低延时与低成本三大行业核心诉求,并结合低延时直播和元宇宙两大场景,为大家讲解 RTC-CDN 的核心技术和最佳实践。上篇文章主要介绍:背景介绍,以及构建海量并发流媒体服务架构;下篇文章主要介绍:构建低延时 RTC-CDN 架构、低延时 RTC-CDN 场景化技术实战、总结与展望

8572c19cd48b382b7d51c43a00251ea7.png

发布视频卡顿有延迟?海事卫星加上TA,“船岸互通”不再难

如何突破有限通信带宽的限制,提升远程视频回传速率,当虹科技推出窄带宽条件下智能视频压缩回传解决方案。基于“视频编码”与“AI识别”双引擎,赋能远洋船舶视频传输与智能化转型。

抖音世界杯的画质优化实践

世界杯赛事涉及链路众多,如何保障各链路的画质稳定并进一步提升画质,是一个巨大的挑战。本文主要介绍火山引擎多媒体实验室在世界杯期间画质的相关工作。

353129fc46a0dfe51e62107a76b1cf86.jpeg

3D成像技术介绍

LiveVideoStack邀请到了螳螂慧视的骆晓峰老师,为我们介绍3D成像技术。

AAAI 2023|优图16篇论文速览

今年腾讯优图实验室共有16篇论文入选,内容涵盖了多标签分类、姿态估计、目标检测、HOI、小样本学习等研究方向,展示了腾讯优图在人工智能领域的技术能力和学术成果。本文介绍了腾讯优图实验室入选论文及方法概述。

83dfcaa2370fdf89f556f540490e165e.png

美团视觉GPU推理服务部署架构优化实践

面对在线推理服务使用的GPU资源不断增加、GPU利用率普遍较低的挑战,美团视觉研发团队决定通过模型结构拆分和微服务化进行优化,他们提出了一种通用高效的部署架构,来解决这种常见的性能瓶颈问题。以“图像检测+分类”服务为例,优化后的服务压测性能指标GPU利用率由40%提升至100%,QPS也提升超过3倍。本文将会重点介绍推理服务部署架构优化的工程实践,希望对大家能有所帮助或启发。

dd44aa79c9c01e94acc6865473a7f392.png

FOSDEM 2023 | 双重展示: FFmpeg 6 和 VLC.js

知名多媒体开发者兼 VideoLAN 总裁 Jean-Baptiste Kempf 回顾了 FFmpeg 5.0 版本和 5.1 版本中的改进,并对 FFmpeg 6.0 新版本中的内容进行了分享,还对 VLC 及其依赖项使用 wasm 编译到 Web 浏览器,并使用 Webcodecs 解码视频进行了演示。


阅读/资源推荐

【作品】WebRTC+ChatGPT实现语音聊天机器人

https://www.bilibili.com/video/BV1ty4y1Z7V1/?spm_id_from=333.999.0.0&vd_source=f0ab33d7a845fb475b17a70478dc9146

活动推荐

9900559386bc02f0c84409bf2338f251.png

【公开课】基于AI和NPU的Codec变革

伴随通信容量(包括5G以及千兆有线网络)的发展,高带宽为更多用户接入超高清视频提供了可能。但是随着用户数量的增加,高质量的压缩方案也是变得更迫切,而边缘计算平台的性能提升也为解码增强提供了算力支持。AI算法的进步则提供了更丰富的计算方式。

时间:fb220465ff5ee0bb3467222ac40f7981.png2023年3月2日 19:00

报名:36f1b8a01d538520e08996920d129cc4.png扫码关注LiveVideoStack小秘书,获得观看方式。

25e549407168f9346c1f45ade0300d8a.jpeg

“中国好SaaS”大赛由中国最大的技术高管社区、钛媒体旗下ITValue在2016年首次发起,基于广泛的行业影响力和高度垂直的信息化决策人社群,帮助有能力、有潜力的SaaS企业高效链接业务需求方和投资机构,助力优质SaaS创业企业获得更多的发展机会。点击【阅读原文】了解更多详细信息,报名参与。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22869.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt赋能Python-python_cdo

Python-CDO: 数据处理的超棒工具 Python-CDO是一种极为实用的工具,用于在Python中使用CDO(Climate Data Operators)命令。CDO是一个功能强大的工具,用于处理气候和气象大型数据集,如Satellite and Reanalysis数据。而…

时间序列分析——基于R | 第2章 时间序列的预处理习题代码

时间序列分析——基于R | 第2章 时间序列的预处理习题 1.考虑序列{1,2,3,4,5,…,20} 1.1判断该序列是否平稳 x <- seq(1,20);x ## [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1.2样本自相关系数 max_lag <- 6 acf_x <- acf(x, lag.max max_l…

Google 人机验证(reCaptcha)无法显示解决方案

Google 人机验证无法显示解决方案 第一步 安装插件Chrome/Edge 电脑版Firefox 电脑版 第二步 配置插件原理参考文章 前言&#xff1a;为了防止机器人攻击&#xff0c;国外很多网站都使用了 Google reCaptcha 验证码。reCaptcha 对于国外用户非常的友好&#xff0c;但是… 对于国…

解决谷歌人机验证(Captcha)显示问题

文章目录 前言一、Header Editor 下载、安装与配置1. 插件下载2. 插件安装3. 插件配置 前言 由于谷歌服务在国内不可用&#xff0c;所以正常访问时某些网址时&#xff0c;经常会出现需要人机验证的问题&#xff0c;影响正常使用。在不使用科学上网的情况下&#xff0c;我们可以…

利用Python解决掉谷歌人机验证,全自动识别真的牛啊

一、接触前感受 第一次带我领略yolov5风骚的是这个视频&#xff1a;【亦】警惕AI外挂&#xff01;我写了一个枪枪爆头的视觉AI&#xff0c;又亲手“杀死”了它。 这样一来&#xff0c;我对人工智能打游戏产生了浓厚的兴趣&#xff0c;于是在B站查找人工智能基础&#xff0c;随便…

【开源项目】ChatGPT智能聊天系统后台管理解析

ChatGPT是likeshop近期新研发出来的一款AI智能聊天对话的产品&#xff0c;此系统是基于likeadmin-PHP开发的智能对话系统&#xff0c;ChatGPT是一种基于人工智能技术的聊天机器人&#xff0c;它可以与用户进行自然语言对话&#xff0c;提供各种服务和答案。ChatGPT的核心技术是…

checkra1n越狱工具下载地址

https://checkra.in/releases/ 虚拟机 checkra1n -26和-31错误 不支持虚拟机,需要在黑苹果&#xff0c;Ra1nUSB&#xff0c;Linux下越狱 AMD的黑苹果&#xff0c;错误&#xff0d;31&#xff0c; AMD的CPU使用checkra1n越狱黑苹果会报错-31 适用系统iOS13-13.3.1基本都是…

RabbitMQ快速实战以及核心概念详解

RabbitMQ快速实战以及核心概念详解 一、MQ介绍 1、什么是MQ&#xff1f;为什么要用MQ&#xff1f; ChatGPT中对于消息队列的介绍是这样的&#xff1a; 什么是消息队列 消息队列是一种在应用程序之间传递消息的技术。它提供了一种异步通信模式&#xff0c;允许应用程序在不同…

闰秒终于要取消了!一文详解其来源及影响

导读 | 第27届国际计量大会宣布最迟不晚于2035年取消引入闰秒&#xff0c;这一消息引起轰动。上一次闰秒产生&#xff0c;对Reddit、Mozilla、FourSquare等都产生了一定的问题&#xff0c;其中Reddit宕机时间超过1个半小时&#xff01;本栏目特邀腾讯后台开发工程师陶松桥&…

GPT-5暂时来不了 OpenAI悄然布局移动端

OpenAI彻底用GPT-4带火自然语言大模型后&#xff0c;互联网科技行业的大头、小头都在推出自家的大模型或产品。一时间&#xff0c;生成式AI竞速赛上演&#xff0c;“吃瓜群众”也等着看谁能跑赢OpenAI。 坊间预测&#xff0c;干掉GPT-4的还得是GPT-5。结果&#xff0c;OpenAI的…

悄然招募移动端工程师 OpenAI矛头调向移动端

2022年底&#xff0c;人工智能程序ChatGPT爆火&#xff0c;上线短短两月&#xff0c;就获1亿月度活跃用户&#xff0c;成为历史上增长最快的面向消费者的应用。随后全球的科技巨头都热火朝天地入局自然语言大模型赛道。不过推出ChatGPT的人工智能巨头OpenAI目前并不打算训练GPT…

马斯克宣布打造 ChatGPT 竞品!OpenAI CEO 给他泼了一盆冷水,GPT-5 或将大变

无脑增加 模型规模 已经落伍 当你在 ChatGPT 或者新 bing 里输入一个问题&#xff0c;AI 会调用它的云端大脑&#xff0c;思索一番&#xff0c;生成一段较为合理的回答。 而在 OpenAI 开发 GPT 时&#xff0c;也反复提到了参数正变得庞大&#xff0c;模型的规模也在逐代变得复…

死磕数据库系列(二十六):MySQL 高可用之单主、双主模型组复制配置实践

点关注公众号&#xff0c;回复“1024”获取2TB学习资源&#xff01; 前面我们学习&#xff1a;MySQL 高可用之组复制&#xff08;MGR&#xff09;技术的相关原理知识&#xff0c;今天我将详细的为大家介绍 MySQL 高可用技术组复制的单主、双主两种模型下的原理及配置相关知识&a…

chatgpt赋能python:Python中三角函数的使用

Python中三角函数的使用 介绍 Python是一种非常流行的编程语言&#xff0c;因为它非常易于学习和使用。Python中有很多实用的库和模块&#xff0c;可以帮助开发人员更轻松地完成各种任务。其中包括Python的数学库&#xff0c;其中包括三角函数。 三角函数是最基本的数学函数…

断网了,还能ping通 127.0.0.1 吗?[localhost与127.0.0.1区别]

1.应用场景 主要用于学习了解localhost 与 127.0.0.1的区别&#xff0c; 本质. 以及计算机关于本机地址是如何工作的。 为什么要有这个地址。 2.学习/操作 1.文档阅读 断网了&#xff0c;还能ping通 127.0.0.1 吗&#xff1f; 开发环境- 配置虚拟主机域名/hosts文件 2.整理输…

反调试与反反调试

参考文本 (190条消息) C 反反调试&#xff08;NtQueryInformationProcess&#xff09;_(-: LYSM :-)的博客-CSDN博客 Windows 平台反调试相关的技术方法总结—part 2 - 先知社区 C/C MinHook 库的使用技巧 - lyshark - 博客园 (cnblogs.com) (177条消息) C 反反调试&#x…

哈工大2023春计算机系统大作业:程序人生-Hello‘s P2P

摘要&#xff1a;以hello.c程序为例&#xff0c;文章探究了从C语言代码文件到进程回收这一过程。基于Linux操作系统&#xff0c;运用gcc&#xff0c;edb等工具&#xff0c;详细介绍了程序编译的流程&#xff0c;分析了运行可执行文件时系统的进程管理与存储管理原理与机制&…

Transformer模型的基础演算

作者 | Quentin Anthony、Stella Biderman、Hailey Schoelkopf OneFlow编译 翻译 | 贾川、徐佳渝、杨婷 1 引言 Transformer语言模型的许多基本重要信息可以通过简单计算得出。不幸的是&#xff0c;这些计算公式在自然语言处理&#xff08;NLP&#xff09;社区中并不广为人知。…

DetectGPT:使用概率曲率的零样本机器生成文本检测

DetectGPT的目的是确定一段文本是否由特定的llm生成&#xff0c;例如GPT-3。为了对段落 x 进行分类&#xff0c;DetectGPT 首先使用通用的预训练模型&#xff08;例如 T5&#xff09;对段落 ~xi 生成较小的扰动。然后DetectGPT将原始样本x的对数概率与每个扰动样本~xi进行比较。…

Prompt工程探索

在开源大模型LLaMA等成熟后&#xff0c;目前业界焦点在于&#xff1a;如何才能让 LLM 按照我们的要求去做&#xff0c;也就是prompt工程&#xff0c;设计产生大量prompt训练语料用于微调大模型 设计原则 首先要说的是设计原则&#xff0c;主要包含以下几个&#xff1a; 清晰…