音视频技术开发周刊 | 293

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。

4882a4f2c8ad681bcc5c1b9c073d2b02.png

谷歌全面反攻 ChatGPT!PaLM 2、Gemini 双杀,Bard 正式开放

以上是2023 Google I/O 大会的重点内容,AI含量极高。

谷歌推拥有26000个H100的超算,加速AI军备竞赛

云提供商正在组建 GPU 大军,以提供更多的 AI 火力。在今天举行的年度 Google I/O 开发者大会上,Google 宣布了一款拥有 26,000 个 GPU 的 AI 超级计算机——A3 ,这个超级计算机是谷歌与微软争夺 AI 霸权的斗争中投入更多资源进行积极反攻的又一证据。

OpenAI发布最新开源项目Shap-E,通过文本就能生成3D模型

5月6日,ChatGPT母公司OpenAI发布了最新开源项目Shap-E,通过文本就能生成3D模型。目前github已经突破2000颗星。

https://github.com/openai/shap-e 

为什么剑桥出身的“AI教父”辛顿会担心?

人类社会的稳定性和鲁棒性并不是弱不禁风、一触即倒的,熟话说的好,“魔高一尺,道高一丈”,未雨绸缪、居安思危将会一直伴随着人类文明的进化发展,现在发生的,过去已经发生过,而且还不止一次,估计这次也不会例外...... 

HugNLP开源啦!教你玩转各种NLP任务,还可训类ChatGPT模型

在大模型训练异常火爆的今天,基于HugNLP框架,还推出了能够支持类ChatGPT模型进行训练和部署的产品HugChat。

用图像对齐所有模态,Meta开源多感官AI基础模型,实现大一统

e0d622c2cf9b69b8ebd531ae92b1ddfe.png

Orillusion引擎正式开源!AIGC时代下的WebGPU轻量级3D渲染引擎!

IBM亮王炸!推出大模型Watsonx,7月将开源!

Watsonx由三大块组成,基础模型watsonx.ai;基于开放式 Lakehouse 架构构建的专用数据存储平台watsonx.data;用于AI安全治理的watsonx.governance。在这三大平台赋能下,可为用户提供一站式安全可靠的生成式AI服务。

「AI孙燕姿」全网沸腾!AI翻唱大爆发,整个华语乐坛都「复兴」了

2023春季《计算共形几何》课程总结

抖音关于人工智能生成内容的平台规范暨行业倡议

人工智能技术的快速发展,为互联网行业带来了更多可能性的同时,也带来了虚假信息、侵权等问题。参照《互联网信息服务深度合成管理规定》等法律法规,抖音提出十一条平台规范与行业倡议。

d0e5db99a808ffc3736006c09b906e0f.png

声网自研编码器 a264 & a265:更优画质更低能耗,进一步适配实时互动场景需求

“玲珑”编解码融合架构助力视频多元化需求

LiveVideoStackCon 2022北京站邀请到了安谋科技多媒体产品经理董峰,为我们分享“玲珑”编解码融合架构助力视频多元化需求。

MPEG LA和Via Licensing专利池的合并会带来哪些影响?

文章表示,该合并将使MPEG LA负责管理HEVC、AV1和VVC等主要视频编解码器的专利池,这些编解码器是当前和未来的许多流媒体应用程序所依赖的核心技术。此外,该合并还将减少客户在获取许可证时需要与多家公司沟通的复杂性,从而降低了使用这些编解码器的成本。

https://www.streamingmedia.com/Articles/News/Online-Video-News/Via-LAs-Heath-Hoglund-Talks-MPEG-LA-Via-Licensing-Patent-Pool-Merger-158547.aspx

d42d3798e438accdbfa1485c24365daf.png

元宇宙直播的终端架构设计和关键技术

adfeb7f94d489695fb816bda53c257ea.jpeg

5月16日 19:00,我们邀请到了百度智能云视频云资深研发工程师李明路老师围绕终端引擎技术发展与演进,详细介绍元宇宙直播技术体系、终端架构设计和关键技术,分享百度智能云在元宇宙直播场景中的实践探索。

7bf6ab0e181ceaab5598177790fa07fd.png

AVIF 图像编码器添加了实验性 AV2 支持代码合并请求

看起来 AV2 的工作进展顺利,很高兴看到更新的 AVIF 图像格式支持也将得到及时支持

https://github.com/AOMediaCodec/libavif/pull/1361 

Metal 和 OpenGLES 的差异,快速入门 Metal 开发

本文介绍Metal和Metal Shader Language,以及Metal和OpenGL ES的差异性,也是实现入门教程的心得总结。 

Point2Pix:通过神经辐射场进行逼真的点云渲染

作者将点云和 NeRF 相结合,从⽽提出了⼀种名为 Point2Pix 的新型点云渲染器,可以从彩⾊点云合成逼真的图像。

f3214d4ac651a5d7fd330a8e9134564f.png

存储芯片路线图

本文考虑的内存类型是 DRAM 和非易失性内存 (NVM)。重点是商品、独立芯片,因为这些芯片往往会推动内存技术。然而,嵌入式存储芯片预计将遵循与商品存储芯片相同的趋势,通常会有一些时间滞后。对于 DRAM 和 NVM,都考虑了详细的技术要求和潜在的解决方案。

b6526aee7540fe7c262b959813324217.png

云剪辑-B端在线剪辑⼯具架构设计与演进

我们在探索B端在线剪辑产品的过程中遇到不少挑战:如何满足快速与定制两种集成场景?如何保证云端视频合成的效率与质量?LiveVideoStackCon 2022北京站邀请到了腾讯云音视频的成锐林老师为我们分享他们团队是如何解答这一系列问题的。

音视频杂谈--AI工具大比拼

作者分别询问了印象AI、ChatGPT和Bard等TCP和UDP的区别,以上是它们的答案。

视频技术如何助力财险理赔?

这是一篇关于视频技术应用在保险行业里的文章。在整个理赔过程中,数字工具是缩短等待时间和提高客户满意度的关键。

ed5538f72be191b3c59b716d570be5ac.png

音视频通讯QoS技术及其演进

利用多种算法和策略进行网络传输控制,最大限度满足弱网场景下的音视频用户体验。

通过DRM(Digital Radio Mondiale)数字广播进行远程教学

这是一篇详尽介绍DRM广播教育应用场景的文章,结合DRM技术特点和功能成功实现教育普及的理想远景。

https://www.audioblog.iis.fraunhofer.com/cn/radioschooling

2026f93ff13d25fc89a9314d857c82d4.jpeg

南洋理工大学提出基于单目相机和超宽带传感器的VR-SLAM:实现高精度室内定位与建图

本文提出了一种使用单目相机和UWB传感器的SLAM系统。系统称为VRSLAM,是一个多阶段框架,利用每个传感器的优势并弥补其弱点。

首个系统综述!基于深度学习的相机标定技术最新研究进展!

本综述首次系统性地概述了深度学习驱动下的相机标定技术,涵盖了深度学习时代以来(8年时间跨度)各类相机模型标定及其应用的最新研究进展。

6d42bbef7c7f33ef9feccc4df5fd08ed.png

RTC 体验优化的“极值”度量与应用

LiveVideoStackCon 2022北京站邀请到火山引擎RTC团队负责人——杨智超,为大家介绍在实时通信场景下火山引擎RTC对体验的理解与应用落地。

NSDI 2015 | PCC:重新建构面向持续高性能的拥塞控制

本文作者提出了面向性能的拥塞控制,一种新的拥塞控制结构( PCC ),PCC 中持续关注控制机制中动作(asction)和基于经验的性能表现之间的联系,这样做能够使得 PCC 采取的动作能够持续导致高的性能表现。

如何以实时精度完善5G场内体验

这篇文章讨论了如何在场馆中提供完美的 5G 体验。作者认为,5G 可以极大地改善用户在场馆中的体验,包括视频流、VR/AR、实时互动等方面。

https://www.red5pro.com/blog/perfect-5g-in-venue-experiences/


6066459a12f801e2a4ba16fc8ede0069.png

LiveVideoStackCon 2023上海讲师招募中

LiveVideoStackCon是每个人的舞台,如果你在团队、公司中独当一面,在某一领域或技术拥有多年实践,并热衷于技术交流,欢迎申请成为LiveVideoStackCon的讲师。请提交演讲内容至邮箱:speaker@livevideostack.com。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/56435.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PHP对接企业微信审批回调

配置回调 在【管理后台->应用和小程序->审批->API->接收事件服务器】中,设置回调地址,并勾选需要进行状态变化回调通知的审批模板类型。 设置后,回调地址可接收审批应用所有允许进行回调的审批申请相关状态变化通知。 审批申请…

Java企业微信对接

最近项目中要对接企业微信,实现通讯录数据同步,即在企业端添加编辑删除用户,部门数据要同步到微信端,同时微信端添加编辑删除用户,部门数据要同步到企业端,实现数据同步功能,需要调用企业微信AP…

企业微信(一)——企业微信PC端开启调试

文章目录 目的一、企业微信Windows版本调试二、企业微信Mac版本调试三、内置浏览器总结参考 目的 总结在使用企业微信过程中碰到的问题,并记录解决办法。 一、企业微信Windows版本调试 把 devtools_resources.pak 放到企业微信的安装目录下(复制的文件…

企业微信推送suite_ticket对接

企业微信推送suite_ticket对接,由于微信文档不详细,很多地方还有错误,所以对接的时候很是痛苦。通过查阅各种文档,加上整合demo才最终对接成功,拿到了suite_ticket。 推送suite_ticket的文档说是一个POST接口&#xf…

java对接企业微信

java对接企业微信 一、注册企业微信 1.1 简介 企业微信与微信具有一样的体验,通过企业内部与外部客户的管理,构建出社群生态。企业微信提供丰富的api进行调用获取数据管理,也提供各种回调事件。 1.2 注册 登录官网,一键注册即可…

ChatGPT遇上WebRTC:生成式AI对实时通信意味着什么

ChatGPT正在改变计算,并作为一种延伸,改变我们与机器的互动方式。下面是它将如何影响WebRTC。 ChatGPT 成为所有互联网应用程序中增长率最高的服务,在推出的头两个月内就达到了 1 亿活跃用户。一些人每天都在使用它。其他人正在尝试使用它&a…

LLM应用专辑(3) — ChatGPT遇上文档搜索:ChatPDF、ChatWeb、DocumentQA等开源项目算法思想与源码解析

原文:LLM应用专辑(3) — ChatGPT遇上文档搜索:ChatPDF、ChatWeb、DocumentQA等开源项目算法思想与源码解析 - 知乎 公众号在上一篇文章中,我们介绍了chatgpt与nlp结合过程中的一些具体prompt生成方法,掌握这些可以有效地提升生产…

Android的img镜像文件打开

有时需要获取系统的一些资源,就需要打开img镜像文件;可以使用:ext2explore.exe.exe 此篇以打开Android API 22的system.img为例,system.img文件可以在sdk目录system-images文件下 eg: 相对路径:android-sdk-windows\s…

使用tp5写登录验证及修改密码

使用到的工具 1,thinkphp5.0自带的验证码: think-captcha 可查看&#xff1a; https://www.kancloud.cn/manual/thinkphp5/154295 2,前台页面框架: layui 3,引用到的文件: jquery.min.js layui.css 登录样式最终图形 登录的html <body style"background:#f2f2f2…

基于MATLAB的隐函数偏导与多重积分(附代码)

一. 隐函数的偏导数 给定隐函数&#xff1a; 隐函数的偏导可得&#xff1a; MATLAB格式&#xff1a; F-diff(f,xj)/diff(f,xi) 例题1 已知&#xff1a; 求&#xff1a; 解&#xff1a; MATLAB代码&#xff1a; clc;clear; syms x y; f(x^2-2*x)*exp(-x^2-y^2-x*y); prett…

Wolfram Alpha 算微积分指令集合

一、Wolfram Alpha介绍 Wolfram Alpha网址&#xff1a;https://www.wolframalpha.com/ WolframAlpha是开发计算数学应用软件的沃尔夫勒姆研究公司开发出的新一代的搜索引擎&#xff0c;能根据问题直接给出答案的网站&#xff0c;用户在搜索框键入需要查询的问题后&#xff0c…

利用MATLAB求符号微积分

文章目录 摘要1 符号函数的极限&#xff08;1&#xff09;极限&#xff08;2&#xff09;单边极限 2 符号函数的导数3 符号函数的积分&#xff08;1&#xff09;不定积分&#xff08;2&#xff09;定积分 结语 摘要 本文是《科学计算与MATLAB语言》专题七第2小节的学习笔记&am…

高等数值计算方法学习笔记第4章第一部分【数值积分(数值微分)】

高等数值计算方法学习笔记第4章第一部分【数值积分&#xff08;数值微分&#xff09;】 一、数值积分概论1.数值求积的基本思想(牛-莱公式找不到原函数&#xff0c;用矩形近似)2.代数精度的概念1.上述四个公式的代数精度&#xff08;梯形&#xff0c;左中右矩形公式&#xff09…

真的能从脑电信号识别出我的情绪吗?

关注“心仪脑”查看更多脑科学知识的分享。 提到情绪&#xff0c;我们脑海中可能会浮现出各种各样的场景&#xff0c;可能是“哭着&#xff0c;叫着&#xff0c;像个孩子在胡闹”的悲痛。 &#xff08;图片来源于网络&#xff09; 抑或是《Lie to me》中Cal Lightman深邃的一双…

读取大脑计算机软件,专访脑机接口专家Jose:读取大脑信息已成现实

腾讯科技 韩依民 11月7日报道 《生活大爆炸》中有一个经典的搞笑桥段&#xff1a;谢耳朵手摁太阳穴&#xff0c;幻想通过脑电波攻击室友。这一举动因荒诞不羁而产生喜剧效果&#xff0c;但是一种新的科学技术正在让谢耳朵的幻想部分变成现实。 利用捕捉器将人们脑子里进行的活动…

脑机接口猴子通过“意念”打游戏!马斯克:未来能让瘫痪者用意念玩手机

来源&#xff1a;新智元 它是Pager&#xff0c;一只9岁的恒河猴&#xff0c;来自Neuralink&#xff0c;最近它刚刚get了新技能——用意念玩乒乓球游戏。 6个星期前&#xff0c;Pager的脑袋里被植入了两个叫N1 Link的装置&#xff0c;工作人员用香蕉奶昔诱惑它玩游戏&#xff0c…

证明人脑细胞在体外也有感知,「盘中之脑」论文正式登Cell子刊

詹士 发自 凹非寺量子位 | 公众号 QbitAI 这有一个放在盘中的「大脑」&#xff0c;它以为自己是游戏角色&#xff0c;其活着的意义就是完成游戏任务。 有「黑客帝国」内味儿了&#xff1f;&#xff1f;&#xff1f; 现实中&#xff0c;这个盘中大脑有人做出来了&#xff0c;命名…

Hinton 最新访谈:不出五年,我们就会破解大脑的运作机制,但不是通过反向传播...

点击上方“视学算法”&#xff0c;选择加"星标"或“置顶” 重磅干货&#xff0c;第一时间送达 整理丨李梅、黄楠 来源丨AI科技评论 编辑丨极市平台 导读 过去十年&#xff0c;AI 在计算机视觉、语音识别、机器翻译、机器人、医学、计算生物学、蛋白质折叠预测等等领…

ChatGPT时代,如何训练大脑,以后不会被人工智能取代

当有一天&#xff0c;你的小孩子问我将来会不会被AI代替的时候&#xff0c;为人父母的我们应该怎么回答小孩子的问题呢&#xff1f;不知各位是否刷到一位名为浅爸谈英语的博主爸爸分享与他女儿关于AI对话的视频。 这段对话很有启发性&#xff0c;父亲的回答也很中肯。可以通过…

脑机接口照进现实:5位脑科学家带来的最新启示

大脑复杂、神秘&#xff0c;研究大脑被认为是人类终极的探索之一。作为最为复杂的科学探索领域&#xff0c;大脑的研究既令人着迷&#xff0c;也同样令人望而生畏。 脑机接口技术会使人类退化吗&#xff1f;一旦脑机接口技术得到应用&#xff0c;人类的自由意志会被他人操纵吗&…