音视频技术开发周刊 | 294

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。

ec0b5455e5086101f7dbbb7c18639573.png

五问「ChatGPT+医学影像」:新一代的 AI 能否成为放射科医生的一把利器?

在医学等专业性较强的领域内,ChatGPT的表现还不够好,如果想将ChatGPT应用到医学影像之中,多模态学习必不可少。医学领域中目前存在很多的图像、音频、文本等不同种类的数据,必须利用多模态学习将其进行结合,才能应用在临床工作中。

SAP与微软合作,通过ChatGPT简化招聘流程

通过此次合作,SAP将微软的多项类ChatGPT功能集成在人力资源解决方案SAP Success Factors中,通过自然语言就能生成职位描述、面试问题等,加速人才招聘流程。

谷歌通过强化学习来优化电子商务推荐系统 

传统的推荐系统往往只关注单一目标,如点击率或购买率,而MORL则可以同时考虑多个目标,例如用户满意度、收益和转化率等。通过对这些目标进行综合权衡,谷歌团队的推荐系统可以更加准确地预测用户的偏好并提供更有针对性的推荐。 

https://ai.googleblog.com/2023/05/using-reinforcement-learning-for.html

LLM Accelerator:使用参考文本无损加速大语言模型推理

由于大模型的参数量巨大、推理成本高,因此如何在大规模部署大模型的过程中降低成本、减小延迟是一个关键课题。针对此问题,微软亚洲研究院的研究员们提出了一种使用参考文本无损加速大语言模型推理的方法 LLM Accelerator,在大模型典型的应用场景中可以取得两到三倍的加速。

ChatGPT之父舌战国会山!OpenAI欲与政府联手,权力通天 

北京制定通用人工智能创新措施,这21项值得关注

9b57d3fb4c15c4a7e82f7986a7f389ee.png

一种高效模拟大型室内声学的方法 

室内声学建模和仿真的一个挑战是准确模拟一个房间内全部频率范围内的声学性能。这篇文章讨论了在 COMSOL Multiphysics® 软件中对室内声学进行建模的一种混合方法,就是将多种方法的结果集成到一个模型中,来提高准确性并确保方法的可行性。接下来,我们来看看如何做到这一点。

音频品鉴与歌唱评价——音频内容理解实践

本次LiveVideoStackCon 2022 北京站邀请到腾讯音乐天琴实验室高级研究员——江益靓,为大家介绍全民K歌的多维度评价技术和深度歌唱评价技术的实践,以及优质内容挖掘中使用的音频品鉴系统。

为什么我们能判断声音的远近 - 初始时间延迟差的作用

本文以初始时间延迟差为例,来介绍应该如何设计对应的听力测试,探究其在双耳距离感知中的作用。 

SMPTE Motion Imaging Journal 2023 | COTS实用媒体处理平台构建案例 

为了在商用非专用硬件上使用来自不同供应商的元素构成可扩展的基于软件的广播系统,并避免在设施和云中的锁定,需要采用混合多云方法。作为一个案例研究,本文构建了一个可扩展的边缘平台,用于转码、人工智能(AI)推理和其他视频和音频处理。多架构、容器化应用程序使用 Kubernetes 进行部署和管理。

40fc45788678c3cbbbfd21e859da03d8.png

使用FFmpeg模拟视频播放列表的实时流

本文展示了如何使用FFmpeg生成一个m3u8播放列表文件以及相关的ts媒体文件,并通过本地服务器将其提供给客户端进行播放。此外,文中还讨论了一些常见问题和解决方案,例如如何处理不同分辨率的视频、如何支持HTTPS等等。

https://www.mux.com/blog/simulate-a-live-stream-of-a-video-playlist-with-ffmpeg

053289a81903b159a0a46693662b29ad.png

SRT 技术是如何改变现场视频直播的?

据2023年的HAIVISION的广播转型报告显示:SRT已经成为互联网直播视频传输最常用的流媒体协议。2023年,SRT联盟成立六周年,成员超600人。

https://www.haivision.com/blog/broadcast-video/live-video-evolves-with-srt-technology-and-the-internet/

99214502f2aba247673f0d8afcb04822.png

2023年4月云服务行业动态及热点研究月报

本报告是基于对2023年4月份的数据中心、基础云、SaaS和行业云等赛道动态的调查整理而成。

101115152cdfa1fca8ddfdeee1a0b427.png

BITMOVIN | 容器格式通用指南

容器格式是一种将多个数据流嵌入到单个文件中的方式,常用于在线视频、下载电影或使用流媒体服务中。常见的容器格式包括MP4、MKV、AVI和MOV等。本文从基本的专业术语到各种容器文件类型(包括MP4、CMAF、MPEG-TS、Matroska)都作了详细介绍。

MSU 视频编解码器比较 2022

这是MSU 的十七个年度视频编解码器比较。

http://www.compression.ru/video/codec_comparison/2022/cloud_report.html

如何将视频的转码速度提升100倍?

本文介绍了如何通过使用多个编码器(Encoder)和多个服务器来实现视频转码的加速,以及如何使用分布式计算框架来划分和并行处理任务。同时,它还提到了一些优化技巧,例如调整编码器参数和使用更高效的编码格式等等,以进一步提高转码速度。 

https://www.mux.com/blog/how-to-transcode-video-100x-faster-or-a-gordian-knot-cut

音视频编解码--数字图像系列

6d2865922ca794cd6f3b4610c9f70dfc.png

消息称苹果对发布AR/MR头显已准备充分 

立讯独家代工、Sony独供MicroOLED、台积电独供处理器......

778d0ba2d008f1d7e6d029dadfd6d051.png

2023CSIG多媒体技术大会将在5月18-5月20日举行 

LIveVideoStackCon2023上海站九折期优惠进行中

https://sh2023.livevideostack.cn/tickets

aec67844a1aa30d663ad737801fad05b.jpeg

Instruct-NeRF2NeRF: 引导并编辑NeRF

本文提出了一种通过文本来编辑 NeRF 场景的方法。给定一个 NeRF 场景及用于重建它的多视角图像,本方法利用图像条件扩散模型InstructPix2Pix对输入图像进行迭代编辑,并同时优化底层场景,从而得到一个符合编辑指令的优化 3D 场景。

NeRF如何帮助我重新想象世界

为了训练NERF,作者收集了大量真实世界中的图像和深度数据,并使用它们来生成训练样本。然后,作者使用NVIDIA的Triton Inference Server将经过训练的NERF模型部署到云服务器上,以便将其应用于新的图像和视频。

https://developer.nvidia.com/blog/how-nerfs-helped-me-re-imagine-the-world/

为什么目前落地的主流SLAM技术很少用神经网络进行特征提取?

92ab882b3b29664323baca5abdb28366.png

ICRA 2023 同济&港科大开源:高精度、实时的端到端法向量估计方法 

同济大学MIAS group与香港科技大学IADC近期发表的 ICRA 2023论文 《D2NT: A High-Performing Depth-to-Normal Translator》提出高精度、实时的端到端法向量估计方法,性能超越现有 SoTA 算法,为现实场景下法向量数据集提供新的标定范式。相关代码已开源。

ICLR 2017|PIXELCNN++:通过离散逻辑混合似然和其他修改改进 PIXELCNN 

PixelCNN 是一个强大的模型,因为这些条件的函数形式非常灵活。除了图像建模,PixelCNN 还被扩展到音频、视频、文本建模。本文对 PixelCNN 基本模型进行了大量修改,以简化其结构并提高其性能。 

OpenGL Shader 编程基础-绘制基础图形



874dc10269f93a4f51c1e53b67799fdd.png

LiveVideoStackCon 2023上海讲师招募中

LiveVideoStackCon是每个人的舞台,如果你在团队、公司中独当一面,在某一领域或技术拥有多年实践,并热衷于技术交流,欢迎申请成为LiveVideoStackCon的讲师。请提交演讲内容至邮箱:speaker@livevideostack.com。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/59830.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2022年最值得安装的4款PC软件,每一款都是精品

1.鲸鱼办公网 这是一个PPT模板资源网站,不仅提供了免费实用的PPT模板,还提供了简历模板、字体字库、办公教程、平面设计等,1200多个全套视频课件。对设计感兴趣的朋友可以到里面看看,说不定会有另外收获哦! 2.AirMore …

新买了台笔记本电脑,分享些实用的Windows软件

苏生不惑第263 篇原创文章,将本公众号设为星标,第一时间看最新文章。 前几天618的时候在京东新买了台联想笔记本电脑thinkbook,就是这台:当时价格5499,系统配置如图,话说Windows11都来了,有人开…

基于股票信息的数据分析与可视化

基于股票信息的数据分析与可视化 项目简介:采用皮尔逊相关系数研究A股开盘前十分钟成交量变化与当日收盘价变化的相关性,最后将数据导入到Excel中做可视化分析。 结论:大部分都没有很强的相关性。 import baostock as bs import pandas as p…

「太阁干货」华为模拟器eNSP安装教程

最近小伙伴们在观看太阁6IE讲师 闫辉老师的直播课中,会使用到华为模拟器eNSP,今天给大家分享一下如何对华为eNSP模拟器进行初始化安装。 今天分享的内容主要有以下几个板块: step 1:文件下载: 所需要的文件如下 一共需要5个文件…

网络链路不稳定的排查问题方法

概述 当客户端访问目标服务器出现ping丢包或ping不通时,可以通过tracert或mtr等工具进行链路测试来判断问题根源。本文介绍如何通过工具进行链路测试和分析。 详细信息 本文分别介绍如下链路测试方法。 链路测试工具测试结果的简要分析常见的链路异常场景链路测试…

计算机网络波动大,网络不稳定是什么原因?

当我们的电脑网络不稳定,网络波动大,网络卡顿不顺畅时,我们应该怎么办呢?今天就和大家一起聊聊网络不稳定是什么原因,我们可以怎么解决! 一、设备问题引发网速不稳定现象 1.【网线故障问题】由于网线水晶头…

pdf打开口令破解

PDF文件设置打开口令,有可能是自己设置的打开密码时间久了忘记了,也有可能是在网上下载的pdf资源打开的时候需要输入打开密码,那么遇到这种不知道破地方打开口令或者忘记打开口令的情况,并且文件内容对你很重要的话,可…

【口令破解】远程口令破解和本地口令破解(crunch 字典工具和hydra工具)

目录 1 口令安全威胁1.1 口令安全概述1.2 口令安全现状1.2.1 弱口令1.2.2 默认口令1.2.3 明文传输 2 口令破解2.1 暴力破解2.2 字典破解2.2.1 弱口令字典2.2.2 社工字典2.2.3 字符集字典crunch的**用法**如下:crunch生成密码字典实例:简单介绍字典 3 远程…

弱口令及其防御

常见的弱口令分为默认型弱口令和社工型弱口令。 一.默认型弱口令 1.系统服务弱口令 sshftptelnetsnmp 2.应用组件弱口令 tomcatweblogicredismysqlmongoDBrsyncmemcache 3.设备弱口令 (1)路由器弱口令 tp-linkTendaD-linkMERCURY (2)安全设备弱口令 绿盟(weboper/nsfoc…

弱口令扫描工具mysql ftp_超级弱口令检查工具

超级弱口令检查工具是一款Windows平台的弱口令审计工具,支持批量多线程检查,可快速发现弱密码、弱口令账号,密码支持和用户名结合进行检查,大大提高成功率,支持自定义服务端口和字典。 介绍 工具采用C#开发&#xff0c…

万能命令

在日常工作生活中下载文档资料、网上购物、看电影追剧,早已成为生活的中的一部分,在面对这些生活工作必要内容你是是怎么办的呢?还在花钱下载文档?追剧开会员吗?今天就教你无需任何工具,只需要几个简单的命…

9月1日5G商用,你的4G变慢了吗?

近日,据运营商财经网报道,相关人士透露,三大运营商即将于9月1日对5G商用,也就是一个星期之后,中国正式进入5G时代。 这与6月5G牌照发放时三大运营商表示将在今年9月底前在40城提供5G服务的计划一致。 此外,…

项立刚:乔布斯展现了人类无尽的创造力

北京时间10月6日消息&#xff0c;苹果董事会、联合创始人史蒂夫乔布斯周三辞世&#xff0c;享年56岁。乔布斯的辞世&#xff0c;引起了IT界名人的关注。 知名电信专家、飞象网创始人<!--keyword--><!--/keyword-->项立刚<!--keyword-->(微博)<!--/keywor…

有了5G,Wi-Fi还有用武之地吗?

没有Wi-Fi的日子&#xff0c;总是让我们如坐针毡。有人甚至调侃道&#xff0c;在马斯洛需求层次理论中&#xff0c;Wi-Fi已成为新衍生出来的底层需求。 不久前&#xff0c;国际Wi-Fi联盟组织&#xff08;以下简称Wi-Fi联盟&#xff09;表示&#xff0c;他们将在今年第3季度推出…

赠书活动 | 万亿级市场:大家都能看到的机会谈不上机会

5G时代已经来了&#xff0c;在5G引领下的数字产业互联网&#xff0c;将带来万亿级市场。如果说中国的消费互联网市场只能容纳几家千亿美元级的企业&#xff0c;那么产业互联网领域有可能容纳几十家、几百家同等规模的创新企业。 那么&#xff0c;5G能做什么、自己用5G又能做什么…

[書籍]5G時代

人類文明常常是因為相互競爭和激發而逐漸進步的。1733年&#xff0c;飛梭的發明使織布速度大為提升&#xff0c;然而&#xff0c;織布所需的棉紗原料卻往往來不及供應&#xff0c;原因是紡紗的速度趕不上織布的速度。1764年&#xff0c;珍妮機的發明使得紡紗的效率成倍提高&…

谷歌互联网热气球试验失败;工业互联网联盟发布1.8版参照架构│IoT黑板报

美大学研发“后向散射”技术 用电量近乎为零 环球科技 据英国《每日邮报》12月8日报道&#xff0c;一项被称为“后向散射”的技术马上将会推出&#xff0c;它利用环境中已经存在的低电量无线电信号发送信息&#xff0c;可以将随机对象转化为电台&#xff0c;并向手机传送信息。…

为什么会有鸿蒙系统,专家详解为什么鸿蒙有机会成为世界第一大操作系统

集微网6月3日消息&#xff0c;专家项立刚认为鸿蒙有机会成为世界第一大操作系统&#xff0c;具体有以下几个原因。 图片来源&#xff1a;微博 1、人类电子产品有操作系统时&#xff0c;不同产品因为服务需要&#xff0c;系统是隔裂的&#xff0c;而且是适会某一类产品需要。如服…

手机隔空充电,会有辐射吗?

关注、星标公众号&#xff0c;直达精彩内容 出品 21ic中国电子网 付斌综合 网站&#xff1a;21ic.com 近日&#xff0c; 高通、小米、moto等品牌发布隔空充电技术&#xff0c;隔空充电到底是什么&#xff1f; 真如科幻电影那样&#xff1f;辐射大不大&#xff1f;会不会浪费电或…

鸿蒙系统会给其它厂商用,中国通信知名观察家项立刚:鸿蒙系统多终端互通,势必会给其他硬件厂商带来压力...

原标题&#xff1a;中国通信知名观察家项立刚&#xff1a;鸿蒙系统多终端互通&#xff0c;势必会给其他硬件厂商带来压力 封面新闻记者 雷强 6月2日&#xff0c;华为正式推出HarmonyOS 2.0正式版。自2019年8月&#xff0c;余承东公布华为自研的操作系统鸿蒙&#xff0c;不到两年…