音视频技术开发周刊 | 297

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。

b266316d44629adf17084863ed1de0ab.png

Geenee AR为品牌商和零售商提供虚拟试穿应用

这意味着Geenee AR的虚拟试穿解决方案能够与品牌商现有的销售渠道无缝集成。

谁说苹果掉队了?WWDC上只字未提AI,却已低调入场大模型

尽管苹果没有在 WWDC 上谈论AI 大模型,但他们介绍了一些基于 AI 的新功能,如改进iPhone 的自动更正功能,当你按下空格键时,它可以完成一个单词或整个句子。该功能基于使用 Transformer 语言模型的 ML 程序,使自动更正比以往任何时候都更加准确,而 Transformer 是支持 ChatGPT 的重要技术之一。

d58fb5ab946a67262cfc73cc25799f95.png

用于开源项目的 ChatGPT 驱动的代码审查器机器人

ChatGPT可以审查代码了:作者利用开源的ChatGPT制作的代码审查机器人,可以进行代码审查,并提供有关代码质量、安全性和最佳实践方面的反馈。

https://www.cncf.io/blog/2023/06/06/a-chatgpt-powered-code-reviewer-bot-for-open-source-projects/ 

使用 SQuId 评估TTS模型

文章评估了TTS的系统表现。作者介绍了一种名为“ManyEars”的自动评估框架,该框架可以同时处理多个声学和语言特征,并使用机器学习算法来生成客观的质量评估指标。他们还提出了一种基于GAN(生成对抗网络)的数据增强方法,以帮助改善TTS模型的性能。 

https://ai.googleblog.com/2023/06/evaluating-speech-synthesis-in-many.html

视觉字幕:使用大语言模型通过动态视觉效果增强视频会议

本文介绍了一个新的视觉字幕生成模型,该模型使用大语言模型训练,自动生成对图像的描述。该模型在未来可能会被用于诸如辅助无障碍输入、图像搜索和自动图像描述等领域。

https://ai.googleblog.com/2023/06/visual-captions-using-large-language.html、

 d864cedbb0a209ddfb848fcc235e000d.jpeg

高翔博士分享:单目SLAM在移动端应用的实现难点有哪些? 

华为手机的"超光谱摄像头"

英伟达发布Neuralangelo,借助神经网络将2D视频转换为更精细的3D结构

Neuralangelo可以生成雕塑的具有复杂细节和纹理的3D结构。然后,创意专业人士可以将这些3D对象导入设计应用程序,进一步编辑它们以用于艺术、视频游戏开发、机器人和工业数字孪生等应用。

f1cbaf841d2b88d53a230b2265853978.png

要能力、要稳定也要降本——百度多媒体技术回顾

多媒体技术生态进入到存量市场,客户既要又要还要成为常态。如何将能力、质量与稳定性、成本不断优化,就是各个多媒体技术平台的必修课。本文以百度智能视频云为例,纵览了其在RTC、边缘计算、视频编码等关键能力与用户体验和成本优化的经验。 

11188d4e86582ee145b7552709d3961d.png

如何正确选择恰当的传声器? 

音视频问题汇总--如何兼容实时音视频加密?

音频格式--PCM介绍

基于语音识别的弱监督联合学习

具体来说,该方法使用一个中央服务器来协调各个客户端的模型更新。服务器首先从未标记的数据中提取出尽可能多的信息,并将其与客户端提供的少量标记数据结合起来训练一个初始模型。然后将该模型下发给各个客户端,并根据客户端反馈的准确率和数据分布情况来调整模型参数。最终,所有客户端的模型会被合并,形成一个全局模型。

https://www.amazon.science/blog/federated-learning-with-weak-supervision-for-speech-recognition

b363b5e63cd9affa32bfea4c3c8b5ef2.png

深度视频预编码

本文提出了一个深度视频预编码框架,其核心预编码组件包括一个级联结构的降尺度神经网络,在视频编码期间、传输之前操作。

百度视频质量评测的实践之路

LiveVideoStackCon 2022北京站邀请来自百度的王伟老师为大家介绍百度视频质量评测的发展之路 。

 54e656424702875705d00ab63b5ed881.png

苹果封神头显Vision Pro竟暗藏「脑机接口」!苹果前员工疯狂揭秘读心操控

其实,这是苹果通过算法来监视你的眼睛行为,并实时重新设计UI,以创建更多这种预期的瞳孔反应,从而创建个人大脑的生物反馈。这就是通过眼睛实现的初级「脑机接口」。 

87f5e32e0fa383a57238a646124278a8.png

一文读懂苹果 Vision Pro:最好最贵的头显,重新定义下一代计算

与过去所有的 VR/AR 平台相比,Vision Pro 的出现开创了一个新的纪元。从人机交互,到硬件规格,再到操作系统、生态,以及数据隐私,苹果重新定义了头戴式设备的标准。

30b1e90ff14592e70e74fdb1a1992f6a.png

专访瑞声科技应用软件开发总监陆其明:当一名老兵决定重新上路

从互联网公司到智能终端解决方案公司,陆其明的这次转变可能难以被人理解。但经济大环境的影响和个人的技术困境还是让他义无反顾地走向一个未知的世界。正如黄仁勋日前所言,“撤退”对聪明人来说并不容易。然而,战略性的撤退、牺牲、决定放弃什么是成功非常关键的核心。 

7f9a80235f4c7fdbb1254a82e4257182.png

2023LiveVideoStackCon上海站已进入全价期

bf4cdd23563394b18c6251619c778b62.png

2023年SRT InterOp Plugfest亮点

在2023年的SRT InterOp Plugfest中,Haivision和YouTube合作展示了使用SRT技术进行视频传输的高互操作性。这证明了SRT协议在实现不同设备和平台之间高效视频传输方面的能力。通过这些展示,人们看到了各种开发人员如何利用SRT协议来使视频传输过程变得更加可靠和高效,并提供了与其他视频流媒体解决方案无法匹敌的优势。

https://www.haivision.com/blog/all/highlights-2023-srt-interop-plugfest-with-youtube/

强化学习驱动的低延迟视频传输

LiveVideoStackCon2022北京站邀请了来自北京邮电大学的周安福教授,为我们分享关于使用强化学习方法进行低延迟视频传输的相关研究成果 。

面向流媒体的确定时延传输:从QUIC出发,走向未来

LiveVideoStackCon2022北京站邀请了清华大学的马川为我们介绍QUIC协议的诞生、目前的拓展成果以及未来的发展方向 。

3652aad5e920a8c43489db4b4218b40a.png

流媒体应如何利用预测分析来提高留存率

预测分析的好处:了解用户的偏好、行为和需求,提供更个性化的内容和服务;通过对数据进行深入分析和建模(包括使用机器学习算法、数据挖掘工具和AI等技术)提高留存率,增加收入。

https://www.streamingmedia.com/Articles/Post/Blog/How-Streaming-Platforms-Can-Harness-Predictive-Analytics-for-Better-Retention-158980.aspx


8d487c9ae86c72f6f5c630be531e754a.png

扫描图中二维码或点击“阅读原文 

查看更多LiveVideoStackCon 2023上海站精彩话题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/52381.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

摩尔定律被提出 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 4 月 19 日,在 1918 年的今天,克利福德贝里(Clifford Berry)出生。他是世界上第一台电子数字计算设备 Atanasoff…

你的GPT跟ChatGPT可能只差了一个DPU

“人类永远不会嫌网络太快,就像永远不会嫌高铁太快,你只会嫌它慢,希望它更快些。” 一个月内,百度、阿里、腾讯、商汤、讯飞、360等国内大厂扎堆发布“中国版 GPT ”,这家的名字还没记清楚,另一家的又蹦了出…

最快下月!地表最强语言模型GPT-4发布在即?CEO暗示:已通过图灵测试

【导读】千呼万唤始出来!GPT-4,真要来了? 作为史上最受期待的AI模型,GPT-4真要来了? 这几天,AI分析师罗梅罗的一篇专栏文章,一经推出便迅速「引爆」了整个AI科技圈。 他表示,「GP…

chatgpt赋能python:错误后如何继续编辑Python代码

错误后如何继续编辑Python代码 作为Python程序员,即使有多年的编程经验,我们还是难免会犯错误。有时您可能会意识到自己写错了代码,但有时会发现错误类型与源自身的知识不同。 然而,无论这些错误类型如何,Python都提…

ChatGPT实战:情感顾问助你告别单身生活

爱情很美好,但这个事学校不讲,家长不教,至今孤身一人的小伙伴怕是不在少数,出现问题时,没有“知心大姐”交心,只能自己一个人硬扛,有时候就是一层窗户纸,没人帮你捅破,最…

因为写不出拖拽移动效果,我恶补了一下Dom中的各种距离

前端Q 我是winty,专注分享前端知识和各类前端资源,乐于分享各种有趣的事,关注我,一起做个有趣的人~ 公众号 点击上方 前端Q,关注公众号 回复加群,加入前端Q技术交流群 背景 最近在项目中要实现一…

大型 3D 互动项目开发和优化实践

点击上方 前端Q,关注公众号 回复加群,加入前端Q技术交流群 开发背景 得益于“元宇宙”概念在前段时间的爆火,各家公司都推出了使用 3D 场景的活动或频道。 https://img13.360buyimg.com/imagetools/jfs/t1/220303/24/28446/2896414/6476b7f1F…

建立数字化、学习型人事平台,HR 与业务终于不再「隔空对话」

本篇文章暨 CSDN《中国 101 计划》系列数字化转型场景之一。 《中国 101 计划——探索企业数字化发展新生态》为 CSDN 联合《新程序员》、GitCode.net 开源代码仓共同策划推出的系列活动,寻访一百零一个数字化转型场景,聚合呈现并开通评选通道&#xff…

程序员因薪资低拒绝offer,HR恼羞成怒,网友瞬间炸翻了..

一名程序员员在求职过程中,碰到一位薪资谈不拢就恼羞成怒的HR,并说出“估计你一辈子就是个程序员”这样的话。 从这位测试员和HR的聊天内容中,我们可以看到二者的谈薪过程。 首先,HR开出15k的薪资,测试员表示太低了&a…

模拟书本世界-Ai外语训练平台-文字冒险游戏-程序介绍

首先给出这个平台的进入链接:模拟书本世界 www.chatlangue.com 然后我会简要介绍一下这个平台。最后我会分享一下这个程序是如何实现的。 简要介绍:这个平台既是一款游戏又是一款外语学习软件。你通过这个平台可以进入一本书的模拟世界,这个世…

chatgpt赋能python:Python如何将英文转化为中文的最佳方法

Python如何将英文转化为中文的最佳方法 介绍 在现代全球化社会中,国与国之间的交流越来越频繁,相应的语言翻译工具的需求也愈发迫切。Python是一种易于学习、快速上手的编程语言,适合初学者和经验丰富的程序员使用,在语言翻译方…

chatgpt赋能python:Python做出来的图:探究数据可视化的魅力

Python做出来的图:探究数据可视化的魅力 在当今数字化时代,数据可视化是一种越来越重要的手段。随着数据分析和处理技术的飞速发展,现在可以轻松地使用Python编写代码来实现复杂而美丽的图形化呈现。 Python:强大的工具 Python…

chatgpt赋能python:Python图表:可视化数据的艺术

Python图表:可视化数据的艺术 作为一种易于学习和使用的编程语言,Python在数据科学和数据分析领域中的应用越来越普遍。Python的一个强大的功能是其图表功能,可以帮助我们将数据转化为可视化图表,从而更好地理解数据、提供洞察和…

chatgpt赋能python:Python面积图:简单易学、功能强大的数据可视化工具

Python 面积图:简单易学、功能强大的数据可视化工具 Python 是一种目前非常流行的编程语言,拥有强大的数据处理和可视化功能。其中,Python 的面积图是一种非常实用的数据可视化工具,能够直观地展现数据的变化趋势和占比关系。 什…

如何自己制作简历模板?简历在线制作的方法介绍

找工作时好看并有意义的简历是十分重要的事儿,如何制作一份出色的简历,在漫天的简历中脱颖而出呢?如何自己制作简历模板?今天七分简历--简历在线制作就来给大家介绍方法吧。 1.选用正确的简历模板 所谓正确的简历模板,…

用HTML做一份个人简历

学习了基本的HTML知识后&#xff0c;今天尝试用Html做一份个人简历。需要用到的基础知识是&#xff1a; Html表格&#xff1a;以<table></table>标签作为开始&#xff0c;<tr></tr>作为行&#xff0c;<td></td>作为列。 <th></…

手把手教你打造自己的简历编辑网站-编辑完后可以一键导出为PDF

如何打造自己的简历编辑网站 目录 如何打造自己的简历编辑网站一.相关环境配置A.服务器环境B.服务器面板 二.相关软件安装A.安装Node.jsB.安装yarn 三.部署简历网站A.开始安装 先看下效果&#xff0c;然后下面开始教大家搭建操作了 一.相关环境配置 A.服务器环境 系统&#x…

简历上的照片怎么制作?这两种方法真的很简单

怎么制作简历上的照片呢&#xff1f;简历是每个人在找工作的时候必须要用到的&#xff0c;在简历中&#xff0c;除了填写我们出众的履历和工作技能之外&#xff0c;还有一个很重要的影响因素&#xff0c;那就是我们放在简历中的证件照&#xff0c;一个好的照片可以让面试官一眼…

手机怎么做个人简历?多行业简历模板自由选择

如何利用手机来制作简历呢&#xff1f;现在找工作的时候&#xff0c;大多会使用手机来查看各种招聘app软件的信息来选择自己喜欢的工作。那么为了能够更好的获取面试的机会&#xff0c;那么准备一份优质的个人简历是必不可少的&#xff0c;那么从手机上如何下载一个精美简历模板…

html制作个人简历

前几天我为大家介绍了些html的标签&#xff0c;利用这些标签咱们可以简单制作个简历&#xff0c;来巩固知识。 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>个人简历</title> </head>…