音视频技术开发周刊 | 286

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。

1f06a553e2aa3b03ccaa45efc4e44b53.png

比尔盖茨:AI 时代开启

盖茨谈到AI如何改善人类的不平等现象,并在医疗、教育等方面做出贡献,但也存在风险。

GPT-4 Copilot X震撼来袭:AI写代码效率10倍提升

GitHub官宣:基于GPT-4的新一代代码生成工具Copilot X来了!

如何把ChatGPT集成到Twilio语音服务中?

给聊天机器人注入灵魂。

https://www.twilio.com/blog/integrate-openai-chatgpt-twilio-programmable-voice-functions

又一个辅助编程工具

集成了chatGPT的代码工具,一段文件描述就可以写好代码。

https://www.cursor.so/

从ChatGPT看AI在未来企业的应用前景

抛开具体的应用场景,我们发现,类似ChatGPT这样的AI对生产力的改变在未来会为个人及组织甚至整个产业带来前所未有的积极影响。

ChatGPT:生成式AI迎来拐点,商用落地前景可期

此报告来自国泰君安证券。

https://xueqiu.com/2524803655/241860556

Stuart Russell专访:关于ChatGPT,更多数据和更多算力不能带来真正的智能

本次采访也依循「a modern approach」,希望从一种切合技术和时代发展的视角,展现 Russell 教授对技术动向、智能理论,以及流行 VS 经典的思考,为 AI 研究人员和从业者带来启发。

293d4f8f91f6677ab12b57192ac009d8.png

来,给自己创造一套头像吧!

跟我一步一步做。

https://arstechnica.com/gadgets/2023/03/making-faces-how-to-train-an-ai-on-your-face-to-create-silly-portraits/

Adobe推出AI图像生成产品 Firefly 宣称自己是没有原罪的AI模型

Adobe 刚刚发布了自家的 AI图像生成模型套件 Adobe Firefly,现在还不能开放给用户使用,但可以申请 waitlist。

4个令人惊艳的ChatGPT项目开源了

今天,我将着重挑选几个优质的开源项目,对我们的日常工作、学习生活,都会有很大的帮助。

谷歌全面转向文字→视频生成

CEO Sundar Pichai 亲自安利了他们在这一领域的最新成果:两款文本转视频工具——Imagen Video 与 Phenaki。前者主打视频品质,后者主要挑战视频长度,可以说各有千秋。

阿里巴巴达摩院发布开源文本到视频模型

这个文本到视频模型是基于Transformer架构和对抗生成网络(GAN)技术构建的。它可以将文字描述转换为与之匹配的视频,实现了自动化视频制作的目标。

https://modelscope.cn/models/damo/text-to-video-synthesis/summary

Midjourney画出完美中国情侣,画师、演员、模特

最新V5版的图像质量更高、输出更多样化、有更广泛的风格、支持无缝纹理、有更宽的纵横比、有更好的图像提示,以及更宽的动态范围……

Netflix:探索理解媒体内容的平台

Netflix探索了许多通过机器学习提升视频生产效率的方式,比如对话搜索和视频搜索。但由于不同项目均独立开发,维护成本巨大。目前,Netflix正在着手解决这一问题。

8d64da15f21468fad1b85309f03df8f7.png

三一智能:SRS流媒体在交通行业的实践

近两年,汽车新四化的在很多车企中快速地推进。所谓汽车新四化,是指“电动化、网联化、智能化、共享化“。三一重工作为工程车辆的行业领头羊,也刻不容缓地开始数智化和电动化的研发和转型。

SRT开源六周年

超过600个成员加入SRT Alliance。

https://www.haivision.com/blog/all/srt-open-source-turns-six/

腾讯云音视频与FFmpeg开源生态

自由与开源软件的理念,从不解、争议、接受到如今如火如荼,经历了长期的历程。国内开源软件起步较晚,但进展迅速。腾讯经过几年的开源协同运动,也取得了不少成绩。其中,腾讯云音视频在FFmpeg、SRS等重要多媒体开源社区的贡献,颇具代表性。

5a4473f660a83a8e115cf71c41e445ea.png

如何通过FFmpeg进行VVC编码

本文将使用FFmpeg对Fraunhofer VVC编解码器进行测试。

https://www.streamingmedia.com/Articles/Editorial/Featured-Articles/How-to-Produce-VVC-With-FFmpeg-157714.aspx

a322cd0583ce99821891b522dbd32aea.png

通过Apache Beam将Linkedin流媒体处理时间节省94%

迁移到Apache Beam,处理相同的作业时分配的内存和CPU时间都减少了一半。

https://engineering.linkedin.com/blog/2023/unified-streaming-and-batch-pipelines-at-linkedin--reducing-proc

76f3e4842855c922d3adf506ab0af3d9.png

bilibili-AVIF图片格式落地

AVIF格式能够带来许多优势,首先,AVIF格式具有明显的压缩率优势,可以比其他常用图片格式(如JPEG、PNG)节省更多的存储空间,减少图片加载所需时间和带宽,提高网站加载速度,提高访问者的体验;其次,AVIF格式丰富的特性支持,可以支持更多的设备和浏览器,提高图片的可用性,并可以免专利费的优势;最后,AVIF格式支持图片的质量优化,可以保证图片的质量,同时节省更多的容量。

540224ae508f2ec992057db482d30071.png

小米前专利战略负责人Paul Lin谈专利池的利与弊

“专利池是很好的授权方式,但不是唯一的方式"。

https://www.iam-media.com/article/licensing-taps-xiaomis-former-ip-strategy-head-advisor

ead3b1fe993e0c00b92585733cfb2f68.png

EPIC开发新的动作捕捉技术

“MetaHuman Animator”可以在几分钟内把频变成3D运动。

https://arstechnica.com/gaming/2023/03/epics-new-motion-capture-animation-tech-has-to-be-seen-to-be-believed/

1ebb185aa8043ed9d1ecfc4e72f33cef.jpeg

全景声专辑《Divine Tides》再获格莱美

《Divine Tides》是基于MPEG-H三维声标准打造的360 Reality Audio索尼全新沉浸式音乐体验。

https://www.audioblog.iis.fraunhofer.com/cn/mpegh-grammy-2023

PDF文件可以嵌入声音了

通过Adobe PDF Embed API和Web Speech API就可以做到。

https://blog.developer.adobe.com/bring-voice-to-your-documents-9f1103ac60b5?gi=f735f2bb2f20

LE Audio爆发在即,解读未来音频产品功能应用,27年出货量将达15亿台

在2020年,蓝牙技术联盟推出了新一代蓝牙音频技术标准——低功耗音频LE Audio,带来了多项全新特性和LC3解码器,为未来蓝牙技术的应用提供了更多的畅享。

1ffd20336e1eebddf8c1bb9231549fff.png

TikTok CEO未能说服国会

数据安全难题怎么解?

https://arstechnica.com/tech-policy/2023/03/congress-calls-tiktok-ceos-security-and-privacy-assurances-worthless/

Google认为拼多多App含恶意软件

该恶意软件是在Google应用商店之外的拼多多应用程序中发现的。

https://krebsonsecurity.com/2023/03/google-suspends-chinese-e-commerce-app-pinduoduo-over-malware/#comments

李开复正在筹组AI2.0公司

李开复在朋友圈表示:“我正在亲自筹组的 Project AI 2.0,是一个致力打造 AI 2.0全新平台和 AI-first 生产力应用的全球化公司。”

52651d40de0985a6910d1e8555dc950c.png

国内音视频开发的前景怎么样?一位老兵这么说

目前干我们这一行的年纪都比较大,我自己工作五年就是很年轻的了。年会上老板说除了音视频中心的大家都是比较年轻的......

marvell裁撤国内研发部门

marvell撤离研发部门,受损失最大的是marvell本身。对于员工来说,除了拿到赔偿金,相信也很快会在另外的企业找到发挥自己能力的岗位。


活动推荐

Adobe Summit 2023

拉斯维加斯,3月21-23日

https://business.adobe.com/summit/adobe-summit.html

22c2cbb02249c62fc0ec9b5e1b3380da.png

倒计4天:和LiveVideoStack在2023年的第一场约会

下周五、六,再聚北京。

时间:5b265521c114f1340b80f62a2fb84e7d.png2023年3月31日 - 4月1日

报名:47807a70bc70e0de85b7b58282195db8.png点击【阅读原文】了解详细信息,报名参与。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/25797.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

对话 ClickHouse CTO Alexey:目光不仅限于成为最快的数据库 | 近匠

作为世界上最快的 OLAP 列式数据库之一,ClickHouse 能在毫秒级的时间内处理数百亿行的数据。ClickHouse 公司在官网上,也是简单扼要地介绍了自己的数据库:“Fast”。 ClickHouse 的灵魂人物 AlexeybMilovidov,则是一位将“慢”践行…

马斯克放话:没有我就没有 OpenAI,连名字都是我起的!

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 在 ChatGPT、GPT- 4 的爆火下,近来 OpenAI 这个名字已逐渐成为科技圈的“高频热词”,其创立初期与马斯克之间的“恩怨”也被时常提及。 有人说自从马斯克走后,Open…

阿里云版Chat-gpt申请内测

不允许你还不知道阿里云的chat-gpt,快去申请 -- 内测申请地址:通义千问

C++图像处理 -- 图像合成

阅读提示: 《C图像处理》系列以代码清晰,可读性为主,全部使用C代码。 《Delphi图像处理》系列以效率为侧重点,一般代码为PASCAL,核心代码采用BASM。 尽可能保持二者内容一致,可相互对照。 本文代码必须包括…

图像合成与图像融合

这一次我来给大家介绍一下图像合成与融合。 我们经常看到一些很奇妙的PS技术,例如下面这张,它把1928年的一位叫做Frankie Yale的黑帮老大被杀时的照片,与现在这栋房子的照片无缝融合在一起: 还有这张,将1945年柏林街道…

Chrome安装油猴插件详细教程

Chrome安装油猴插件详细教程 一、油猴安装方法 方法一:Google官方商店安装(推荐,需要科学上网) 方法二:本地安装(无需科学上网,不会科学上网的适用) 二、安装油猴插件 方法一&am…

Tampermonkey 油猴脚本,chrome插件

tampermonkey脚本是一款在谷歌浏览器上经常使用到的浏览器脚本插件,油猴脚本不仅为用户提供了大量的免费脚本插件外,而且还可以帮助你对这些脚本插件进行统一管理,当有最新版本的脚本推出的时候,它会帮助你进行自动更新。当然&…

手机上使用油猴插件 Tampermonkey

油猴 即 Tampermonkey中文名俗称油猴,是一款浏览器上的扩展,用户可以通过Tampermonkey添加和使用脚本,而脚本是一种可以修改网页JavaScript的程序。 在PC端,可以通过 Chrome浏览器的扩展程序,再结合 脚本 可以实现各种…

Tampermonkey油猴插件安装使用

Tampermonkey油猴插件安装使用 Tampermonkey油猴插件——安装与使用教程 Tampermonkey的crx文件,将下载下来的压缩包解压出来,其中类型为CRX文件 就是接下来需要用到的安装文件 打开浏览器设置,打开扩展程序页面,或者直接搜索Chr…

关于油猴(Tampermonkey)

油猴Tampermonkey 是一款免费的浏览器扩展和最为流行的用户脚本管理器,它适用于多款常见的浏览器。 前言 那么,油猴具体能干啥? 它可以让我们使用浏览器时更加便捷。 比如说,对于一些网页限制的解除,某度盘文件直接…

Tampermonkey油猴插件——安装与使用教程

安装步骤: Tampermonkey 是一款免费的浏览器扩展和最为流行的用户脚本管理器,它适用于 Chrome, Microsoft Edge, Safari, Opera Next, 和 Firefox。 油猴插件下载网址:Tampermonkey • Home Beta是测试版; Stable是稳定版&am…

安装油猴(Tampermonkey)插件,让你的浏览器更强大

插件是什么 插件及扩展程序,目前大多数软件及程序都提供了安装插件的功能(edge,chrome,vscode,pycharm,office等),游戏外挂也是一种插件,这也是使程序功能强大的手段&…

油猴脚本(Tampermonkey)的简介

油猴脚本的使用 什么是油猴脚本 「油猴」可以通过安装各类脚本对网站进行定制。当然伟大的脚本面向的是所有上网者,所以借由各位大神的脚本我们能实现更多更强大的功能,例如: 直接下载百度网盘文件(全速)重新定制繁杂的微博页面去掉视频播放…

ChatGpt-2 对话单页功能实现vue3+elementplus

接口可参照CHATGPT.NET自行实现 <script setup> import { RouterLink, RouterView } from "vue-router"; import HelloWorld from "./components/HelloWorld.vue"; import { MoreFilled ,CircleCheck} from "element-plus/icons-vue"; …

超乎你的想象AI绘画

(https://img-blog.csdnimg.cn/d1e19127400749818fde963723a194a9.png)(https://img-blog.csdnimg.cn/b8535f2f0b4f402ea2003ec8f352d11e.png)

【5月比赛合集】80场可报名的数据挖掘大奖赛,任君挑选!

CompHub[1] 实时聚合多平台的数据类(Kaggle、天池…)和OJ类(Leetcode、牛客…&#xff09;比赛。本账号会推送最新的比赛消息&#xff0c;欢迎关注&#xff01; 以下信息仅供参考&#xff0c;以比赛官网为准 目录 Kaggle&#xff08;10场比赛&#xff09;阿里天池&#xff08…

#世界杯征文活动 #Python #2022卡塔尔世界杯 #FIFA World Cup Qatar 2022 # 机器学习 #数据分析 用Python预测世界杯决赛

今天2022年11月29日的凌晨&#xff0c;葡萄牙队2比0获击败乌拉圭队&#xff01;葡萄牙队提前晋级16强&#xff0c;你熬夜看这场比赛了吗&#xff1f; 今天晚上11点荷兰将对战卡塔尔&#xff0c;NED(荷兰&#xff09;有望取胜&#xff01; 现在让我们通过Python数据分析以及机器…

Kaggle时间序列预测相关比赛以及代码

1.预测商品销量比赛 代码1&#xff1a;使用LSTM https://www.kaggle.com/code/sanjaylalwani/lstm-predict-sales 代码2&#xff1a;传统方法AR, MA and ARMA models https://www.kaggle.com/code/jagangupta/time-series-basics-exploring-traditional-ts 代码3&#xff1a;F…

【6月比赛合集】103场可报名的数据挖掘大奖赛,任君挑选!

CompHub[1] 实时聚合多平台的数据类(Kaggle、天池…)和OJ类(Leetcode、牛客…&#xff09;比赛。本账号会推送最新的比赛消息&#xff0c;欢迎关注&#xff01; 以下信息仅供参考&#xff0c;以比赛官网为准 目录 Kaggle&#xff08;7场比赛&#xff09;阿里天池&#xff08;…

Python大数据预测NBA比赛结果

大数据带给我们的是一种生活、工作和思维上的大变革&#xff0c; 当下&#xff0c;NBA季后赛打的正如火如荼&#xff0c;各位球迷肯定希望能提前预测自己喜欢的球队能不能杀入总决赛&#xff0c;拿到总冠军。 今晚&#xff0c;黑马程序员李老师&#xff0c;将为大家带来免费公开…