「专题速递」JPEG AI、端到端图像编码的标准化及产品落地、深度学习

cd710051b633a1f843d9cb87be6dc989.jpeg

7237d74dfc3cf1165c7779d916a34d87.gif

从最初的追随者到如今的领跑者,中国的超高清视频编解码技术已经走过20年的漫长征程。从开始制定不同的视频编解码标准,如H.264/265、AV1、VVC、AVS,再到积极地探索基于AI的视频编码技术。视频编解码——这一将视频数据高效压缩、传输和解码还原清晰度的技术应用,每一次微小的提升都是技术者智慧的结晶。

面对越来越复杂的视频编解码算法,新一代的视频标准对计算算力的需求呈指数级增长。这也使得GPU、ASIC等硬件的依赖程度不断上升。技术研究人员和工程师们一直在不懈努力,以不断提高视频编解码技术的性能和效率。AI可以帮助优化编码算法,提高视频压缩率,同时保持高质量的视频输出。此外,AI还可以应用于视频质量增强,去除噪声、提高清晰度,使用户能够享受更加逼真和令人沉浸的观看体验。

在本次视频编解码与AI专题中,我们将了解JPEG AI的标准进展,聆听关于端到端图像编码的标准化以及前沿产品的落地实践,同时了解结合深度学习、AI增强的视频编码技术。视频编解码与AI的融合已经改变了我们观看和分享视频内容的方式,期待与您共同探索这一领域的未来。

01

基于深度学习的视频编码

a92aeac152cbe1cea44933985dff088f.png

王诗淇

香港城市大学 副教授

视频编码是数字视频应用的核心技术,推动了多媒体产业的快速发展。随着超高清视频、虚拟现实技术的进步,亟需高效视频编码技术以应对海量视频数据量的挑战。此外,随着智慧城市相关技术的应用,针对面向机器视觉的高效视频编码的需求与日俱增。

本次分享将为大家介绍实验室在基于深度学习的高效视频编码领域的近期进展,主要包括三个部分:1)基于深度学习的混合视频编码,主要包括利用深度神经网络对传统视频编码平台工具的改进;2)端到端视频编码,主要包括基于深度学习的语义编码、生成式编码等工作;3)面向机器视觉任务的视频编码,主要包括面向机器视觉任务的高效视觉表示压缩。

02

端到端图像视频编码及其标准化

be156240b405bd6b21b25884d1f885c8.jpeg

李礼

中国科学技术大学 特任教授

传统图像视频编码基于混合编码框架,经过数十年的发展,其性能提升已经进入瓶颈。端到端图像视频编码作为一种新的编码框架,短短几年的发展,就达到了和传统图像视频编码相匹配的性能。本分享拟介绍端到端图像视频编码的基本思想,并介绍其用于图像、视频、三维生物医学图像等多个模态的发展现状和标准化情况。

本次分享将分为两个部分,第一部分介绍针对端到端图像视频编码的基本思想,主要包括自编码器,基于深度学习的概率估计网络等。第二部分介绍端到端编码方法用于图像、视频、三维生物医学图象等模态的发展现状和标准化情况。

03

全球领先的基于端到端图像编解码落地的产品及解决方案

e647279c9d1ceaa0a91627961926b074.jpeg

曹磊

双深科技 创始人&CEO

信息化时代带来图像视频数据的爆发式增长,导致图像视频数据的传输、存储、分析和应用面临瓶颈。因编解码技术可以有效对数据进行压缩,进而成为近几年的研究热点。

本次演讲将聚焦AI端到端图像编解码技术上的应用落地研究,阐述双深科技对AI端到端编解码技术的理解和趋势判断,AI编解码技术在图小小相册APP的应用落地,在CDN场景的行业应用,以及将AI端到端编解码与跨模态语义检索模型进行融合探索。

04

JPEG AI图像编码标准进展和应用

ffad707c8f0538f43556f6a699dfa06b.png

赵寅

华为 视频编码技术专家

图像是互联网数据的重要组成部分。30年前JPEG标准组制订了JPEG-1标准(即为人熟知的JPG格式),并已发展成应用最为广泛的图像格式。随着AI技术的发展,图像不但能够被更高效地压缩,也正在被更多的AI应用所使用。面向更高图像压缩效率和AI任务效率的应用需求,JPEG标准组启动了JPEG AI图像编码标准,基于AI技术、服务AI应用。

本次分享主要包括三个部分:1)JPEG AI标准愿景、应用场景和标准化时间线;2)JPEG AI标准的整体架构、技术效果和优势;3)JPEG AI的重点技术、标准化过程中遇到的难点问题及其解决方法。通过本次介绍,希望能让大家走近JPEG AI,并给业务和研究以启示。

 *本专题讲师陆续上线中,更多精彩请关注大会官网

如果你希望参与到音视频技术大会当中,此刻刚刚好:“LiveVideoStackCon 2023音视频技术大会深圳站”门票限时9折优惠中,报名立享优惠,团体参会优惠更多哦!现在报名,与您相约深圳。

●时间:2023年11月24日-25日

●地点:深圳圣淘沙酒店(翡翠店)

●获票方式:扫描下方二维码,或咨询票务微信,了解大会详情。

7a5d81298d009e5dca84032d6703599a.png

优惠截止10月15日 

          票务服务:

微信同号13520771810

ticket@livevideostack.com

589680fc7362c81c7a68771341242a8f.jpeg

关于LiveVideoStackCon 音视频技术大会

LiveVideoStackCon是专注于音视频领域的技术大会,致力于分享一流的技术内容,在把握行业趋势和热点的同时持续挖掘技术深度。自首届以来的13场大会中,LiveVideoStackCon成为众多音视频技术人的舞台、国内多媒体生态的风向标,也成为大家技术交流、拓展专业网络、职场进阶的新方式。

LiveVideoStackCon 2023 深圳站,将以“沉浸·新视界”为主题,在2023年11月24日-25日在深圳和大家见面。本场音视频技术大会,依然聚焦在多媒体生态,精心打磨3场主题演讲、13场专题(包括一场圆桌专题)。本次大会规模约300+参会人员,50+技术分享,80+参会企业,并设有VIP社交晚宴、硬件体验区、扭蛋抽奖等各种活动,带来丰富、沉浸的技术大会体验。

▼点击下方阅读原文 ▼

进入LiveVideoStackCon 2023深圳站官网 了解更多精彩演讲

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/151803.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mybatis-plus 多数据源配置

1. 双数据库创建 两个数据库各有一张表 2. yml中配置双数据库 下面的配置来源于mybatis-plus官网 spring:datasource:dynamic:primary: master #设置默认的数据源或者数据源组,默认值即为masterstrict: false #严格匹配数据源,默认false. true未匹配到指定数据源时抛异常,fal…

k8s-10 ingress-nginx 特性

TLS加密 创建证书 测试 auth认证 创建认证文件 rewrite重定向 进入域名 会自动重定向hostname.html 示例二: 测试 后面必须跟westos 这个关键字 canary金丝雀发布 基于header灰度 场景:版本的升级迭代,比如一个service 升级到另…

基于SpringBoot的房屋租赁管理系统的设计与实现

目录 前言 一、技术栈 二、系统功能介绍 屋主管理 房屋信息管理 房屋租赁公告 租用订单管理 房屋信息管理 保洁管理 房屋信息 租用订单管理 取消订单管理 三、核心代码 1、登录模块 2、文件上传模块 3、代码封装 前言 互联网发展至今,无论是其理论还是…

分布式数据库(林子雨慕课课程)

文章目录 4. 分布式数据库HBase4.1 HBase简介4.2 HBase数据模型4.3 HBase的实现原理4.4 HBase运行机制4.5 HBase的应用方案4.6 HBase安装和编程实战 4. 分布式数据库HBase 4.1 HBase简介 HBase是BigTable的开源实现 对于网页搜索主要分为两个阶段 1.建立整个网页索引&#xf…

【juc】future并行执行并获取返回值

目录 一、截图示例二、代码示例2.1 接口示例2.2 调用示例 一、截图示例 二、代码示例 2.1 接口示例 package com.learning.controller;import lombok.extern.slf4j.Slf4j; import org.springframework.web.bind.annotation.GetMapping; import org.springframework.web.bind.…

Flink+Doris 实时数仓

Flink+Doris 实时数仓 Doris基本原理 Doris基本架构非常简单,只有FE(Frontend)、BE(Backend)两种角色,不依赖任何外部组件,对部署和运维非常友好。架构图如下 可以 看到Doris 的数仓架构十分简洁,不依赖 Hadoop 生态组件,构建及运维成本较低。 FE(Frontend)以 Java 语…

c++中的map和set

文章目录 1. 关联式容器2. 键值对3. 树形结构的关联式容器3.1 set3.1.1 set的介绍3.1.2 set的使用 3.2 map3.2.1 map的介绍3.2.2 map的使用 3.3 multiset3.3.1 multiset的介绍3.3.2 multiset的使用 3.4 multimap3.4.1 multimap的介绍3.4.2 multimap的使用 1. 关联式容器 在初阶…

使用弹性盒子flex对html进行布局和动态计算视口高度

使用弹性盒子flex对html进行布局的一个练习 height: calc(100vh - 4px); # vh表示视口高度的百分比,所以100vh表示整个视口的高度。 .mytxt { text-indent: 2em; /* 首航缩进2字符 */ line-height: 2; /* 2倍行高 */ padding: 8px; /* 内容与边框的距离 */ } …

Redis到底是什么?都有哪些特性?看完这一篇就都会了

目录 Redis是什么 Redis的应用场景有哪些? Redis的数据类型及主要特性 Redis的数据结构 简单动态字符串SDS (Simple Dynamic String) SDS的特点 Redis特性1:事务 Redis特性2:发布订阅(Pub/Sub) Redis特性3:Stream Redis…

Tailwind CSS浅析与实操

Tailwind CSS 一、Tailwind CSS简介 What is Tailwind CSS Tailwind CSS| TailwindCSS中文文档 | TailwindCSS中文网官方解释:只需书写 HTML 代码,无需书写 CSS,即可快速构建美观的网站。本质上是一个工具集,包含了大量类似 fle…

程序无法启动,提示“找不到msvcp140.dll”或“msvcp140.dll缺失报错”解决方法

大家好!今天我来给大家分享一下msvcp140.dll丢失的解决方法。我们都知道,在运行一些软件或游戏时,经常会遇到“找不到msvcp140.dll”的错误提示,这会让我们非常苦恼。那么,这个问题该怎么解决呢?下面我将为…

等精度频率计verilog,quartus仿真视频,原理图,代码

名称&#xff1a;等精度频率计设计verilog quartus仿真 软件&#xff1a;Quartus 语言&#xff1a;Verilog 要求&#xff1a; A&#xff1a;测量范围信号:方波 频率:100Hz~1MHz; B&#xff1a;测试误差:<0.1%(全量程) C&#xff1a;时钟频率:50kHz D&#xff1a;预闸…

Django 前端模板显示换行符、日期格式

linebreaksbr 显示换行符 <td>{{ data.sku_list|default:"无"|linebreaksbr }}</td> date:"Y年m月d日 H:i" 设置日期格式 <td>{{ data.submit_time|date:"Y年m月d日 H:i" }}</td> 其他语法 forloop 获取循环的索引 …

ChatGLM2-6B微调实践

ChatGLM2-6B微调实践 环境准备安装部署1、安装 Anaconda2、安装CUDA3、安装PyTorch4、安装 ChatGLM2-6B 微调实践1、准备数据集2、安装python依赖3、微调并训练新模型4、微调后模型的推理与评估5、验证与使用微调后的模型 微调过程中遇到的问题 环境准备 申请阿里云GPU服务器&…

【虹科分享】什么是Redis数据集成(RDI)?

大量的应用程序、日益增长的用户规模、不断扩展的技术需求&#xff0c;以及对即时响应的持续追求。想想这些是否正是你在经历的。也许你尝试过自己构建工具来应对这些需求&#xff0c;但是大量的编码和集成工作使你焦头烂额。那你是否知道&#xff0c;有这样一个工具可以帮助你…

计算机竞赛 题目:基于深度学习的中文汉字识别 - 深度学习 卷积神经网络 机器视觉 OCR

文章目录 0 简介1 数据集合2 网络构建3 模型训练4 模型性能评估5 文字预测6 最后 0 简介 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 基于深度学习的中文汉字识别 该项目较为新颖&#xff0c;适合作为竞赛课题方向&#xff0c;学长非常推荐&#xff01; &a…

从入门到精通,30天带你学会C++【第七天:for循环和while循环以及数组的学习】(学不会你找我)

目录 Everyday English 前言 数组 数组的概念 数组的定义 数组的下标 for循环 循环是什么 基本格式 多重循环 while循环 do-while循环 总结 Everyday English To shine , not be illuminated. 去发光&#xff0c;而不是被照亮。 前言 好久不见&#xff0c…

kafka初体验基础认知部署

kafka 基础介绍 Apache Kafka是一个分布式流处理平台&#xff0c;最初由LinkedIn开发并于2011年开源。它主要用于解决大规模数据的实时流式处理和数据管道问题。 Kafka是一个分布式的发布-订阅消息系统&#xff0c;可以快速地处理高吞吐量的数据流&#xff0c;并将数据实时地分…

图片素材免费下载,高清无水印,无需担心版权问题。

找图片素材就上这8个网站&#xff0c;免费可商用&#xff0c;建议收藏起来~ 1、菜鸟图库 https://www.sucai999.com/pic.html?vNTYwNDUx 网站主要为新手设计师提供免费素材&#xff0c;这些素材的质量都很高&#xff0c;类别也很多&#xff0c;像平面、UI、电商、视频、图片…

【1++的Linux】之进程(五)

&#x1f44d;作者主页&#xff1a;进击的1 &#x1f929; 专栏链接&#xff1a;【1的Linux】 文章目录 一&#xff0c;什么是进程替换二&#xff0c;替换函数三&#xff0c;实现我们自己的shell 一&#xff0c;什么是进程替换 我们创建出来进程是要其做事情的&#xff0c;它可…