基于上下文自适应可变长熵编码 CAVLC 原理详细分析

CAVLC

CAVLC,即Context-Adaptive Variable-Length Coding,是一种用于视频压缩的编码技术,特别是在MPEG-4视频编码标准中使用。CAVLC是一种熵编码方法,它根据视频数据的上下文信息来调整编码长度,以实现更有效的数据压缩。

CAVLC的主要特点包括:

  1. 上下文适应性:编码器会根据视频帧中的特定上下文来选择最合适的编码长度,例如在图像的平坦区域使用较短的编码,而在边缘区域使用较长的编码。
  2. 可变长度编码:编码的长度不是固定的,而是根据数据的统计特性来确定,这有助于进一步压缩数据。
  3. 效率:CAVLC提供了比固定长度编码更高的压缩效率。

CAVLC通常用于视频编码的残差数据部分,即在变换编码(如DCT)之后,用于编码变换系数。这种编码方式可以显著减少编码后数据的比特率,从而提高视频传输和存储的效率。

CAVLC原理

相关名词解释

  • TotalCoeffs :非零系数,代表ZigZag扫描后序列中非0值的个数;取值 0~16。
  • TrailingOnes :拖尾系数,代表ZigZag扫描后序列中+1,和-1的总个数,取值0~3,如果超过3,则为3,在ZigZag扫描序列中从右到左选取三个,作为拖尾系数,其余的系数就当普通的非零系数;TotalCoeffs和TrailingOnes是通过查表方式,共有4 个变长表格和 1 个定长表格;其中定长表格是6 个比特长,高 4 位表示TotalCoeffs,低 2 位表示TrailingOnes。
  • TotalZeros: 编码最后一个非零系数前零的数目。
  • NC:当前块值,用来决策coeff如何编码的变量; 上述的 5 个表格的选择就是根据 NC 值来决定的。
  • ZerosLeft: 当前系数之前所有的0的个数,其初始值等于TotalZeros。
  • RunBefore: 编码每个非零系数前0的个数。
  • Levels:编码除了拖尾系数之外的非零系数的幅值。

NC 计算

  • 该值的求解过程中,体现了基于上下文的思想。除了色度的直流系数外,其它系数类型的 NC 值是根据当前块左边 4x4 块的非零系数数目(NA)和当前块上面 4x4 块的非零系数数目(NB)求得的。当输入的系数是色度的直流系数时,NC = -1。求 NC 的过程见表 6.10,X 表示与当前块同属于一个片并可用。 选择非零系数数目和拖尾系数数目的编码表格的过程见表 6.11 。
    在这里插入图片描述

Levels 计算

  • 非零系数的幅值(Levels)的组成分为两个部分,前缀(level_prefix)和后缀(level_suffix)。levelSuffixsSize 和 suffixLength 是编码过程中需要使用的两个变量。后缀是长度为 LevelSuffixsSize 位的无符号整数。通常情况下变量 levelSuffixsSize 的值等于变量 suffixLength 的值,有两种情况例外:
    • 当前缀等于 14 时,suffixLength 等于 0,levelSuffixsSize 等于 4。
    • 当前缀等于 15 时,levelSuffixsSize 等于 12。
  • 变量 suffixLength 是基于上下文模式自适应更新的,suffixLength 的更新与当前的 suffixLength 的值以及已经解码好的非零系数的值(Level)有关。suffixLength 数值的初始化以及更新过程如下所示:
    • 普通情况下 suffixLength 初始化为 0,但是当块中有多于 10 个非零系数并且其中拖尾系数的 数目少于 3 个,suffixLength 初始化为 1。
    • 编码在最高频率位置上的非零系数。
    • 如果当前已经解码好的非零系数值大于预先定义好的阈值,变量 suffixLength 加 1。 决定是否要将变量 suffixLength 的值加一的阈值如表 3 所示。第一个阈值是 0,表示在第一个非零系数被编码后,suffixLength 的值总是增加 1。
      在这里插入图片描述
  • Levels 的算法过程
  • 将有符号变成无符号:如果level > 0: levelcode = level << 1 - 2 如果level < 0: levelcode = -(level << 1) - 1 ;(上面的公式对应句法也就是把正数转换为偶数,负数转换为奇数。比如level=1时,levelcode=0,level=-1,levelcode=1)。
  • 根据level_prefix 码表进行查表: level_prefix = levelcode / (1 << suffix_length) 得到level_prefix之后通过查表即可以获得对应该如何编码。(在句法中,有 levelCode = level_prefix << suffix_length,进行转换,就可以得到上面的公式)。
  • Suffix_length表示的是level编码后缀的长度,后缀用0填充,长度为多少就填充多少个0。初始值为0,如果非零系数 > 10且 拖尾数目 < 1的时候,suffix_length初始值为1,if(suffix_length == 0) suffix_length++; else if(level > 3 << (suffix_length - 1) && suffix_length < 6) suffix_length++
    在这里插入图片描述
    在这里插入图片描述

CAVLC示例

  1. 编码残差数据经过变换量化后的4x4 块矩阵举例如下:
    在这里插入图片描述
  2. 量化后矩阵系数有负数的原因:因为在变换前,一般字节的值在 0~255,为了减少像素绝对值的波动,先把数值移位一下,变成-128~127;这样就出现了负数,移位之后再进行变换和量化操作。
  3. 对 4x4 矩阵进行 zigzag 扫描:0、0、5、3、2、-1、0、0、0、1、0、0、0、0、0、0
  4. TotalCoeffs = 5
  5. TrailingOnes = 2
  6. TotalZeros = 5
  7. NC = 3 (假定)
  8. 编码coeff_token:根据TotalCoffes,TrailiingOnes以及NC而确定;确定coeff_token编码为 0000101
    在这里插入图片描述
  9. 编码TrailingOnes:标志位符号Trailing_ones_sign_flag 中 0 表示 +1,1 表示 -1,从右到左依次编码为 01
  10. 编码除拖尾以外的非零系数的Levels:按照 zigzag 的逆序,从右向左。
  • 编码“2”:levelcode = 2 << 1 - 2 = 2; level_prefix = 2 / (1 << 0) = 2; 此时suffix_length == 0,没有后缀,同时suffix_length++,suffix_length = 1. 查表,level_prefix = 2时,编码为“001”,且suffix_length = 0,无后缀,此时编码为:001
  • 编码“3”: levelcode = 3 << 1 - 2 = 4; level_prefix = levelcode / (1 << suffix_length) = 4 / (1 << 1) = 2 ; level_prefix = 2, 编码为“001”,且suffix_length = 1, 填充 1 位“0”,根据公式:if(suffix_length == 0) suffix_length++; else if(level > 3 << (suffix_length - 1) && suffix_length < 6) suffix_length++ ;条件不成立,则此时suffix_length不需要累加 1,suffix_length依旧等于 1,此时编码为:0010
  • 编码"5": levelcode = 5 << 1 - 2 = 8; level_prefix = levelcode / (1 << suffix_length) = 8 / (1 << 1) = 4 ; level_prefix = 4,suffix_length = 1,此时, 编码为“00001”,且此时suffix_length == 1, 填充1位“0”, 根据公式,条件成立,suffix_length需要累加1;suffix_length = 2,最终编码为:000010
  1. 编码最后一个非零系数前的0的个数TotalZeros: 此时TotalZeros = 5, TotalCoeffs = 5, 查第一张表,因为TotalZeros=5,所以此时的编码为 101
    在这里插入图片描述
  2. 对每个非零系数前零的个数RunBefore进行编码,依旧采用ZigZag反序:
  • RunBefore 在以下两种情况下是不需要编码的:
    • 最后一个非零系数(在低频位置上)前零的个数;
    • 如果没有剩余的零需要编码(Σ[RunBefore]=TotalZeros)时,没有必要再进行 RunBefore 的编码;
  • 按照ZigZag逆序分别为 1, -1, 2, 3, 5,查表;
    • 对1编码: zerosLeft = 5, run_before = 3, 编码为010
    • 对-1编码: zerosLeft = 2, run_before = 0, 编码为1
    • 对2编码: zerosLeft = 2, run_before = 0, 编码为1
    • 对3编码: zerosLeft = 2, run_before = 0, 编码为1
    • 对5编码: zerosLeft = 2, run_before = 0, 最后一个系数不需要编码。
      在这里插入图片描述
  1. 最终的CAVLC熵编码之后码流为:0000101010010010000010101010111

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/380550.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Stable Diffusion 使用详解(2)---- 图生图原理,操作,参数

目录 背景 图生图原理 基本原理 1. 扩散模型基础 2. 图生图的具体流程 3. 关键技术点 4. 应用实例 CLIP 原理 1.基本概念 2. 核心特点 使用及参数 随机种子 重绘幅度 图像宽高 采样方法 1. DPM&#xff08;扩散概率模型&#xff09; 2. SDE&#xff08;随机微…

5G mmWave PAAM 开发平台

Avnet-Fujikura-AMD 5G 毫米波相控阵天线模块开发平台 Avnet 和 Fujikura 为毫米波频段创建了一个领先的 5G FR2 相控阵天线开发平台。该平台使开发人员能够使用 AMD Xilinx 的 Zynq UltraScale™ RFSoC Gen3 和 Fujikura 的 FutureAcess™ 相控阵天线模块 (PAAM) 快速创建和制…

【项目】星辰博客介绍

目录 一、项目背景 二、项目功能 1. 登录功能&#xff1a; 2. 列表页面&#xff1a; 3. 详情页面&#xff1a; 4. 写博客&#xff1a; 三、技术实现 四、功能页面展示 1. 用户登录 2. 博客列表页 3. 博客编辑更新页 4.博客发表页 5. 博客详情页 五.系统亮点 1.强…

【AI学习】LLaMA 系列模型的进化(二)

在前面LLaMA 系列模型的进化&#xff08;一&#xff09;中学习了LLama模型的总体进化发展&#xff0c;再来看看其中涉及的一些重要技术。 PreLayerNorm Layer Norm有Pre-LN和Post-LN两种。Layer Normalization&#xff08;LN&#xff09;在Transformer架构中的放置位置对模型…

使用Java -jar运行就jar包时报异常:org.yaml.snakeyaml.error.YAMLException异常

Java运行就 .jar包时出现的 YAMLException 异常 我在本地环境测试时&#xff0c;使用 java -jar 命令运行 Java 可执行 .jar 包时&#xff0c;遇到了 org.yaml.snakeyaml.error.YAMLException: java.nio.charset.MalformedInputException: Input length 1 异常&#xff1b;这…

windows USB 设备驱动开发-开发Type C接口的驱动程序(一)

如果 USB Type-C 系统未实现 PD 状态机&#xff0c;或者它实现了状态机&#xff0c;但不支持通过非 ACPI 传输 UCSI&#xff0c;则需要为连接器编写驱动程序。 如果存在&#xff0c;可以加载 Microsoft 提供的 UCSI 驱动程序。 建议的解决方案 下表建议基于硬件或固件功能的解…

在vs code中用npm run serve运行项目报错

在vs code中用npm run serve运行项目报错 报错为&#xff1a; npm ERR! code ENOENT npm ERR! syscall open npm ERR! path C:\Users\Administrator\Desktop\project_shop/package.json npm ERR! errno -4058 npm ERR! enoent ENOENT: no such file or directory, open ‘C:\Us…

sourcetree中常用功能使用方法及gitlab冲突解决

添加至缓存&#xff1a;等于git add 提交&#xff1a;等于git commit 拉取/获取&#xff1a;等于git pull ,在每次要新增代码或者提交代码前需要先拉取一遍服务器中最新的代码&#xff0c;防止服务器有其他人更新了代码&#xff0c;但我们自己本地的代码在我们更新前跟服务器不…

docker应用:搭建云手机

简介&#xff1a;近来慵懒&#xff0c;身体懈怠良多&#xff0c;思来想去随手看点小攻略以宽慰不懈怠的心。云手机Cloudphone&#xff0c;就是将云计算技术运用于网络终端服务&#xff0c;通过云服务器实现云服务的手机。其实就是深度结合了网络服务的智能手机&#xff0c;这类…

使用Python的Turtle库绘制太极,用turtle演绎中国风!

引言 在编程领域&#xff0c;图形绘制是一项既实用又有趣的技能。Python的turtle模块以其易用性和可视化特性成为了入门级图形编程的理想选择。本文将介绍如何使用turtle模块结合多线程技术&#xff0c;同时绘制一个太极&#xff0c;以此来探索图形绘制和并发编程的概念。 Tu…

Java实战中如何使用多线程(线程池)及其为什么使用?

这个话题在入行之前就想过很多次&#xff0c;很多8古文或者你搜索的结果都是告诉你什么提高高并发或者是一些很高大上的话&#xff0c;既没有案例也没有什么公式去证明&#xff0c;但是面试中总是被问到&#xff0c;也没有实战经历&#xff0c;所以面试时一问到多线程的东西就无…

PACS-医学影像信息管理系统,全影像科室PACS源码,内置包括MPR、CMPR、VR等三维处理功能

PACS系统可以覆盖医院现有放射、CT、MR、核医学、超声、内镜、病理、心电等绝大部分DICOM和非DICOM检查设备&#xff0c;支持从科室级、全院机、集团医院级乃至到区域PACS的平滑扩展&#xff0c;能够与医院HIS、集成平台的有效集成和融合&#xff0c;帮助医院实现了全院医学影像…

分布式 I/O 系统 BL200 Modbus TCP 耦合器

BL200 耦合器是一个数据采集和控制系统&#xff0c;基于强大的 32 位微处理器设计&#xff0c;采用 Linux 操作系统&#xff0c;支持 Modbus 协议&#xff0c;可以快速接入现场 PLC、SCADA 以及 ERP 系统&#xff0c; 内置逻辑控制、边缘计算应用&#xff0c;适用于 IIoT 和工业…

Github 2024-07-20 Rust开源项目日报 Top10

根据Github Trendings的统计,今日(2024-07-20统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Rust项目10TypeScript项目1Rust: 构建可靠高效软件的开源项目 创建周期:5064 天开发语言:Rust协议类型:OtherStar数量:92978 个Fork数量:1…

【漏洞复现】Next.js框架存在SSRF漏洞(CVE-2024-34351)

0x01 产品简介 ZEIT Next.js是ZEIT公司的一款基于Vue.js、Node.js、Webpack和Babel.js的开源Web应用框架。 0x02 漏洞概述 ZEIT Next.js 13.4版本至14.1.1之前版本存在代码问题漏洞&#xff0c;该漏洞源于存在服务器端请求伪造 (SSRF) 漏洞 0x03 搜索引擎 body"/_nex…

【BUG】已解决:xlrd.biffh.XLRDError: Excel xlsx file; not supported

已解决&#xff1a;xlrd.biffh.XLRDError: Excel xlsx file&#xff1b; not supported 目录 已解决&#xff1a;xlrd.biffh.XLRDError: Excel xlsx file&#xff1b; not supported 【常见模块错误】 错误原因 解决办法&#xff1a; 欢迎来到英杰社区https://bbs.csdn.net/…

MyBatis框架学习笔记(四):动态SQL语句、映射关系和缓存

1 动态 SQL 语句-更复杂的查询业务需求 1.1 动态 SQL-官方文档 &#xff08;1&#xff09;文档地址: mybatis – MyBatis 3 | 动态 SQL &#xff08;2&#xff09;为什么需要动态 SQL 动态 SQL 是 MyBatis 的强大特性之一 使用 JDBC 或其它类似的框架&#xff0c;根据不同条…

【瑞吉外卖 | day07】移动端菜品展示、购物车、下单

文章目录 瑞吉外卖 — day71. 导入用户地址簿相关功能代码1.1 需求分析1.2 数据模型1.3 代码开发 2. 菜品展示2.1 需求分析2.2 代码开发 3. 购物车3.1 需求分析3.2 数据模型3.3 代码开发 4. 下单4.1 需求分析4.2 数据模型4.3 代码开发 瑞吉外卖 — day7 移动端相关业务功能 —…

华为USG6000V防火墙NAT智能选举

目录 一、拓扑图 二、要求 三、配置思路及方法 要求1&#xff1a;通过多对多的NAT实现上网功能 思路&#xff1a;基础IP地址配置按照之前的进行配置&#xff0c;接着在策略里配置多对多的NAT 要求2&#xff1a;分公司设备可以通过总公司的移动链路和电信链路访问到Dmz区的…

uniapp中给data中的变量赋值报错

排查了一上午&#xff0c;原本以为是赋值的这个变量有一个键名是空字符串的问题&#xff0c;后来发现是因为在data中定义变量是写的是{}&#xff0c;如果写成null就不会报错了&#xff0c;具体原因不清楚为什么