AV1技术学习： Compound Prediction

一、双向 Compound Prediction

AV1支持两个参考帧的预测通过多种复合模式线性组合。复合预测公式为

其中，权重m(x, y) is scaled by 64 以进行整数计算，R1(x, y)和R2(x, y)表示两个参考块中位于(x, y)的像素。P(x, y)将按比例缩小 1/64 以形成最终的预测。

1. Distance weighted prediction

让 d1 和 d2 分别表示当前帧与其两个参考帧之间的时间距离。权值 m(x, y) 由 d1 和 d2 的相对值决定。假设 d1≤d2，则权重定义为

当d1≥d2时，分布是对称的。

2. Average predictor

距离加权预测的一种特殊情况，两个参考的权重相等，即 m(x, y) = 32。

3. Difference weighted predictor

加权系数是基于两个参考像素之间的差异逐像素计算。当像素差超过一定阈值时，每个编码块发送一个二进制符号来决定哪个参考块占上风

注意，m(x, y)的上限为[0,64]。

4. Wedge mode

为每个符合条件的块大小预设了一组16个系数数组。将编码块分成两个子区域，并以不同的斜角。M (x, y)在大分区设置为64，在另一个分区设置为0，除了在过渡边缘附近，从64逐渐变为0，在实际边缘处为32。

我们使用下图来演示复合选项及其效果。为了实现其潜在的编码增益，众多的复合模式增加了大量的编码复杂性。尤其对于运动估计过程，因为每个参考块都与自己的运动向量相关联。同时对给定复合模式的两个运动向量进行优化，使得搜索空间呈指数级增长。先前的研究提出了一种联合搜索方法，迭代地固定一个运动向量，搜索另一个运动向量，直到结果收敛，可以显著减少复合模式的运动向量搜索点的数量。

二、单向 Compound Prediction

AV1 支持的单个参考帧的 Compound Prediction 模式，包括包括重叠块运动补偿和 inter-intra 组合 prediction 模式。

1. Overlapped block motion compensation

重叠块运动补偿（Overlapped block motion compensation）利用直接空间邻居的运动信息来提高其顶部和左侧边界附近像素的预测质量，其中真实的运动轨迹与两侧的运动向量相关
首先扫描上侧相邻块，并找到最多四个与当前块具有相同参考帧的相邻块作为参考块，如下图 (a) 所示，并且相邻块根据扫描顺序所标记。使用每个选定的参考块的运动矢量来生成从上边界向当前块的中心延伸的运动补偿块。其宽度与参考块宽度相同，高度为当前块高度的一半，如下图 (a) 所示。