一种适用于无人机SPI接口视频码率控制方法与流程

文档序号：11157405阅读：来源：国知局

技术特征：

1.一种适用于无人机SPI接口视频码率控制方法，其特征在于包括下述步骤：

步骤1：缓冲区正常工作的要求为t时刻缓冲区内已缓存的视频流大小等于0～t时间段内流入缓冲区的视频流总量减去0～t时间段内流出缓冲区的视频流的总量，即满足式(1)

$<mrow> <mi>B</mi> <mi>u</mi> <mi>f</mi> <mi>f</mi> <mi>e</mi> <mi>r</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <msubsup> <mo>&Integral;</mo> <mn>0</mn> <mrow> <mo>+</mo> <mi>∞</mi> </mrow> </msubsup> <mi>I</mi> <mi>n</mi> <mi>p</mi> <mi>u</mi> <mi>t</mi> <mo>_</mo> <mi>r</mi> <mi>a</mi> <mi>t</mi> <mi>e</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mi>d</mi> <mi>t</mi> <mo>-</mo> <msubsup> <mo>&Integral;</mo> <mn>0</mn> <mrow> <mo>+</mo> <mi>∞</mi> </mrow> </msubsup> <mi>O</mi> <mi>u</mi> <mi>t</mi> <mi>p</mi> <mi>u</mi> <mi>t</mi> <mo>_</mo> <mi>r</mi> <mi>a</mi> <mi>t</mi> <mi>e</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mi>d</mi> <mi>t</mi> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>$

式(1)中，Buffer(t)表示t时刻缓冲区缓存视频数据的总量，Input_rate(t)表示t时刻已编码的视频流入SPI缓冲区的速度，即当前编码器的输出码率，Output_rate(t)表示t时刻视频流出SPI缓冲区的速度，即SPI接口的视频传输速度；

步骤2：根据目标码率计算初始量化参数

根据单位像素的平均目标比特数确定初始量化参数QP₀，其计算公式如下：

$<mrow> <msub> <mi>QP</mi> <mn>0</mn> </msub> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mn>33</mn> </mtd> <mtd> <mrow> <mi>b</mi> <mi>p</mi> <mi>p</mi> <mo><</mo> <mi>l</mi> <mn>1</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>29</mn> </mtd> <mtd> <mrow> <mi>l</mi> <mn>1</mn> <mo><</mo> <mi>b</mi> <mi>p</mi> <mi>p</mi> <mo><</mo> <mi>l</mi> <mn>2</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>24</mn> </mtd> <mtd> <mrow> <mi>l</mi> <mn>2</mn> <mo><</mo> <mi>b</mi> <mi>p</mi> <mi>p</mi> <mo><</mo> <mi>l</mi> <mn>3</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>19</mn> </mtd> <mtd> <mrow> <mi>b</mi> <mi>p</mi> <mi>p</mi> <mo>></mo> <mi>l</mi> <mn>3</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>$

其中l1，l2，l3是预定的阈值，l1，l2，l3的设置参数表1：

表1

图像大小l1l2l3QCIF0.10.30.6CIF0.20.61.2大于CIF0.61.42.4

表1中CIF为Common Intermediate Format，QCIF为Quarter Common Intermediate Format，其中CIF和QCIF都是一种通用视频格式，CIF尺寸大小为352×288像素，QCIF尺寸大小为176×144像素；

公式(2)图像中每个像素点所占的比特数bpp由下式确定：

$<mrow> <mi>b</mi> <mi>p</mi> <mi>p</mi> <mo>=</mo> <mfrac> <mrow> <mi>u</mi> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mn>1</mn> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mi>F</mi> <mi>r</mi> </msub> <mo>×</mo> <mi>w</mi> <mi>i</mi> <mi>d</mi> <mi>t</mi> <mi>h</mi> <mo>×</mo> <mi>h</mi> <mi>e</mi> <mi>i</mi> <mi>g</mi> <mi>h</mi> <mi>t</mi> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>$

公式(3)中u(n_1,1)表示起始可用信道带宽，n_1，1表示第1个GOP的第1帧，F_r为编码时的帧率，单位为帧/秒，记为fps，width表示图像宽度，height表示图像高度，width和height单位均为像素；

GOP第一帧为I帧，其余均为P帧，对于图像组(Group of Picture，GOP)，起始量化参数由式(4)确定：

$<mrow> <mover> <mrow> <msub> <mi>QP</mi> <mi>i</mi> </msub> </mrow> <mo>&OverBar;</mo> </mover> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>=</mo> <mi>m</mi> <mi>i</mi> <mi>n</mi> <mo>{</mo> <msub> <mi>QP</mi> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>+</mo> <mn>2</mn> <mo>,</mo> <mfrac> <mrow> <mi>T</mi> <mi>o</mi> <mi>t</mi> <mi>a</mi> <mi>l</mi> <mi>Q</mi> <mi>P</mi> <mi>f</mi> <mi>o</mi> <mi>r</mi> <mi>P</mi> <mi>P</mi> <mi>i</mi> <mi>c</mi> <mi>t</mi> <mi>u</mi> <mi>r</mi> <mi>e</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mi>N</mi> <mi>p</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>-</mo> <mi>m</mi> <mi>i</mi> <mi>n</mi> <mo>{</mo> <mn>2</mn> <mo>,</mo> <mfrac> <msub> <mi>N</mi> <mrow> <mi>g</mi> <mi>o</mi> <mi>p</mi> </mrow> </msub> <mn>15</mn> </mfrac> <mo>}</mo> <mo>}</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>$

其中，表示除第1个I帧之外的第i个GOP的起始量化参数，QP_i-1(1)表示除第1个I帧之外的第(i-1)个GOP的起始量化参数，N_p(i-1)表示第(i-1)个GOP中P帧个数，TotalQPforPPicture(i-1)表示第(i-1)个GOP中所有P帧量化参数之和，N_gop是第i个GOP中的总帧数；

公式(4)的代入公式(5)，与QP_i-1(1)-2相比求出最大值，即可求出迭代后的QP_i(1)：

$<mrow> <msub> <mi>QP</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>=</mo> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mo>{</mo> <msub> <mi>QP</mi> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>-</mo> <mn>2</mn> <mo>,</mo> <mover> <mrow> <msub> <mi>QP</mi> <mi>i</mi> </msub> </mrow> <mo>&OverBar;</mo> </mover> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>}</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>$

步骤3：根据目标缓冲区大小，确定当前P帧图像的目标比特数

在第i个GOP的第一个P帧编码完成后，目标缓冲区大小的起始值依照下式确定：

Tbl(n_i,2)＝B_c(n_i,2) (6)

其中Tbl(n_i,2)是第i个GOP的第一个P帧编码完成后，目标缓冲区大小的起始值，B_c(n_i,2)是第i个GOP的第一个P帧编码完成后实际缓冲区大小；

随后的P帧的目标缓冲区大小按照式(7)计算：

$<mrow> <mi>T</mi> <mi>b</mi> <mi>l</mi> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mi>T</mi> <mi>b</mi> <mi>l</mi> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mfrac> <mrow> <mi>T</mi> <mi>b</mi> <mi>l</mi> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mi>N</mi> <mi>p</mi> </msub> <mo>-</mo> <mn>1</mn> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow>$

其中，Tbl(n_i,2)表示第i个GOP的第一个P帧编码完成后，目标缓冲区大小的起始值；Tbl(n_i,j)表示第i个GOP的第(j-1)个P帧编码完成后，目标缓冲区大小的值；Tbl(n_i,j+1)表示第i个GOP的第j个P帧编码完成后，目标缓冲区大小的值；N_p表示第i个GOP中P帧的总帧数；

第i个GOP的第j个P帧应分配的目标比特数取决于目标缓冲区大小、帧率、可用信道带宽和实际缓冲区大小，计算公式如下：

$<mrow> <mover> <mi>f</mi> <mo>&OverBar;</mo> </mover> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>u</mi> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> <msub> <mi>F</mi> <mi>r</mi> </msub> </mfrac> <mo>+</mo> <mi>γ</mi> <mrow> <mo>(</mo> <mi>T</mi> <mi>b</mi> <mi>l</mi> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> <mo>-</mo> <msub> <mi>B</mi> <mi>c</mi> </msub> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> </mrow>$

其中表示第i个GOP的第j个P帧应分配的目标比特数，u(n_i,j)表示第i个GOP的第j个P帧应分配的可用信道带宽，γ是常数，Tbl(n_i,j)表示第i个GOP的第j-1个P帧应分配的目标缓冲区大小，B_c(n_i,j)表示第i个GOP的第j-1个P帧应分配的实际缓冲区大小；

对于第i个GOP开始编码时，分配的比特数由式(9)计算：

$<mrow> <msub> <mi>T</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mn>0</mn> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>u</mi> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> </mrow> <msub> <mi>F</mi> <mi>r</mi> </msub> </mfrac> <mo>×</mo> <msub> <mi>N</mi> <mrow> <mi>g</mi> <mi>o</mi> <mi>p</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>B</mi> <mi>C</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msub> <mi>N</mi> <mrow> <mi>g</mi> <mi>o</mi> <mi>p</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>9</mn> <mo>)</mo> </mrow> </mrow>$

其中T_r(n_i,0)表示第i个GOP分配的比特数，u(n_i,1)表示第i个GOP起始可用信道带宽，N_gop表示第i个GOP中的总帧数，B_c(n_i-1,N_gop)表示编码完第(i-1)个GOP后虚拟缓冲区实际大小；

根据公式(9)计算剩余可用比特数，当信道带宽随时间变化时，剩余比特数T_r(n_i,j)通过下式计算：

$<mrow> <msub> <mi>T</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>T</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mfrac> <mrow> <mi>u</mi> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>u</mi> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> </mrow> <msub> <mi>F</mi> <mi>r</mi> </msub> </mfrac> <mrow> <mo>(</mo> <msub> <mi>N</mi> <mrow> <mi>g</mi> <mi>o</mi> <mi>p</mi> </mrow> </msub> <mo>-</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>-</mo> <mi>A</mi> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>10</mn> <mo>)</mo> </mrow> </mrow>$

其中T_r(n_i,j)表示第i个GOP的第j个P帧的剩余比特数，T_r(n_i,j-1)表示第i个GOP的第(j-1)个P帧的剩余比特数，u(n_i,j-1)表示第i个GOP的第j-1个P帧应分配的可用信道带宽，A(n_i,j-1)表示第i个GOP的第j-1个P帧实际编码比特数；

当信道带宽恒定时，当前帧的剩余比特数通过下式计算：

T_r(n_i,j)＝T_r(n_i,j-1)-A(n_i,j-1) (11)

有公式(12)：

$<mrow> <mover> <mi>f</mi> <mo>^</mo> </mover> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <msub> <mi>T</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mi>N</mi> <mrow> <mi>p</mi> <mo>,</mo> <mi>r</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>12</mn> <mo>)</mo> </mrow> </mrow>$

其中表示第i个GOP的第j个P帧的目标比特数，N_p,r(j-1)表示未编码的第(j-1)个P帧数目，当前P帧图像的目标比特数由和的加权组合计算得到：

$<mrow> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mi>β</mi> <mo>×</mo> <mover> <mi>f</mi> <mo>^</mo> </mover> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <mi>β</mi> <mo>)</mo> </mrow> <mo>×</mo> <mover> <mi>f</mi> <mo>&OverBar;</mo> </mover> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>13</mn> <mo>)</mo> </mrow> </mrow>$

其中β是0至1之间的任意常数；

为了满足假想的解码器HRD(Hypothetical Reference Decoder)要求，目标比特数作如下限制：

$<mrow> <mtable> <mtr> <mtd> <mrow> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mi>max</mi> <mo>{</mo> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>,</mo> <mi>L</mi> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>}</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mi>min</mi> <mo>{</mo> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>,</mo> <mi>U</mi> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>}</mo> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>14</mn> <mo>)</mo> </mrow> </mrow>$

即L(n_i,j)<f(n_i,j)<U(n_i,j)，其中，f(n_i,j)表示目标比特数，U(n_i,j)和L(n_i,j)分别表示为保证缓冲区既不上溢又不下溢时，编码图像n所产生的比特数的上界和下界，其中，U(n_i,j)为比特数的上界，L(n_i,j)为比特数的下界；

步骤4：确定帧级量化参数QP

P帧量化参数的计算如下：

设定当前帧的量化参数QP_pc，当前帧为I帧或者是紧接I帧之后的第一个P帧时QP_pc＝QP₀；

否则，根据MADP_i＝a₁*MADP_i-1+a₂，a₁，a₂为预测模型的两个参数，初始值分别为a₁＝1，a₂＝0，MADP_i代表当前基本单元相应位置处的MAD，MADP_i-1代表前一帧相应位置处的MAD，用前一帧的实际平均绝对差MAD(Mean Absolute Difference)来预测当前帧的MAD，按照二次率失真模型，计算出当前帧的量化参数QP_pc，为了保证视频质量的连续性，相邻两帧量化参数的差值应不大于2，则量化参数作如下调整：

QP_pc＝min{QP_pp+2,max{QP_pp-2,QP_pc}} (15)

其中QP_pp为前一帧量化参数，由H.264标准可知，量化参数的取值范围为0～51，所有对量化参数作进一步的限制：

QP_pc＝min{51,max{1,QP_pc}} (16)

用式(16)求得的量化参数对当前帧的每个宏块执行率失真优化RDO(Rate Distortion Optimized)，得出每个宏块的最佳编码模式，最后对模型参数进行更新；

步骤5：跳帧控制

比特数多少来表示运动复杂度作为跳帧衡量的标准，第i个P帧的运动复杂度C_i用下式来表示：

$<mrow> <msub> <mi>C</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <msub> <mi>B</mi> <mrow> <mi>p</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mrow> <mfrac> <mn>1</mn> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> </mfrac> <munderover> <mo>Σ</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <msub> <mi>B</mi> <mi>j</mi> </msub> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>17</mn> <mo>)</mo> </mrow> </mrow>$

其中B_p,i为第i个P帧根据(i-1)帧线性预测所得到的P帧比特数，B_p,i＝α_iB_i-1，α_i初始值为1，B_i-1为已编码的第(i-1)帧的实际比特数，α_i为相邻两帧分配比特的变化因子，B_j(j＝1,2,...,i)是已编帧的实际比特数，同时，在比特数分配完毕后，α_i将进行更新，更新公式为

$<mrow> <msub> <mi>α</mi> <mrow> <mi>i</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <mfrac> <msub> <mi>B</mi> <mi>i</mi> </msub> <msub> <mi>B</mi> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mfrac> <mo>·</mo> <msub> <mi>α</mi> <mi>i</mi> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>18</mn> <mo>)</mo> </mrow> </mrow>$

判定相邻两帧图像是否发生场景切换的方法如下式所示：

$<mrow> <msub> <mi>T</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>B</mi> <mrow> <mi>p</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>B</mi> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> <msub> <mi>B</mi> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>19</mn> <mo>)</mo> </mrow> </mrow>$

其中：T_i为场景切换变化因子，对T_i设定一个阈值ε，阈值ε为0到1的常数；

当T_i＞ε时，判定该帧发生场景切换，由于发生场景切换时编码比特数会发生急增，容易超过缓冲区的上溢阈值ω，当缓冲器上溢，就判定P帧为跳帧，具体步骤如下：

采用GOP的结构为IPPPP...，即图像序列的第一帧为I帧，后面是连续的P帧，设定缓存容量的百分比为ω₁,ω₂,ω₃，且ω₁＜ω₂＜ω₃，同时设定图像的运动复杂度为a，b，c，且满足0<a<b<c<1，a、b和c均为固定值；ω_i为当前编码帧的缓冲区满度；

当ω_i＜ω₁则认为当前帧为静止图像，跳过此帧；

当ω₁＜ω_i＜ω₂时：若C_i＜a，则认为当前帧为静止图像，跳过此帧；若a<C_i＜b，则认为当前帧为运动缓慢图像，跳过此帧，若C_i＞b，则认为当前图像为运动剧烈图像，需要编码当前帧；

当ω₂＜ω_i＜ω₃时：若C_i＜b，则认为当前帧为静止图像，跳过此帧；若b<C_i＜c，则认为当前帧为运动缓慢图像，跳过此帧，若C_i＞c，则认为当前图像为运动剧烈图像，需要编码当前帧；

当ω_i＞ω₃时：若C_i＜c，则认为当前帧为静止图像，跳过此帧；若C_i＞c，则认为当前图像为运动剧烈图像，需要编码当前帧；

同时，当缓冲区满度ω_i超过90％以后，无论C_i的值为多少都将此帧判定为跳帧。

完整全部详细技术资料下载

当前第2页1 2 3