二维DCT变换

首页 > 代码库 > 二维DCT变换

2024-10-17 01:40:39 214人阅读

https://wuyuans.com/2012/11/dct2/

写这篇文章的目的主要是为了给x264打好基础，x264用的是整数DCT变换，所以就先来说说DCT变换吧。
DCT(Discrete Cosine Transform)，又叫离散余弦变换，它的第二种类型，经常用于信号和图像数据的压缩。经过DCT变换后的数据能量非常集中，一般只有左上角的数值是非零的，也就是能量都集中在离散余弦变换后的直流和低频部分，下面我会用matlab来演示整个过程。

1.一维DCT变换

我们首先来看看一维的DCT变换，这是二维的基础。一维的DCT变换共有8种，其中最实用的是第二种形式，公式如下：技术分享

其中c(u)是加上去一个系数，为了能使DCT变换矩阵成为正交矩阵，在后面二维变换将看到他的作用。N是f(x)的总数。相比其他几种形式，他的运算还是比较简单的，因此也用的比较广。

2.二维DCT变换

二维DCT变换是在一维的基础上再进行一次DCT变换，这个比较好理解，直接看公式：技术分享

这里我只讨论两个N相等的情况，也就是数据是方阵的形式，在实际应用中对不是方阵的数据都是先补齐再进行变换的。为了matlab仿真方便点，写成矩阵形式：技术分享

下面就用matlab来模拟一下，使用随机生成的4x4矩阵作为输入，程序如下：

clear;
clc;
X=round(rand(4)*100);%随机生成的数据
A=zeros(4);%变换矩阵
for i=0:3
for j=0:3
if i==0
a=sqrt(1/4);
else
a=sqrt(2/4);
end
A(i+1,j+1)=a*cos(pi*(j+0.5)*i/4);
end
end
Y=A*X*A‘;%DCT变换
YY=dct2(X);%用matlab中的函数进行DCT变换

Y是使用上面的公式进行变换，YY是用matlab自带的dct2函数变换，结果是是：

X =
61 19 50 20
82 26 61 45
89 90 82 43
93 59 53 97
Y =
242.5000 32.1613 22.5000 33.2212
-61.8263 7.9246 -10.7344 30.6881
-16.5000 -14.7549 22.5000 -6.8770
8.8322 16.6881 -35.0610 -6.9246
YY =
242.5000 32.1613 22.5000 33.2212
-61.8263 7.9246 -10.7344 30.6881
-16.5000 -14.7549 22.5000 -6.8770
8.8322 16.6881 -35.0610 -6.9246

可以看出Y和YY的结果是一样的，这也进一步验证了上面的公式是正确的。由于X是我随机生成的，相关性很小，变换后的结果比较乱；如果是信号或图像这样相关性比较大的数据的话，数值会集中在左上角，右下角一般都是零，再使用“之”字型扫描得到数据流会包含很多连续的零，编码后数据量会非常小，这就是DCT变换带来的好处。