首页 > 代码库 > (转)x264重要结构体详细说明(1): x264_param_t

(转)x264重要结构体详细说明(1): x264_param_t

结构体x264_param_t是x264中最重要的结构体之一,主要用于初始化编码器。以下给出了几乎每一个参数的含义,对这些参数的注释有的是参考了网上的资料,有的是自己的理解,还有的是对源代码的翻译,由于本人水平有限,错误难免,请高手指正。

 

/* 结构体x264_param_t定义在x264.h中 */

typedef struct x264_param_t

{

    /* CPU 标志位 */

unsigned int cpu;

int  i_threads;                 // 并行编码多帧; 线程数,为0则自动多线程编码

int  b_sliced_threads;          // 如果为false,则一个slice只编码成一个NALU;

                                // 否则有几个线程,在编码成几个NALU。缺省为true

 

int  b_deterministic; // 是否允许非确定性时线程优化

int  b_cpu_independent; // 强制采用典型行为,而不是采用独立于cpu的优化算法

int  i_sync_lookahead; // 线程超前缓存帧数

 

 

/* 视频属性 */

int  i_width; // 视频图像的宽

int  i_height; // 视频图像的高

int  i_csp;          // 编码比特流的CSP,仅支持i420,色彩空间设置

int  i_level_idc; // 指明作用的level值,可能与编码复杂度有关

int  i_frame_total;  // 编码帧的总数默认 0

 

 

/* hrd : hypothetical reference decoder (假定参考解码器) , 检验编码器产生的符合

  该标准的NAL单元流或字节流的偏差值。蓝光视频、电视广播及其它特殊领域有此要求 */

int  i_nal_hrd;

 

 

/* vui参数集 : 视频可用性信息、视频标准化选项 */

struct

{

    /* 宽高比的两个值相对互素,且在(0,  65535] 之间 */

    int  i_sar_height; // 样本宽高比的高度

int  i_sar_width;     // 样本宽高比的宽度

 

 

/* 0=undef, 1=no overscan, 2=overscan 过扫描线,

    默认"undef"(不设置),可选项:show(观看) / crop(去除) */

 

int  i_overscan;

 

 

/* 以下的值可以参见H264附录E */

int  i_vidformat;     // 视频在编码/数字化之前是什么类型,默认"undef".

                            // 取值有:Component, PAL, NTSC, SECAM, MAC 

 

int  b_fullrange;           // 样本亮度和色度的计算方式,默认"off",可选项:off/on

int  i_colorprim;           // 原始色度格式,默认"undef"

int  i_transfer;            // 转换方式,默认"undef"

int  i_colmatrix;           // 设置从RGB计算得到亮度和色度所用的矩阵系数,默认"undef"

int  i_chroma_loc;          // 设置色度采样位置,范围0~5,默认0

} vui;

 

 

/* 比特流参数 */

int  i_frame_reference;         // 最大参考帧数目

int  i_dpb_size;                // Decoded picture buffer size

int  i_keyint_max;              // 设定IDR帧之间的最间隔,在此间隔设置IDR关键帧

int  i_keyint_min;              // 设定IDR帧之间的最小间隔, 场景切换小于此值编码位I帧, 而不是 IDR帧.

int  i_scenecut_threshold;      // 场景切换阈值,插入I

int  b_intra_refresh;           // 是否使用周期帧内刷新替代IDR

 

int  i_bframe;                  // 两个参考帧之间的B帧数目

int  i_bframe_adaptive;         // 自适应B帧判定可选取值:X264_B_ADAPT_FAST等

int  i_bframe_bias;             // 控制B帧替代P帧的概率,范围-100 ~ +100

  // 该值越高越容易插入B帧,默认0.

int  i_bframe_pyramid;          // 允许部分B帧为参考帧,

  // 可选取值:0=off,  1=strict hierarchical,  2=normal

int  b_open_gop;                // Close GOP是指帧间的预测都是在GOP中进行的。

  // 使用Open GOP,后一个GOP会参考前一个GOP的信息。

int  b_bluray_compat;           // 支持蓝光碟

 

 

/* 去块滤波器需要的参数, alphabeta是去块滤波器参数 */

int  b_deblocking_filter;        // 去块滤波开关

int  i_deblocking_filter_alphac0;// [-6, 6] -6 light filter, 6 strong

int  i_deblocking_filter_beta;   // [-6, 6] 同上

 

int  b_cabac;                    // 自适应算术编码cabac开关

int  i_cabac_init_idc;           // 给出算术编码初始化时表格的选择

 

int  b_interlaced;               // 隔行扫描

int  b_constrained_intra;

 

 

 /* 量化 */

int  i_cqm_preset;              // 自定义量化矩阵(CQM), 初始化量化模式为flat

char *psz_cqm_file;             // 读取JM格式的外部量化矩阵文件,忽略其他cqm选项

uint8_t  cqm_4iy[16];           // used only if i_cqm_preset == X264_CQM_CUSTOM   

uint8_t  cqm_4py[16];

uint8_t  cqm_4ic[16];

uint8_t  cqm_4pc[16];

uint8_t  cqm_8iy[64];

uint8_t  cqm_8py[64];

uint8_t  cqm_8ic[64];

uint8_t  cqm_8pc[64];

 

 

/* 日志 */

void  (*pf_log)( void *, int i_level, const char *psz, va_list );     // 日志函数

void  *p_log_private;

int    i_log_level;             // 日志级别,不需要打印编码信息时直接注释掉即可

int    b_visualize;             // 是否显示日志

char   *psz_dump_yuv;           //  重建帧的文件名

 

 

/* 编码分析参数 */

struct

{

unsigned int intra;             //  帧内分区

    unsigned int inter;             //  帧间分区

 

int  b_transform_8x8;           // 

int  i_weighted_pred;           // P帧权重

int  b_weighted_bipred;         // B帧隐式加权

int  i_direct_mv_pred;          // 时间空间运动向量预测模式

int  i_chroma_qp_offset;        // 色度量化步长偏移量

 

int  i_me_method;               // 运动估计算法 (X264_ME_*)

int  i_me_range;                // 整像素运动估计搜索范围 (from predicted mv) 

int  i_mv_range;                // 运动矢量最大长度. -1 = auto, based on level

int  i_mv_range_thread;         // 线程之间的最小运动向量缓冲.  -1 = auto, based on number of threads.

int  i_subpel_refine;           // 亚像素运动估计质量

int  b_chroma_me;               // 亚像素色度运动估计和P帧的模式选择

int  b_mixed_references;        // 允许每个宏块的分区有它自己的参考号

int  i_trellis;                 // Trellis量化提高效率,对每个8x8的块寻找合适的量化值,需要CABAC

  // 0 :即关闭  1:只在最后编码时使用  2:在所有模式决策上启用

int  b_fast_pskip;              // 快速P帧跳过检测

int  b_dct_decimate;            // P帧变换系数阈值

int  i_noise_reduction;         // 自适应伪盲区

int  b_psy;                     // Psy优化开关,可能会增强细节

float  f_psy_rd;                // Psy RD强度

float  f_psy_trellis;           // Psy Trellis强度

 

int  i_luma_deadzone[2];        // 亮度量化中使用的盲区大小,{ 帧间帧内 }

int  b_psnr;                    // 计算和打印PSNR信息

int  b_ssim;                    // 计算和打印SSIM信息

} analyse;

 

 

/* 码率控制参数 */

struct

{

int  i_rc_method;               // 码率控制方式 : X264_RC_CQP恒定质量,  

  // X264_RC_CRF恒定码率,  X264_RC_ABR平均码率

int  i_qp_constant;             // 指定P帧的量化值,0 - 510表示无损

int  i_qp_min;                  // 允许的最小量化值,默认10

int  i_qp_max;                  // 允许的最大量化值,默认51

int  i_qp_step;                 // 量化步长,即相邻两帧之间量化值之差的最大值

 

int   i_bitrate;                // 平均码率大小

float  f_rf_constant;           // 1pass VBR, nominal QP. 实际质量,值越大图像越花,越小越清晰

float  f_rf_constant_max;       // 最大码率因子,该选项仅在使用CRF并开启VBV时有效,

  // 图像质量的最大值,可能会导致VBV下溢。

float  f_rate_tolerance;        // 允许的误差

int    i_vbv_max_bitrate;       // 平均码率模式下,最大瞬时码率,默认0

int    i_vbv_buffer_size;       // 码率控制缓冲区的大小,单位kbit,默认0

float  f_vbv_buffer_init;       // 设置码率控制缓冲区(VBV缓冲达到多满(百分比)才开始回放,

  // 范围0~1.0,默认0.9

float  f_ip_factor;             // I帧和P帧之间的量化因子(QP)比值,默认1.4

 

float  f_pb_factor;             // P帧和B帧之间的量化因子(QP)比值,默认1.3

 

int   i_aq_mode;                // 自适应量化(AQ)模式。 0:关闭AQ  

  // 1允许AQ在整个视频中和帧内重新分配码

                                // 2自方差AQ(实验阶段),尝试逐帧调整强度

 

float  f_aq_strength;           // AQ强度,减少平趟和纹理区域的块效应和模糊度

 

 

/* MBTree File是一个临时文件,记录了每个P帧中每个MB被参考的情况。

  目前mbtree只处理P帧的MB,同时也不支持b_pyramid. */

int   b_mb_tree;                // 是否开启基于macroblockqp控制方法

int   i_lookahead;              // 决定mbtree向前预测的帧数

 

 

/* 2pass */

int   b_stat_write;             // 是否将统计数据写入到文件psz_stat_out中

char  *psz_stat_out;            // 输出文件用于保存第一次编码统计数据

int   b_stat_read;              // 是否从文件psz_stat_in中读入统计数据

char  *psz_stat_in;             // 输入文件存有第一次编码的统计数据

 

 

/* 2pass params (same as ffmpeg ones) */

float  f_qcompress;             // 量化曲线(quantizer curve)压缩因子。

  // 0.0 => 恒定比特率,1.0 => 恒定量化值。

float  f_qblur;                 // 时间上模糊量化,减少QP的波动(after curve compression)

float  f_complexity_blur;       // 时间上模糊复杂性,减少QP的波动(before curve compression)

 

x264_zone_t *zones;             // 码率控制覆盖

int    i_zones;                 // number of zone_t‘s

char  *psz_zones;               // 指定区的另一种方法

} rc;

 

 

/* 裁剪矩形窗口参数:隐式添加到分辨率非16倍数的视频中 */

/* 在码流层指定一个切除(crop)矩形。若不想x264在编码时做crop

   但希望解码器在回放时进行切除,可使用此项。单位为像素。 */

struct

{

unsigned int i_left;

    unsigned int i_top;

    unsigned int i_right;

    unsigned int i_bottom;

} crop_rect;

 

 

/* 编码3D视频时,此参数在码流中插入一个标志,告知解码器此3D视频是如何封装

  的。3D视频帧封装格式:帧封装、场交错、线交错、左右全景、左右半景、上下半

  景、L+深度、L+深度+图形+图形深度 */

int  i_frame_packing;

 

 

/* Muxing复用参数 */

int  b_aud;                     // 生成访问单元分隔符

int  b_repeat_headers;          // 是否复制spspps放在每个关键帧的前面

int  b_annexb;                  // 值为true,则NALU之前是4字节前缀码0x00000001;

  // 值为false,NALU之前的4个字节为NALU长度

int  i_sps_id;                  // spsppsid

int  b_vfr_input;               // VFR输入。:时间基和时间戳用于码率控制  :仅帧率用于码率控制

uint32_t  i_fps_num;            // 帧率的分子

uint32_t  i_fps_den;            // 帧率的分母

uint32_t  i_timebase_num;       // 时间基的分子

uint32_t  i_timebase_den;       // 时间基的分母

 

 

/* 以某个预设模式将输入流(隔行,恒定帧率)标记为软交错(soft telecine)默认none. 可用预设有:

  none, 22, 32, 64, double, triple, euro.  使用除none以外任一预设,都会连带开启--pic-struct */

int  b_pulldown;

int  b_pic_struct;  // 强制在Picture Timing SEI传送pic_struct默认是未开启

 

 

/* 将视频流标记为交错(隔行),哪怕并非为交错式编码。可用于编码蓝光兼容的25p30p视频。默认是未开启 */

int b_fake_interlaced;

 

/* 条带参数 */

 

int  i_slice_max_size;          // 每个slice最大字节数,包括预计的NAL开销

int  i_slice_max_mbs;           // 每个slice的最大宏块数,重写i_slice_count

int  i_slice_count;             // 每帧slice的数目,每个slice必须是矩形

 

} x264_param_t;


 
另外附上对x264参数有详细说明的网页:
http://mewiki.project357.com/wiki/X264_Settings       (英文版)
http://x264-settings.wikispaces.com/x264+settings     (中文版)
 
转自:http://nkwavelet.blog.163.com/blog/static/2277560382013102010375030/

(转)x264重要结构体详细说明(1): x264_param_t