首页 > 代码库 > Spring Batch学习笔记三:JobRepository

Spring Batch学习笔记三:JobRepository

此系列博客皆为学习Spring Batch时的一些笔记;

Spring Batch Job在运行时有很多元数据,这些元数据一般会被保存在内存或者数据库中,由于Spring Batch在默认配置是使用HSQLDB,也就是说在Job的运行过程中,所有的元数据都被储存在内存中,在Job结束后会随着进程的结束自动消失;在这里我们推荐配置JobRepository去使用MySQL。

在这种情况下,Spring Batch在单次执行或者从一个执行到另外一个执行的时候会使用数据库去维护状态,Job执行的信息包括Job实例、传入的参数、执行的结果、每一个Step执行的结果都会被存储在数据库中;数据库使用了6个表来存储相关信息:

BATCH_JOB_INSTANCE

我们都知道,在Job运行时,一个Job实例被创建;Job实例包含了Job实例它本身和Job参数;所有Job实例本身的信息将会被保存在BATCH_JOB_INSTANCE表中:

 字段描述 
 JOB_INSTANCE_ID 表的主键
 VERSION 记录的版本
 JOB_NAME 被执行JOB名
 JOB_KEY Job名和Job参数的Hash值,被使用来唯一标示一个Job实例

BATCH_JOB_PARAMS

这个表包含了所有被传递到Job的参数,正如上面提到的,参数被Spring Batch使用来作为Job标示的一部分。这个表包含的字段如下:

 字段 描述
 JOB_INSTANCE_ID 表示BATCH_JOB_INSTANCE的外键
 TYPE_CD 表示被存储的值的类型(string, date, long, double)
 KEY_NAME Job参数的键(Job参数作为键值对被传递)
 STRING_VAL 当这个参数是string类型时的值
 DATE_VAL 日期型参数值
 LONG_VAL 长整型参数值
 DOUBLE_VAL 双精度或者单精度型参数值

BATCH_JOB_EXECUTION和BATCH_STEP_EXECUTION

当一个Job被创建并执行时,这个Job的运行状态被保存在BATCH_JOB_EXECUTION表中,其中包括:开始时间、结束时间、最近一次执行的结果;

BATCH_STEP_EXECUTION表和BATCH_JOB_EXECUTION差不多,它包含了每一个Step在执行过程中的开始时间、结束时间、commit的次数、Step状态相关的参数;

BATCH_JOB_EXECUTION表的字段信息:

 字段 描述
 JOB_EXECUTION_ID 表的主键
 VERSION 记录的版本
 JOB_INSTANCE_ID 到BATCH_JOB_INSTANCE表的外键
 CREATE_TIME Job实例被创建的时间
 START_TIME Job开始执行的时间
 END_TIME Job执行结束的时间,不管成功与否
 STATUS Job被执行的状态
 EXIT_CODE Job返回时的退出码
 EXIT_MESSAGE Job返回时的推出消息
 LAST_UPDATED 当前记录上一次被更新的时间

 BATCH_STEP_EXECUTION表的字段信息:

 STEP_EXECUTION_ID 表的主键
 VERSION 记录的版本
 STEP_NAME 被配置在Job xml中的Step的名字
 JOB_EXECUTION_ID 连接到BATCH_JOB_EXECUTION表的外键
 START_TIME Step开始的时间
 END_TIME Step完成的时间,无论成功与否
 STATUS Step当前的状态
 COMMIT_COUNT 当前Step被Commit的次数
 READ_COUNT 当前Step读取数据库的次数
 FILTER_COUNT 当前Step读取到的item数量
 WRITE_COUNT 当前Step写的Item数量
 READ_SKIP_COUNT 读取Item时跳过的数量
 WRITE_SKIP_COUNT 写Item时跳过的数量
 PROCESS_SKIP_COUNT 在ItemReader读取后,没有经过ItemProcessor处理的item的数量
 ROLLBACK_COUNT 在Step执行过程中,总的Rollback的数量
 EXIT_CODE Step完成时返回的退出码
 EXIT_MESSAGE Step完成时返回的退出消息
 LAST_UPDATED 这条记录上次被更新的时间

BATCH_JOB_EXECUTION_CONTEXT和BATCH_STEP_EXECUTION_CONTEXT

这是两个Context相关的表,它们分别用于存储Job或者Step相关的ExecutionContext的持久化版本,Spring Batch中的ExecutionContext类似于WEB应用程序中的Servlet Context或Session,它们都提供了一个存储信息的全局空间,本质上是作用域在Job或者Step中的一个键值对;这个Job或者Step的ExecutionContext被用来在特定的作用域里面传递信息,如果是Job,它就用来在Step与Step之间传递信息,如果是Step,它用来在多个记录的处理过程中传递信息。

表BATCH_JOB_EXECUTION_CONTEXT和BATCH_STEP_EXECUTION_CONTEXT是这些键值对的序列化版本,它们除了一个外键不同之外,其它几乎都相同; 

 字段 描述
 JOB_EXECUTION_ID/STEP_EXECUTION_ID 引用自表BATCH_JOB_EXECUTION或BATCH_STEP_EXECUTION的外键
 SHORT_CONTEXT Context的字符串表示
 SERIALIZED_CONTEXT 一个被序列化的ExecutionContext,以便在将来重试的时候使用