1、背景:
在我们使用FlinkCDC采集mysql数据的时候,日期类型是我们很常见的类型,但是FlinkCDC读取出来会和数据库的日期时间不一致,情况如下
FlinkCDC获取的数据中create_time字段1694597238000转换为时间戳2023-09-13 17:27:18
而数据库中原始数据如下,并没有到下午5点,这就导致了FlinkCDC读出来的时间和数据库中实际的时间不一致的情况,与数据库对比可以发现,这里的时间戳与数据库时间刚好相差了 8 个小时,在实际生产中这种情况是不行的
2、 产生这种情况的原因是什么呢?
FlinkCDC底层为Debezium,而Debezium默认将MySQL中datetime类型转成UTC的时间戳,底层的 Debezium 并没有实现 serverTimeZone 的配置,时区是写死的无法更改,导致数据库中设置的UTC+8到了FlinkCDC读取出来相差了8个小时
3、如何解决呢
我们可以通过在自定义反序列化器中实现时区的修复,需要提前准备一个mysql,本案例版本为Mysql5.7,并且开启binlog,如何开启binlog过程如下面的博客