综合前面的几个例子,我们这里来是实现下增量数据的同步。
这里只是分享一种方法,实际工作中,还会有其他更好的方案。
增量同步的整体思路一般就是:首先拿到这张表的增量数据,怎么拿增量呢,源表需要有一个时间字段,代表该条记录的最新更新时间(及只要该条记录变化,该时间字段就会更新),当然有时间字段最好了,没有的话,可能需要做全表对比之类的操作;正常情况下,业务系统的表中都是有主键的,我们拿到增量数据之后,需要判断该记录的新插入的,还是更新的记录,如果是更新记录,我们需要先将数据加载到中间表,然后,根据主键将目标表中已存在的数据删除,最后再将本次的增量数据插入到目标表。
1.配置表的设计(元数据表)
首先我们需要一张配置表,来保存我们要增量同步的表的基本信息
我们初始化一条记录,我们就以这张ods_tm_book表
一些基础表准备