1、不能全量同步
由于有时候数据量会非常的大,如果直接通过所有的数据会存在OOM的情况,所以应该使用分页查询,慢慢的去同步数据
2、游标查询
由于数据可能会存在增删改的问题,所以使用limit+offset会出现数据问题,此时应该使用游标查询来同步数据
3、同步性
如果使用定时任务去定时的拉取数据进行同步会出现滞后性,如果说想要实时去进行数据同步的话,我们可以使用CDC+消息队列来进行数据同步功能,CDC(Change Data Capture)是一种用于跟踪数据库库变更事件(插入、更新、删除)中的行级更改,并将事件以发生的顺序通知到其他系统处理。
4、消息重复消费问题
可以给每一条消息打上标号,可以防止数据被重复的消费,做到消息的幂等性
5、消息的乱序问题
可以将不同的消息按题目的功能性做一个分区的处理,保证同一个信息能被顺序消费
6、消息堆积的问题
可以通过搭建集群和动态的扩容增加对消息的处理能力