亿级数据库迁移、分库分表、实践

什么时候需要进行数据库迁移

1、业务数据增长,原数据库不足以支持业务需求
2、底层存储架构遇见瓶颈,需升级改造
3、老系统升级过度新系统

迁移过程中会面临哪些挑战或问题

1、数据库表完全异构、旧库和新库表结构完全不同
2、业务方,需要能进行数据灵活迁移,按照租户商家迁移,按照数据百分比迁移
3、数据量巨大,上百万商家数据,几百亿条数据,几TB数据
4、线上业务,迁移时间窗口固定,晚上几点到几点,只能有几个小时时间

如何提升迁移效率

1、大任务拆分成小任务
按照不同租户或商家,假设没500个一批次,分成多批次
2、多线程处理
增加并发线程方式处理,效率提升,但是面对巨大的数据量,单机很快也会面临 瓶颈
3、分布式处理
增加机器节点,任务进行水平扩展,把大任务拆分为独立的子任务,所有子任务执行结果等价于各个子任务结果,手动根据不同租户或商家平摊到不同机器节点上执行

迁移数据过程中遇见问题

线程池参数配置错误
在测试阶段,并发上不去,线程配置如下:核心线程池配置了16个,最大线程配置了750,然后配置了5000的缓冲队列,主要是当提交任务大于核心线程数时,后续任务会首先提交到缓冲队列。缓冲队列满后才会创建线程数据

 ThreadPoolExecutor executor = new ThreadPoolExecutor(16,  // corePoolSize750, // maximumPoolSize1, // keepAliveTimeTimeUnit.SECONDS, // unitnew ArrayBlockingQueue<5000>(), // workQueueExecutors.defaultThreadFactory(), // threadFactorynew ThreadPoolExecutor.AbortPolicy() // handler`在这里插入代码片`

数据库压力大
并发上去后,后端数据库压力增大,CPU使用率居高不下。当CPU使用率急速上升,后发现是执行任务未命中素颜9in,导致全表扫描CPU资源被大量占用,慢SQL问题通过优化创建索引解决,通过时间换时间

待优化改进点

手动分配任务
分布式和并行化的方式都是自己手写代码实现,其实可以用ScheduleX和MapReduce实现,框架已经实现任务分发,并行处理,充实,reduce等功能
数据一致性校验
打标记,抽样检查的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/769879.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

日常工作中时间管理的方法学习总结

时间管理的意义 时间管理是一种非常重要的个人职业技能&#xff0c;它可以帮助人们更有效地使用时间&#xff0c;达成目标。 通常可以基于这四个过程进行管理&#xff0c;分别是确定目标、制定计划、落实执行、回顾结果。 确定目标 要管理好目标&#xff0c;通过SMART原则有…

GCC指令生成 Map映射文件

示例&#xff1a; gcc -g -Wl,-Mapoutput.map -o myprogram myprogram.c在这个例子中&#xff0c; -g 表示生成调试信息-Wl,-Mapoutput.map 告诉链接器生成一个名为 output.map 的映射文件-o myprogram 指定最终的可执行文件名称为 myprogram&#xff0c;最后的 myprogram.c …

【HDFS】DatanodeAdminBackoffMonitor退役节点极慢的问题定位

一、现象: 下节点特别慢。10台节点,每台大约需要退役60w个块。但是3个小时才退役了3000多个块。 NN侧如下日志,可以看到30秒只退役了512-494 = 20个块,这要是退役600w个块,得猴年马月? 2024-03-19 14:44:42,952 INFO org.apache.hadoop.hdfs.server.blockmanagement.D…

浅析扩散模型与图像生成【应用篇】(十一)——DDIBs

11. Dual Diffusion Implicit Bridges for Image-to-Image Translation 该文提出一种双扩散隐式桥&#xff08;Dual Diffusion Implicit Bridges&#xff0c; DDIBs&#xff09;方法用于图像转换&#xff0c;其最大的特点在于处理源域图像的模型和处理目标域图像的模型是彼此分…

android支持包com.android.support:support-v4 依赖树,便于分析类冲突问题

执行如下依赖分析指令可以打印依赖树 sh gradlew -q app:dependenciescom.android.support:support-v4:28.0.0 是一个非常庞大的支持库&#xff0c;依赖的东一比较多下面看看详情&#xff1a;standard_testReleaseUnitTestRuntimeClasspath - Resolved configuration for runti…

Modbus TCP协议介绍(ModbusTCP)

文章目录 理解Modbus TCP协议&#xff08;Understanding Modbus TCP Protocol&#xff09;简介&#xff08;Introduction to Modbus TCP&#xff09;历史背景&#xff08;Historical Context&#xff09;关键特性&#xff08;Key Features&#xff09; Modbus TCP协议结构&…

华为防火墙二层墙(VAN/SVI/单臂路由)

二层墙只能做地址池形式的NAT。 交换机安全策略防火墙二层墙 路由器安全策略防火墙三层墙 交换机的光口是不能直接插线的&#xff0c;光模块&#xff0c;包括进和出 长距离&#xff1a;单模 短距离&#xff1a;多模 防火墙自身的ping流量需要单独配置

深度学习中不同的优化器汇总(SGD、动量、Adagrad、RMSProp、Adam)(理论、公式、代码)

本文针深度学习中不同的优化器进行了汇总&#xff0c;包括公式实现、代码示例、演变过程和优缺点做了较为详细的分析。 随机梯度下降&#xff08;SGD&#xff09; 随机梯度下降&#xff08;SGD&#xff09;是一种简单但极其有效的优化算法&#xff0c;经常用于训练各种类型的…

卷积和池化

卷积&#xff1a; 就是有一个卷积核&#xff0c;还有一个x*x的图片&#xff0c;卷积核大小是y*y的话&#xff0c;对图像做卷积就是将图片中和卷积核大小一样的部分进行运算&#xff0c;也就是相乘求和&#xff0c;有点类似算法中的滑动窗口&#xff0c;只不过这里是二维滑动窗…

一篇复现Docker镜像操作与容器操作

华子目录 Docker镜像操作创建镜像方式1docker commit示例 方式2docker import示例1&#xff1a;从本地文件系统导入示例2&#xff1a;从远程URL导入注意事项 方式3docker build示例1&#xff1a;构建镜像并指定名称和标签示例2&#xff1a;使用自定义的 Dockerfile 路径构建镜像…

Unity连接MySQL踩坑,问题处理记录

用的unity2021版本&#xff0c;MySQL是官方下载的最新版8.0.36. 安装MySQL时&#xff0c;过去如果安装过&#xff0c;一定要删干净&#xff0c;单纯的卸载不行&#xff0c;网上有很多教程。 MySQL安装完成后&#xff0c;将安装目录的MySql.Data.dll文件放入unity项目的Plugin…

数据运营常用的8大模型

✅作者简介&#xff1a;《数据运营&#xff1a;数据分析模型撬动新零售实战》作者、《数据实践之美》作者、数据科技公司创始人、多次参加国家级大数据行业标准研讨及制定、高端企培合作讲师。 &#x1f338;公众号&#xff1a;风姑娘的数字视角&#xff0c;免费分享数据应用相…

202447读书笔记|《围炉夜话》——多记先正格言,胸中方有主宰 闲看他人行事,眼前即是规箴

202447读书笔记|《围炉夜话》——多记先正格言&#xff0c;胸中方有主宰&#xff1b;闲看他人行事&#xff0c;眼前即是规箴 围炉夜话 《围炉夜话&#xff08;读客三个圈经典文库&#xff09;》作者王永彬。读《围炉夜话》&#xff0c;可以掌握君子安身立业的大智慧&#xff01…

基于大模型的复杂决策支持系统设计与实施策略

基于大模型的复杂决策支持系统设计与实施策略 1. 背景介绍 随着大数据、云计算和人工智能技术的飞速发展&#xff0c;决策支持系统&#xff08;Decision Support System, DSS&#xff09;在各个领域得到了广泛应用。传统的决策支持系统主要依赖于统计分析和专家系统&#xff…

【Canvas与艺术】暗蓝网格汽车速度仪表盘

【关键点】 采用线性渐变色&#xff0c;使上深下浅的圆有凹下效果&#xff0c;使上浅下深的圆有凸起效果&#xff0c;两者结合就有立体圆钮的感觉。 【图例】 【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type&quo…

Java全栈课程之Linux———目录相关命令

一、绝对路径和相对路径 我们知道Linux的目录结构为树状结构&#xff0c;最顶级的目录为根目录 /。 其他目录通过挂载可以将它们添加到树中&#xff0c;通过解除挂载可以移除它们。 在开始本教程前我们需要先知道什么是绝对路径与相对路径。 绝对路径&#xff1a; 路径的写…

2015年认证杯SPSSPRO杯数学建模C题(第二阶段)荒漠区动植物关系的研究全过程文档及程序

2015年认证杯SPSSPRO杯数学建模 C题 荒漠区动植物关系的研究 原题再现&#xff1a; 环境与发展是当今世界所普遍关注的重大问题, 随着全球与区域经济的迅猛发展, 人类也正以前所未有的规模和强度影响着环境、改变着环境, 使全球的生命支持系统受到了严重创伤, 出现了全球变暖…

R语言基础入门

1.保存或加载工作空间 改变工作目录——进行文件读写&#xff0c;默认去指定文件进行操作。&#xff08;使用R时&#xff0c;最好先设定工作目录&#xff08;setwd(),getwd()&#xff09;&#xff09; setwd(“工作文件路径”)&#xff1a;建立工作目录 getwd&#xff08;&…

【STM32嵌入式系统设计与开发】——9Timer(定时器中断实验)

这里写目录标题 一、任务描述二、任务实施1、ActiveBeep工程文件夹创建2、函数编辑&#xff08;1&#xff09;主函数编辑&#xff08;2&#xff09;USART1初始化函数(usart1_init())&#xff08;3&#xff09;USART数据发送函数&#xff08; USART1_Send_Data&#xff08;&…

【论文阅读】Probabilistic Imputation for Time-series Classification with Missing Data

Probabilistic Imputation for Time-series Classification with Missing Data 论文链接&#xff1a;https://icml.cc/virtual/2023/poster/23522 作者&#xff1a;SeungHyun Kim Hyunsu Kim EungGu Yun Hwangrae Lee Jaehun Lee Juho Lee 机构&#xff1a;韩国科学技术…