Oracle GoldenGate 全面解析

Oracle GoldenGate 全面解析

Oracle GoldenGate 是一种实时数据集成和复制解决方案,广泛应用于数据同步、数据库迁移、高可用性和灾难恢复等场景。以下将详细解答您提出的关于 Oracle GoldenGate 的一系列问题。


1. Oracle GoldenGate 的架构组成及其核心组件的作用

架构组成

Oracle GoldenGate 采用分布式架构,主要包括以下核心组件:

  1. Extract(提取进程)
  2. Pump(中继进程,可选)
  3. Trail File(轨迹文件)
  4. Data Pump(数据泵,可选)
  5. Replicat(复制进程)
  6. Manager(管理进程)

核心组件作用

a. Extract(提取进程)
  • 作用:从源数据库的日志文件(如 Oracle 的 redo logs)中提取数据变更(INSERT、UPDATE、DELETE 等),并将其写入轨迹文件。
  • 特点
    • 支持直连(Direct Connect)和基于日志的提取。
    • 可以配置为支持多线程提取,提高性能。
b. Pump(中继进程)
  • 作用:将 Extract 进程生成的轨迹文件传输到目标系统或其他中继点,支持跨网络的数据传输。
  • 特点
    • 可选组件,用于实现分布式架构。
    • 提高数据传输的可靠性和灵活性。
c. Trail File(轨迹文件)
  • 作用:存储从源数据库提取的变更数据,是 Extract 和 Replicat 之间的数据传输媒介。
  • 特点
    • 分为源端轨迹(Source Trail)和目标端轨迹(Target Trail)。
    • 支持本地磁盘和网络共享存储。
d. Replicat(复制进程)
  • 作用:从轨迹文件中读取变更数据,并将其应用到目标数据库,实现数据同步。
  • 特点
    • 支持多线程复制,提升应用性能。
    • 提供灵活的错误处理和恢复机制。
e. Manager(管理进程)
  • 作用:负责启动、停止和监控 GoldenGate 的其他进程(如 Extract 和 Replicat)。
  • 特点
    • 管理资源分配和进程间通信。
    • 提供命令行接口用于进程管理。
f. Data Pump(数据泵,可选)
  • 作用:作为 Extract 和 Pump 的中间层,增强数据传输的能力,支持复杂网络拓扑。
  • 特点
    • 提供数据的压缩、加密等功能。
    • 提高数据传输的效率和安全性。

2. 配置 GoldenGate 实现 Oracle 到 Oracle 的实时数据同步的关键配置步骤

实现 Oracle 到 Oracle 的实时数据同步主要包括以下步骤:

前提条件

  • 源数据库和目标数据库

    • 确保两端数据库版本兼容,已启动 ARCHIVELOG 模式(对于 Oracle)。
    • 配置必要的权限和网络连通性。
  • GoldenGate 安装

    • 在源和目标服务器上安装相同版本的 GoldenGate 软件。
    • 配置环境变量和路径,确保 GoldenGate 可执行文件可访问。

配置步骤

a. 配置源数据库
  1. 创建 GoldenGate 用户和赋权

    CREATE USER ggadmin IDENTIFIED BY password;
    GRANT DBA TO ggadmin;
    GRANT SELECT ANY TABLE TO ggadmin;
    GRANT SELECT ANY TRANSACTION TO ggadmin;
    
  2. 配置 Supplemental Logging

    ALTER DATABASE ADD SUPPLEMENTAL LOG DATA;
    ALTER TABLE your_table ADD SUPPLEMENTAL LOG DATA (ALL) COLUMNS;
    
b. 配置 GoldenGate 管理进程
  1. 启动 Manager 进程
    • 编辑 GLOBALS 文件,设置数据库连接参数(可选)。
    GGSCI> EDIT PARAMS MGR
    
    • 内容示例:
    PORT 7809
    
    • 启动 Manager:
    GGSCI> START MANAGER
    
c. 配置 Extract 进程
  1. 创建 Extract 参数文件

    GGSCI> ADD EXTRACT extract_name, TRANLOG, BEGIN NOW
    
  2. 编辑 Extract 参数文件

    GGSCI> EDIT PARAMS extract_name
    
    • 内容示例:
    EXTRACT extract_name
    USERID ggadmin, PASSWORD password
    EXTTRAIL ./dirdat/et, EXTRACTTRANSLOG
    TABLE schema.your_table;
    
  3. 启动 Extract 进程

    GGSCI> START EXTRACT extract_name
    
d. 配置 Trail 文件(源端)
  1. 配置 Trail 处理
    • 上一步中 EXTTRAIL 参数已指定轨迹文件存储路径。
e. 传输 Trail 文件(数据泵或泵进程,可选)
  1. 添加 Pump 进程(如有跨网络需求):

    GGSCI> ADD EXTRACT pump_name, EXTTRAILSOURCE ./dirdat/et
    
  2. 编辑 Pump 参数文件

    GGSCI> EDIT PARAMS pump_name
    
    • 内容示例:
    EXTRACT pump_name
    PASSTHRU
    RMTHOST target_host, MGRPORT 7809
    RMTTRAIL ./dirdat/rt
    
  3. 启动 Pump 进程

    GGSCI> START EXTRACT pump_name
    
f. 配置 Replicat 进程(目标端)
  1. 创建 Replicat 参数文件

    GGSCI> ADD REPLICAT rep_name, EXTTRAIL ./dirdat/rt
    
  2. 编辑 Replicat 参数文件

    GGSCI> EDIT PARAMS rep_name
    
    • 内容示例:
    REPLICAT rep_name
    USERID ggadmin, PASSWORD password
    ASSUMETARGETDEFS
    MAP schema.your_table, TARGET schema.your_table;
    
  3. 启动 Replicat 进程

    GGSCI> START REPLICAT rep_name
    
g. 验证同步
  • 查看进程状态

    GGSCI> INFO EXTRACT *
    GGSCI> INFO REPLICAT *
    
  • 检查同步数据:在目标数据库验证数据是否已同步。


3. GoldenGate 的检查点(Checkpoint)机制及其对数据复制可靠性的保障

检查点(Checkpoint)机制

GoldenGate 的检查点是用来记录进程在轨迹文件中的当前位置和状态的信息。它确保在进程重启或故障恢复时能够从上一次的检查点位置继续处理,避免数据丢失或重复。

检查点的作用

  1. 数据一致性:确保 Replicat 在应用数据时不会遗漏任何变更,维护源和目标数据库的一致性。
  2. 故障恢复:在系统崩溃或进程停止后,GoldenGate 可以基于检查点信息快速恢复进程,不需重新传输全部数据。
  3. 性能优化:通过定期记录检查点,减少重启时的恢复时间,提高整体性能。

检查点的工作原理

  • Extract 进程:记录已成功提取并写入轨迹文件的位置。
  • Replicat 进程:记录已成功应用到目标数据库的位置。
  • 检查点文件:通常存储在 dirchk 目录下,以 .chk 为后缀,包含进程的检查点信息。

保障数据复制可靠性

  1. 持久化记录:检查点信息定期写入磁盘,确保在意外故障后可以恢复。
  2. 同步机制:Replicat 在应用每一批变更数据后更新检查点,确保每次数据应用都有对应的记录。
  3. 事务边界管理:检查点机制与事务日志结合,确保完整事务在目标端完整应用。

4. 处理 GoldenGate 同步过程中出现的数据冲突(如主键冲突)的解决方案

在数据同步过程中,可能会遇到数据冲突,例如主键冲突(Primary Key Violation)。以下是处理此类冲突的常见方法:

冲突类型

  1. 主键冲突:目标数据库已存在相同主键的数据。
  2. 唯一约束冲突:某个字段的唯一性被违反。
  3. 引用完整性冲突:外键约束被破坏。

解决方案

a. 预防措施
  1. 确保数据唯一性

    • 在源和目标数据库中严格管理主键。
    • 使用复合主键或其他唯一标识符避免冲突。
  2. 同步顺序管理

    • 确保数据插入、更新、删除的顺序与源数据库一致,防止约束冲突。
b. 冲突检测与处理
  1. Transformed Replicat

    • 使用参数文件中的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/73721.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ModBus TCP/RTU互转(主)(从)|| Modbus主动轮询下发的工业应用 || 基于智能网关的串口服务器进行Modbus数据收发的工业应用

目录 前言 一、ModBus TCP/RTU互转(从)及应用|| 1.1 举栗子 二、ModBus TCP/RTU互转(主) 2.1 举栗子 三、ModBus 主动轮询 3.1 Modbus主动轮询原理 3.2 Modbus格式上传与下发 3.2.1.设置Modbus主动轮询指令 3.2.2 设…

场景题:一个存储IP地址的100G 的文件, 找出现次数最多的 IP ?

和大文件中存id,然后要求排序问题一样的处理思路 使用MapReduce的思想解决,加上哈希分割,先将大文件中的IP地址按照哈希函数进行分割,存到多个文件上,接着每个分片单独处理,用Hashmap统计IP出现频次&#…

【操作系统安全】任务2:用户与用户组

目录 一、用户与用户组介绍 1.1 用户 1.2 用户组 1.3 用户与用户组的关系 二、用户与用户组管理 2.1 用户管理 2.1.1 创建用户 2.1.2 设置用户密码 2.1.3 删除用户 2.2 用户组管理 2.2.1 创建用户组 2.2.2 删除用户组 2.2.3 将用户添加到用户组 三、影子账户创建…

OpenCV计算摄影学(20)非真实感渲染之增强图像的细节函数detailEnhance()

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 此滤波器增强特定图像的细节。 cv::detailEnhance用于增强图像的细节,通过结合空间域和频率域的处理,提升图像中特定细节…

Git 使用指南

Git 是一种分布式版本控制系统,可以追踪文件的变化并协助多人协作开发项目。下面是 Git 的基本概念和使用方式: 仓库(Repository):Git 用来存储项目的地方,可以理解为项目的文件夹,包含项目的所…

java 中散列表(Hash Table)和散列集(Hash Set)是基于哈希算法实现的两种不同的数据结构

在 Java 中,散列表(Hash Table)和散列集(Hash Set)是两种不同的数据结构,但它们都基于哈希表的原理来实现。下面是它们的联系与区别、实现类以及各自的优缺点,并用表格进行对比整理。 联系与区…

vue2自定义指令实现 el-input 输入数字,小数点两位 最高10位,不满足则截取符合规则的值作为新值

步骤 1:创建自定义指令 // 处理输入值,确保符合规则 function processValue(value) {// 过滤非数字和小数点let filtered value.replace(/[^\d.]/g, );const firstDotIndex filtered.indexOf(.);// 处理多个小数点,保留第一个if (firstDot…

10、基于osg引擎生成热力图高度图实现3D热力图可视化、3D热力图实时更新(带过渡效果)

1、结果 2、完整C代码 #include <sstream> #include <iomanip> #include <iostream> #include <vector> #include <random> #include <cmath> #include <functional> #include <osgViewer/viewer> #include <osgDB/Read…

海量数据查询加速:Presto、Trino、Apache Arrow

1. 引言 在大数据分析场景下,查询速度往往是影响业务决策效率的关键因素。随着数据量的增长,传统的行存储数据库难以满足低延迟的查询需求,因此,基于列式存储、向量化计算等技术的查询引擎应运而生。本篇文章将深入探讨 Presto、Trino、Apache Arrow 三种主流的查询优化工…

Pycharm 社区版安装教程

找到安装包双击安装文件---点击下一步 一般路径是&#xff1a;C:\Rambo\Software\Development 选择完成后就是如下地址&#xff1a; C:\Rambo\Software\Development\PyCharm Community Edition 2024.3.3 点击上述3个位置就可以了----下一步 等待安装就可以了---完成后点击完成…

vue3 elementUi table自由渲染组件

文章目录 前言CustomTable如何使用tableColumn 属性h函数创建原生元素创建组件动态生成 前言 elementui中的table组件&#xff0c;表格中想要自由地渲染内容&#xff0c;是一种比较麻烦的事情&#xff0c;比如你表格中想要某一列插入一个button按钮&#xff0c;是不是要用插槽…

Mermaid 子图 + 拖拽缩放:让流程图支持无限细节展示

在技术文档、项目管理和可视化分析中&#xff0c;流程图是传递复杂逻辑的核心工具。传统流程图往往静态且难以适应细节展示&#xff0c;而 Mermaid 与 svg-pan-zoom 的结合&#xff0c;则为这一痛点提供了完美解决方案。本文将深入解析如何通过 Mermaid 的子图&#xff08;subg…

前端权限系统

前端权限系统是为了确保用户只能访问他们有权限查看的资源而设计的。在现代前端开发中&#xff0c;权限控制不仅仅是简单的显示或隐藏元素&#xff0c;还涉及到对路由、组件、数据和操作权限的细致控制。下面是前端权限系统的常见设计方案和实现步骤。 前端权限系统的组成部分 …

Nature | TabPFN:表格基础模型用于小规模数据分析

表格数据是按行和列组织的电子表格形式&#xff0c;在从生物医学、粒子物理到经济学和气候科学等各个科学领域中无处不在 。基于表格其余列来填充标签列缺失值的基本预测任务&#xff0c;对于生物医学风险模型、药物研发和材料科学等各种应用至关重要。尽管深度学习彻底改变了从…

c++学习系列----003.写文件

c 写文件 文章目录 c 写文件1️⃣ 使用 ofstream 写入文本文件2️⃣ 追加模式写入3️⃣ 写入二进制文件4️⃣ 使用 fstream 进行读写5️⃣ 使用 fprintf()&#xff08;C 方式&#xff09;6️⃣ 使用 write() 低级 I/O 方式推荐方式 C 写文件的几种方式主要有以下几种&#xff1…

C语言及内核开发中的回调机制与设计模式分析

在C语言以及操作系统内核开发中,回调机制是一种至关重要的编程模式。它通过注册框架和定义回调函数,实现了模块间的解耦和灵活交互,为系统的扩展性和可维护性提供了有力支持。本文将深入探讨这种机制的工作原理、应用场景以及与设计模式的关联。 一、回调机制的核心概念 (…

浅谈StarRocks SQL性能检查与调优

StarRocks性能受数据建模、查询设计及资源配置核心影响。分桶键选择直接决定数据分布与Shuffle效率&#xff0c;物化视图可预计算复杂逻辑。执行计划需关注分区裁剪、谓词下推及Join策略&#xff0c;避免全表扫描或数据倾斜。资源层面&#xff0c;需平衡并行度、内存限制与网络…

stable Diffusion 中的 VAE是什么

在Stable Diffusion中&#xff0c;VAE&#xff08;Variational Autoencoder&#xff0c;变分自编码器&#xff09;是一个关键组件&#xff0c;用于生成高质量的图像。它通过将输入图像编码到潜在空间&#xff08;latent space&#xff09;&#xff0c;并在该空间中进行操作&…

从零开始 | C语言基础刷题DAY3

❤个人主页&#xff1a;折枝寄北的博客 目录 1.打印3的倍数的数2.从大到小输出3. 打印素数4.打印闰年5.最大公约数 1.打印3的倍数的数 题目&#xff1a; 写一个代码打印1-100之间所有3的倍数的数字 代码&#xff1a; int main(){int i 0;for (i 1; i < 100; i){if (i % …

告别死锁!Hyperlane:Rust 异步 Web 框架的终极解决方案

告别死锁&#xff01;Hyperlane&#xff1a;Rust异步Web框架的终极解决方案 &#x1f525; 为什么选择Hyperlane&#xff1f; Hyperlane是专为Rust开发者打造的高性能异步Web框架&#xff0c;通过革命性的并发控制设计&#xff0c;让您彻底摆脱多线程编程中的死锁噩梦。框架内…