四、案例 - Oracle数据迁移至MySQL

Oracle数据迁移至MySQL

一、生成测试数据表和数据
- 1.在Oracle创建数据表和数据
- 2.在MySQL创建数据表
二、生成模板文件
- 1.模板文件内容
- 2.模板文件参数详解
- - 2.1 全局设置
  - 2.2 数据读取（Reader）
  - 2.3 数据写入（Writer）
  - 2.4 性能设置
三、案例
- 1.全量数据迁移
- - 1.1 配置迁移模板
  - 1.2.运行迁移命令
- 2.增量数据迁移
- - 2.1 配置迁移模板
  - 2.2 运行迁移命令

一、生成测试数据表和数据

1.在Oracle创建数据表和数据

部署Oracle教程

# 创建数据库查看上面的部署教程
# 1.创建表
CREATE TABLE student (id INTEGER,name VARCHAR2(20),create_time TIMESTAMP DEFAULT SYSTIMESTAMP,update_time TIMESTAMP DEFAULT SYSTIMESTAMP
);
# 2.插入测试数据
INSERT INTO student (id, name)
SELECT level, 'Name ' || level
FROM dual
CONNECT BY level <= 10;

2.在MySQL创建数据表

部署MySQL教程

# 1.创建数据库
CREATE DATABASE oracle_test charset=utf8mb4;
# 2.创建数据库表
use oracle_test;
CREATE TABLE student (id INT,name VARCHAR(20),create_time DATETIME DEFAULT CURRENT_TIMESTAMP,update_time DATETIME DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP
);

二、生成模板文件

当前安装DataX的目录为：/data/datax

# 1.进入datax的工具目录
cd /data/datax/bin/
# 2.生成模板
python datax.py -r oraclereader -w mysqlwriter > ../job/oracle_to_mysql.json

1.模板文件内容

{"job": {"content": [{"reader": {"name": "oraclereader", "parameter": {"column": [], "connection": [{"jdbcUrl": ["jdbc:oracle:thin:@[HOST_NAME]:PORT:[DATABASE_NAME]"], "table": []}], "password": "", "username": "","where": ""}}, "writer": {"name": "mysqlwriter", "parameter": {"column": [], "connection": [{"jdbcUrl": "", "table": []}], "password": "", "preSql": [], "session": [], "username": "", "writeMode": ""}}}], "setting": {"speed": {"channel": ""}}}
}

2.模板文件参数详解

2.1 全局设置

job: 定义了整个数据迁移作业的配置。
- content: 包含了一个或多个数据同步任务的列表。

2.2 数据读取（Reader）

reader: 定义了数据来源的相关配置。
- name: 使用的读取插件名称，这里是oraclereader，表示从Oracle数据库读取数据。
- parameter: 读取数据时的参数配置。
  - column: 需要读取的列名列表。
  - connection: 数据库连接信息。
    - jdbcUrl: 数据库的JDBC连接URL。需要替换[HOST_NAME], [PORT], [DATABASE_NAME]为实际的服务器地址、端口和数据库名。
    - table: 指定要读取数据的表名列表。
  - password: 用于连接Oracle数据库的密码。
  - username: 用于连接Oracle数据库的用户名。
  - where: 可以指定一个WHERE条件来过滤读取的数据，这里留空表示不过滤，读取所有数据。

2.3 数据写入（Writer）

writer: 定义了数据目的地的相关配置。
- name: 使用的写入插件名称，这里是mysqlwriter，表示数据将被写入到MySQL数据库。
- parameter: 写入数据时的参数配置。
  - column: 指定写入到目标表的列名。应与读取的列对应。
  - connection: 目标数据库的连接信息。
    - jdbcUrl: MySQL的JDBC连接URL。
    - table: 指定要写入数据的表名。
  - password: 用于连接MYSQL数据库的密码。
  - postSql: 在数据写入完成后执行的SQL语句列表，这里留空。
  - preSql: 在数据写入前执行的SQL语句列表，这里留空。
  - username: 用于连接MYSQL数据库的用户名。
  - writeMode: 写入模式，这里设置为insert，表示通过INSERT语句进行数据写入。

2.4 性能设置

setting: 定义了作业的全局设置。
- speed: 控制数据同步的速度。
  - channel: 指定并发通道的数量，这里设置为4，意味着数据迁移任务将并行执行，使用4个并发通道。

三、案例

1.全量数据迁移

1.1 配置迁移模板

{"job": {"content": [{"reader": {"name": "oraclereader", "parameter": {"column": ["id", "name", "create_time", "update_time"], "connection": [{"jdbcUrl": ["jdbc:oracle:thin:@192.168.86.128:1521/helowin"], "table": ["student"]}], "password": "***", "username": "ora_user"}}, "writer": {"name": "mysqlwriter", "parameter": {"column": ["id", "name", "create_time", "update_time"], "connection": [{"jdbcUrl": "jdbc:mysql://192.168.86.128:3306/oracle_test?useUnicode=true&characterEncoding=utf-8", "table": ["student"]}], "password": "****", "preSql": [], "username": "root", "writeMode": "insert"}}}], "setting": {"speed": {"channel": "1"}}}
}

1.2.运行迁移命令

python /data/datax/bin/datax.py /data/datax/job/mysql_to_clickhouse.json

在这里插入图片描述

2.增量数据迁移

主要差别在于，需要有一个createTime字段，代表源数据的创建时间，那么更新的时候，只迁移过滤这个时间段的数据，达到增量数据迁移

2.1 配置迁移模板

{"job": {"content": [{"reader": {"name": "oraclereader", "parameter": {"column": ["id", "name", "create_time", "update_time"], "connection": [{"jdbcUrl": ["jdbc:oracle:thin:@192.168.86.128:1521/helowin"], "table": ["student"]}], "password": "***", "username": "ora_user","where":"CREATE_TIME >= TO_TIMESTAMP('2024-02-14 00:00:00', 'YYYY-MM-DD HH24:MI:SS') AND CREATE_TIME <= TO_TIMESTAMP('2024-02-14 23:59:59', 'YYYY-MM-DD HH24:MI:SS')"}}, "writer": {"name": "mysqlwriter", "parameter": {"column": ["id", "name", "create_time", "update_time"], "connection": [{"jdbcUrl": "jdbc:mysql://192.168.86.128:3306/oracle_test?useUnicode=true&characterEncoding=utf-8", "table": ["student"]}], "password": "****", "preSql": [], "username": "root", "writeMode": "insert"}}}], "setting": {"speed": {"channel": "1"}}}
}

2.2 运行迁移命令

注意：指定参数的话，参数名称面前需要加：-D

python /data/datax/bin/datax.py /data/datax/job/oracle_to_mysql.json -p "-DstartDatetime=2024-02-14 -DendDatetime=2024-02-14"

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/258033.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

四、案例 - Oracle数据迁移至MySQL

Oracle数据迁移至MySQL

一、生成测试数据表和数据

1.在Oracle创建数据表和数据

2.在MySQL创建数据表

二、生成模板文件

1.模板文件内容

2.模板文件参数详解

2.1 全局设置

2.2 数据读取（Reader）

2.3 数据写入（Writer）

2.4 性能设置

三、案例

1.全量数据迁移

1.1 配置迁移模板

1.2.运行迁移命令

2.增量数据迁移

2.1 配置迁移模板

2.2 运行迁移命令

相关文章

qt “美颜”

高仿原神官网UI 纯html源码

（三十五）大数据实战——Superset可视化平台搭建

Flutter Android开发梳理Google Material Design颜色体系

计算机网络——12DNS

基于微信小程序的校园失物招领小程序

【光学】学习记录1-几何光学的近轴理论

Python一些可能用的到的函数系列124 GlobalFunc

【闲谈】开源软件的崛起与影响

内网穿透工具

CVE-2022-25487 漏洞复现

基于BP算法的SAR成像matlab仿真

【51单片机】直流电机实验和步进电机实验

Chat with RTX 安装

postgresql 手动清理wal日志的101个坑

用Jmeter进行接口测试

论文阅读-面向公平性的分布式系统负载均衡机制

[CTF]-PWN:C++文件更换libc方法（WSL）

Linux实用指令

Netty应用(七) 之 Handler Netty服务端编程总结