Oracle 批量投入数据方法总结

目录

  • 零. 待投入数据的表结构
  • 一. `INSERT INTO ... SELECT`投入数据
    • 1.1 普通的方式投入数据
    • 1.2 并行插入(Parallel Insert)投入数据
  • 二. PL/SQL 循环投入数据
    • 2.1 脚本介绍
    • 2.2 效果
  • 三. 💪PL/SQL FORALL 批量操作💪
    • 3.1 脚本介绍
    • 3.2 效果
  • 四. 💪SQL*Loader 工具加载外部文件💪
    • 4.2 效果


零. 待投入数据的表结构

create table DB_USER."PERSON_TABLE" (ID NUMBER not null, NAME VARCHAR2(50), AGE NUMBER, EMAIL VARCHAR2(100), CREATED_DATE DATE
)

在这里插入图片描述


一. INSERT INTO ... SELECT投入数据

🤔 INSERT INTO ... SELECT的这种方式相当于把数据加载到内存中之后再插入数据库,只适合投入小规模的数据。

1.1 普通的方式投入数据

⏹当数据量不是很多的时候,可以使用这种方式

  • 先从DUAL虚拟表中检索后造出指定条数的数据后,再插入到指定的表中。
  • 除了主键之类的关键字段之外,其余字段写固定值即可。
INSERT INTO PERSON_TABLESELECT-- 因为该字段为字符串形式,所以使用TO_CHAR转换-- TO_CHAR(100000000 + LEVEL) || 'TEST_ID' AS id,LEVEL AS id,'Name_' || ROWNUM AS name,TRUNC(DBMS_RANDOM.VALUE(18, 60)) AS age,'user' || ROWNUM || '@example.com' AS email,SYSDATE - DBMS_RANDOM.VALUE(0, 365) AS created_dateFROMDUAL CONNECT BY LEVEL <= 1000000;

1.2 并行插入(Parallel Insert)投入数据

ALTER SESSION ENABLE PARALLEL DML;
INSERT /*+ PARALLEL(PERSON_TABLE, 4) */ INTO PERSON_TABLE
SELECT LEVEL AS id,'Name_' || ROWNUM AS name,TRUNC(DBMS_RANDOM.VALUE(18, 60)) AS age,'user' || ROWNUM || '@example.com' AS email,SYSDATE - DBMS_RANDOM.VALUE(0, 365) AS created_date
FROM DUAL
CONNECT BY LEVEL <= 1000000;

二. PL/SQL 循环投入数据

2.1 脚本介绍

  • 灵活,支持动态生成数据,适合中小数据量
  • 数据量大时性能较差,容易导致上下文切换开销
BEGINFOR i IN 1..5000000 LOOPINSERT INTO PERSON_TABLE (id, name, age, email, created_date)VALUES (i,'Name_' || i,-- 随机年龄TRUNC(DBMS_RANDOM.VALUE(18, 60)),'user' || i || '@example.com',-- 随机日期SYSDATE - DBMS_RANDOM.VALUE(0, 365));-- 每 100000 条提交一次IF MOD(i, 100000) = 0 THENCOMMIT;END IF;END LOOP;COMMIT;
END;
/

2.2 效果

⏹投入500万条数据,耗时5分钟。

在这里插入图片描述


三. 💪PL/SQL FORALL 批量操作💪

3.1 脚本介绍

  • 这种方式可以减少上下文切换,性能比普通的循环插入要好。
DECLARETYPE person_array IS TABLE OF PERSON_TABLE%ROWTYPE;v_data person_array := person_array();
BEGINFOR i IN 1..5000000 LOOPv_data.EXTEND;v_data(v_data.COUNT).id := i;v_data(v_data.COUNT).name := 'Name_' || i;v_data(v_data.COUNT).age := TRUNC(DBMS_RANDOM.VALUE(18, 60));v_data(v_data.COUNT).email := 'user' || i || '@example.com';v_data(v_data.COUNT).created_date := SYSDATE - DBMS_RANDOM.VALUE(0, 365);-- 每 100000 条批量插入一次IF MOD(i, 100000) = 0 THENFORALL j IN 1..v_data.COUNTINSERT INTO PERSON_TABLE VALUES v_data(j);COMMIT;v_data.DELETE; -- 清空数组END IF;END LOOP;-- 插入剩余数据FORALL j IN 1..v_data.COUNTINSERT INTO PERSON_TABLE VALUES v_data(j);COMMIT;
END;
/

3.2 效果

⏹投入500万条数据,耗时1分钟18秒。

在这里插入图片描述


四. 💪SQL*Loader 工具加载外部文件💪

⏹写一个PowerShell脚本,根据数据库的表结构来生成csv文件

  • 该脚本执行后,会在桌面上生成一个csv文件。
# 文件名称
$file_name = 'person_data.csv'
# 路径
$outputFile = "$Home\Desktop\$file_name"
# csv 文件的总行数
$rows = 5000000
# 并行线程数
$threadCount = 4
# 每个线程生成的记录数量
$chunkSize = [math]::Ceiling($rows / $threadCount)# 判断文件是否存在,存在的话就删除
if (Test-Path -Path $outputFile) {Remove-Item -Path $outputFile -Force
}# 写入 CSV 表头
# "`"ID`",`"NAME`",`"AGE`",`"EMAIL`",`"CREATED_DATE`"" | Out-File -FilePath $outputFile -Encoding UTF8 -Append# 定义脚本块
$scriptblock = {param($startRow, $endRow, $tempFile)# 在后台作业中定义 Generate-Chunk 函数function Generate-Chunk {param ([int]$startRow,[int]$endRow,[string]$filePath)$random = [System.Random]::new()$currentDate = Get-Date$sb = [System.Text.StringBuilder]::new()# 循环生成csv数据for ($i = $startRow; $i -le $endRow; $i++) {# =========================对应数据库的各字段值=========================$id = $i$name = "Name_$i"$age = $random.Next(18, 60)$email = "user$i@example.com"$createdDate = $currentDate.AddDays(- $random.Next(0, 365)).ToString("yyyy/MM/dd HH:mm:ss")# =========================对应数据库的各字段值=========================# =========================一行csv=========================$line = "`"$id`",`"$name`",`"$age`",`"$email`",`"$createdDate`""# =========================一行csv=========================$sb.AppendLine($line) | Out-Null}<# 将生成的内容写入文件-NoNewline 的作用是为了防止csv文件的最后一行被追加空行#>$sb.ToString() | Out-File -FilePath $filePath -Encoding UTF8 -Append -NoNewline}# 调用 Generate-Chunk 函数,多线程生成临时csv文件Generate-Chunk -startRow $startRow -endRow $endRow -filePath $tempFile
}# CSV文件合成
function Merge-CSV {param ([string]$outputFile,[bool]$IsReadAllDataToMemory)# 获取所有分段文件,按名称排序$partFiles = Get-ChildItem -Path "$outputFile.*.part" | Sort-Object Nameif ($IsReadAllDataToMemory) {# 将所有内容加载到内存中,然后一次性写入$partFiles | ForEach-Object { Get-Content $_.FullName } | Out-File -FilePath $outputFile -Encoding UTF8 -Force# 删除所有分段文件$partFiles | ForEach-Object { Remove-Item $_.FullName }return;}$partFiles | ForEach-Object {Get-Content -Path $_.FullName | Out-File -FilePath $outputFile -Encoding UTF8 -AppendRemove-Item -Path $_.FullName}
}try {# 定义job数组$jobs = @()# 组装job1..$threadCount | ForEach-Object {$startRow = ($_ - 1) * $chunkSize + 1$endRow = [math]::Min($_ * $chunkSize, $rows)# 临时csv文件$tempFile = "$outputFile.$_.part"$jobs += Start-Job -ScriptBlock $scriptblock -ArgumentList $startRow, $endRow, $tempFile}# 统计生成csv文件所消耗的时间$exec_time = Measure-Command {Write-Host "临时csv文件开始生成..."# 执行job,等待并收集所有执行结果$jobs | ForEach-Object { Wait-Job -Job $_; Receive-Job -Job $_; Remove-Job -Job $_ }# 合并所有并发生成的csv临时文件,组装成最终的总csv文件Write-Host "临时csv文件生成完毕,开启合并..."Merge-CSV -outputFile $outputFile -IsReadAllDataToMemory $False}Write-Host "csv文件生成完毕,共消耗$($exec_time.TotalSeconds)秒: $outputFile" -ForegroundColor Red} catch {# 当异常发生时,清空桌面上的临时csv文件if (Test-Path -Path "$outputFile.*.part") {Remove-Item -Path "$outputFile.*.part" -Force}Write-Host "脚本运行时发生异常: $_" -ForegroundColor RedWrite-Host "详细信息: $($_.Exception.Message)" -ForegroundColor YellowWrite-Host "堆栈跟踪: $($_.Exception.StackTrace)" -ForegroundColor Gray
}Read-Host "按 Enter 键退出..."

⏹创建控制文件control_file.ctl

LOAD DATA
INFILE 'person_data.csv'
INTO TABLE PERSON_TABLE
FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"'
(id, name, age, email, created_date "TO_DATE(:created_date, 'YYYY/MM/DD HH24:MI:SS')")

⏹使用 SQL*Loader 执行加载

  • 性能极高,适合大规模数据插入。
  • 支持多线程和并行加载。
sqlldr db_user/oracle@SERVICE_XEPDB1_CLIENT control=control_file.ctl direct=true

4.2 效果

⏹投入500万条数据,耗时居然不到10秒!💪💪💪

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3021.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Git学习笔记

Git学习笔记 目录 版本控制 本地版本控制 集中版本控制 分布式版本控制 基本使用方式 Git Config Git Remote Git Add Objects Refs Annotation Tag 追溯历史版本 修改历史版本 Git GC Git Clone & Pull & Fetch Git Push 常见问题 不同的工作流 集…

【Block总结】掩码窗口自注意力 (M-WSA)

摘要 论文链接&#xff1a;https://arxiv.org/pdf/2404.07846 论文标题&#xff1a;Transformer-Based Blind-Spot Network for Self-Supervised Image Denoising Masked Window-Based Self-Attention (M-WSA) 是一种新颖的自注意力机制&#xff0c;旨在解决传统自注意力方法在…

卷积神经05-GAN对抗神经网络

卷积神经05-GAN对抗神经网络 使用Python3.9CUDA11.8Pytorch实现一个CNN优化版的对抗神经网络 简单的GAN图片生成 CNN优化后的图片生成 优化模型代码对比 0-核心逻辑脉络 1&#xff09;Anacanda使用CUDAPytorch2&#xff09;使用本地MNIST进行手写图片训练3&#xff09;…

怎么在iPhone手机上使用便签进行记录?

宝子们&#xff0c;在这个快节奏的时代&#xff0c;灵感的火花总是一闪而过&#xff0c;待办事项也常常让人应接不暇。好在咱们的 iPhone手机便签超给力&#xff0c;能满足各种记录需求&#xff01;今天就来给大家分享一下&#xff0c;如何在 iPhone 手机上巧用便签&#xff0c…

基于微信小程序的摄影竞赛系统设计与实现(LW+源码+讲解)

专注于大学生项目实战开发,讲解,毕业答疑辅导&#xff0c;欢迎高校老师/同行前辈交流合作✌。 技术范围&#xff1a;SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容&#xff1a;…

【从零开始使用系列】StyleGAN2:开源图像生成网络——环境搭建与基础使用篇(附大量测试图)

StyleGAN2 是英伟达团队 NVIDIA 提出的生成对抗网络&#xff08;GAN&#xff09;的一种改进版本。 它通过创新的网络架构&#xff0c;能够生成细节丰富、逼真的图像&#xff0c;特别在高频细节&#xff08;如皮肤纹理、光照等&#xff09;的表现上表现卓越。与传统 GAN 相比&am…

redis(2:数据结构)

1.String 2.key的层级格式 3.Hash 4.List 5.Set 6.SortedSet

LabVIEW 程序中的 R6025 错误

R6025错误 通常是 运行时库 错误&#xff0c;特别是与 C 运行时库 相关。这种错误通常会在程序运行时出现&#xff0c;尤其是在使用 C 编译的程序或依赖 C 运行时库的程序时。 ​ 可能的原因&#xff1a; 内存访问冲突&#xff1a; R6025 错误通常是由于程序在运行时访问无效内…

前端【2】html添加样式、CSS选择器

一、为html添加样式的三种方法 1、内部样式 2、外部样式 3、行内样式 二、css的使用--css选择器 1、css基本选择器 元素选择器 属性选择器 id选择器 class/类选择器 通配符选择器 2、群组选择器-多方面筛选 3、关系选择器 后代选择器【包含选择器】 子元素选择器…

【Elasticsearch】全文搜索与相关性排序

&#x1f9d1; 博主简介&#xff1a;CSDN博客专家&#xff0c;历代文学网&#xff08;PC端可以访问&#xff1a;https://literature.sinhy.com/#/?__c1000&#xff0c;移动端可微信小程序搜索“历代文学”&#xff09;总架构师&#xff0c;15年工作经验&#xff0c;精通Java编…

【算法】枚举

枚举 普通枚举1.铺地毯2.回文日期3.扫雷 二进制枚举1.子集2.费解的开关3.Even Parity 顾名思义&#xff0c;就是把所有情况全都罗列出来&#xff0c;然后找出符合题目要求的那一个。因此&#xff0c;枚举是一种纯暴力的算法。一般情况下&#xff0c;枚举策略都是会超时的。此时…

51单片机——DS18B20温度传感器

由于DS18B20数字温度传感器是单总线接口&#xff0c;所以需要使用51单片机的一个IO口模拟单总线时序与DS18B20通信&#xff0c;将检测的环境温度读取出来 1、DS18B20模块电路 传感器接口的单总线管脚接至单片机P3.7IO口上 2、DS18B20介绍 2.1 DS18B20外观实物图 管脚1为GN…

云手机技术怎么实现的?

前言 随着亚矩阵云手机在跨境电商、海外社媒矩阵搭建、出海运营、海外广告投放、国内新媒体矩阵运营、品牌应用矩阵运营等领域内的普及和使用&#xff0c;云手机的理念已经被越来越多人所接受和认同。今天我们就一起来浅析一下&#xff0c;到底云手机的技术是怎么实现的&#…

HTML中link的用法

一点寒芒先到&#xff0c;随后&#xff0c;抢出如龙&#xff01; 对于本人而言&#xff0c;这篇笔记内容有些扩展了&#xff0c;有些还未学到的也用上了&#xff0c;但是大概可以使用的明白&#xff0c;坚持下去&#xff0c;相信一定可以建设一个稳固的根基。 该文章为个人成…

闪豆多平台视频批量下载器

1. 视频链接获取与解析 首先&#xff0c;在哔哩哔哩网页中随意点击一个视频&#xff0c;比如你最近迷上了一个UP主的美食制作视频&#xff0c;想要下载下来慢慢学。点击视频后&#xff0c;复制视频页面的链接。复制完成后&#xff0c;不要急着关闭浏览器&#xff0c;因为接下来…

Vulnhub DC-8靶机攻击实战(一)

导语   Vulnhub DC-8靶机教程来了,好久没有更新打靶的教程了,这次我们在来更新一期关于Vulnhub DC-8的打靶训练,如下所示。 安装并且启动靶机 安装并且启动靶机,如下所示。 开始信息采集 进入到Kali中,通过如下的命令来查找到靶机的IP地址。 arp-scan -l根据上面的结…

JWT在线解密/解码 - 加菲工具

JWT在线解密/解码 首先进入加菲工具 选择 “JWT 在线解密/解码” https://www.orcc.online 或者直接进入JWT 在线解密/解码 https://www.orcc.online/tools/jwt 进入功能页面 使用 输入对应的jwt内容&#xff0c;点击解码按钮即可

换了城市ip属地会变吗?为什么换了城市IP属地不变

当我们跨越城市的界限&#xff0c;从一个地方迁移到另一个地方时&#xff0c;许多日常使用的网络服务和应用程序都会感知到这种变化&#xff0c;其中一个显著的现象就是IP属地的变化。IP属地&#xff0c;即IP地址所在的地理位置信息&#xff0c;它通常与互联网服务提供商&#…

如何在谷歌浏览器中设置自定义安全警告

随着网络环境的日益复杂&#xff0c;浏览器的安全问题也愈发引人关注。谷歌浏览器作为一款广泛使用的浏览器&#xff0c;其自定义安全警告功能为用户提供了更加个性化和安全的浏览体验。本文将详细介绍如何在谷歌浏览器中设置自定义安全警告&#xff0c;帮助用户更好地保护自己…

深度学习中的卷积和反卷积(四)——卷积和反卷积的梯度

本系列已完结&#xff0c;全部文章地址为&#xff1a; 深度学习中的卷积和反卷积&#xff08;一&#xff09;——卷积的介绍 深度学习中的卷积和反卷积&#xff08;二&#xff09;——反卷积的介绍 深度学习中的卷积和反卷积&#xff08;三&#xff09;——卷积和反卷积的计算 …