hive:数据导入,数据导出,加载数据到Hive,复制表结构

hive:数据导入,数据导出,加载数据到Hive,复制表结构

news/2025/3/4 5:41:45/文章来源:https://blog.csdn.net/weixin_40121264/article/details/145370009

hive不建议用insert,因为Hive是建立在Hadoop之上的数据仓库工具，主要用于批处理和大数据分析，而不是为OLTP（在线事务处理）操作设计的。INSERT操作会非常慢

数据导入

命令行界面:建一个文件

查询数据>>复制>>粘贴到新建的文件中

加载数据到Hive(方法一)

查看数据是否插入成功

通过DataGrip

通过Hue查看是否插入成功

加载数据到Hive

set hive .exec.mode.local.auto = true ;开启本地模式, exec 是 "execution"（执行）

向多张表中插入数据的语法

示例

只是把原表的数据映射到目标表

示例

方法二示例

加载结束后再查询原文件所在的目录,文件已不存在,HDFS 加载走的是move移动文件

但是如果是从本地加载,走的是COPY,即保留原文件

方法二示例

(通过第三方工具访问Hive来执行本地加载文件可能会出现问题)

在命令行输入Hive启动Hive CLI,即Hive的命令行界面("Command Line Interface")

方法三示例

很慢, 因为相当于走的是insert

方法四示例

只是映射了原表的数据,没有创建新表, 即通过新表名和原表都可以查到相同的数据

注意事项

粘贴数据内容时,末尾不要有空行,否则数据表会出现空行,因为Hive默认行和行之间是换行,只要出现换行就会新起一行,只不过没有匹配到数据,所以是NULL

加载2次,可以上传成功,但是HDFS会把文件自动改名

使用overwrite,相当于先清空当前目录下的文件,在把文件上传

复制表结构

不同

使用like复制原表的表结构给目标表, 连分隔符也和原表一致,使用select语句则是先创建新表再插入数据,分隔符是默认的,不一定和原表一致.如果想要表结构一致且需要数据,使用数据导入的方法四

数据导出

示例

导出的文件系统自动起名

注意:只能在终端使用这个命令

命令解释:

>>也常被称为追加

参数 e 代表 "expression"，即要执行的HiveQL语句

示例

使用 -e参数命令执行完就到了linux,其他的命令执行完还在Hive

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/9262.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

力扣【669. 修剪二叉搜索树】Java题解

力扣【669. 修剪二叉搜索树】Java题解

一开始在想为什么题目说存在唯一答案。然后发现是二叉搜索树就合理了。如下图：如果0节点小于low，那其左子树也都小于low，故可以排除；对于4，其右子树也是可以排除。代码如下： class Solution {public Tre…

阅读更多...

Linux 非阻塞IO

Linux 非阻塞IO

Linux 非阻塞IO 1. fcntl() 在Linux操作系统中，fcntl() 是一个用于操作文件描述符的系统调用。它提供了多种功能，包括控制文件描述符的属性、管理文件锁定、设置文件的非阻塞模式等。本文只截取了用于IO模型的 fcntl() 部分内容， fcntl() …

阅读更多...

记忆力训练day07

记忆力训练day07

逻辑分类联想记忆法一课程目标 （1）掌握如何分类信息 （2）掌握如何运用逻辑分类方法进行记忆小试牛刀： 核心的内容： 文字逻辑分类记忆：把文字分类后转换成画面连接记忆。玫瑰大树太阳…

阅读更多...

RocketMQ原理—5.高可用+高并发+高性能架构

RocketMQ原理—5.高可用+高并发+高性能架构

大纲 1.RocketMQ的整体架构与运行流程 2.基于NameServer管理Broker集群的架构 3.Broker集群的主从复制架构 4.基于Topic和Queue实现的数据分片架构 5.Broker基于Pull模式的主从复制原理 6.Broker层面到底如何做到数据0丢失 7.数据0丢失与写入高并发的取舍 8.RocketMQ读…

阅读更多...

面试经典150题——图

面试经典150题——图

文章目录 1、岛屿数量1.1 题目链接1.2 题目描述1.3 解题代码1.4 解题思路 2、被围绕的区域2.1 题目链接2.2 题目描述2.3 解题代码2.4 解题思路 3、克隆图3.1 题目链接3.2 题目描述3.3 解题代码3.4 解题思路 4、除法求值4.1 题目链接4.2 题目描述4.3 解题代码4.4 解题思路 5、课…

阅读更多...

Celery

Celery

https://www.bilibili.com/video/BV1RGDEY5ERB 架构简单任务执行包结构本示例： app 添加任务获取结果配置延时任务任务配置 beat 提交定时任务

阅读更多...

Spring事务和事务传播机制

Spring事务和事务传播机制

一.事务简单介绍事务是⼀组操作的集合,是⼀个不可分割的操作.事务会把所有的操作作为⼀个整体,⼀起向数据库提交或者是撤销操作请求.所以这组操作要么同时成功,要么同时失败。二.Spring中的事物 1.编程式事务(手动写代码操作事务) 2.声明式事务(利用注解自动开启和提交事…

阅读更多...

XSS 漏洞全面解析：原理、危害与防范

XSS 漏洞全面解析：原理、危害与防范

目录前言编辑漏洞原理 XSS 漏洞的危害检测 XSS 漏洞的方法防范 XSS 漏洞的措施前言在网络安全的复杂版图中，XSS 漏洞，即跨站脚本攻击（Cross - Site Scripting），是一类极为普遍且威胁巨大的安全隐患。随着互…

阅读更多...

本地Harbor仓库搭建流程

本地Harbor仓库搭建流程

Harbor仓库搭建流程本文主要介绍如何搭建harbor仓库，推送本地镜像供其他机器拉取构建服务 harbor文档：Harbor 文档 | 配置 Harbor YML 文件 - Harbor 中文 github下载离线安装包 Releases goharbor/harbor 这是harbor的GitHub下载地址&#xff0c…

阅读更多...

K8S 快速实战

K8S 快速实战

K8S 核心架构原理：我们已经知道了 K8S 的核心功能：自动化运维管理多个容器化程序。那么 K8S 怎么做到的呢？这里，我们从宏观架构上来学习 K8S 的设计思想。首先看下图： K8S 是属于主从设备模型（Master-Slave 架构），即有 Master 节点负责核心的调度、管理和运维，Slave…

阅读更多...

5分钟带你获取deepseek api并搭建简易问答应用

5分钟带你获取deepseek api并搭建简易问答应用

目录 1、获取api 2、获取base_url和chat_model 3、配置模型参数方法一：终端中临时将加入方法二：创建.env文件 4、配置client 5、利用deepseek大模型实现简易问答 deepseek-v3是截止博文撰写之日，无论是国内还是国际上发布的大模型中…

阅读更多...

ResNeSt: Split-Attention Networks 参考论文

ResNeSt: Split-Attention Networks 参考论文

参考文献 [1] Tensorflow Efficientnet. https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet. Accessed: 2020-03-04. 中文翻译：[1] TensorFlow EfficientNet. https://github.com/tensorflow/tpu/tree/master/models/official/efficien…

阅读更多...

Ansible自动化运维实战--通过role远程部署nginx并配置（8/8）

Ansible自动化运维实战--通过role远程部署nginx并配置（8/8）

文章目录 1、准备工作2、创建角色结构3、编写任务4、准备配置文件（金甲模板）5、编写变量6、编写处理程序7、编写剧本8、执行剧本Playbook9、验证-游览器访问每台主机的nginx页面在 Ansible 中，使用角色（Role）来远程部…

阅读更多...

马尔科夫模型和隐马尔科夫模型区别

马尔科夫模型和隐马尔科夫模型区别

我用一个天气预报和海藻湿度观测的比喻来解释，保证你秒懂！ 1. 马尔可夫模型（Markov Model, MM） 特点：状态直接可见场景：天气预报（晴天→雨天→阴天…）核心假设： 下一个…

阅读更多...

decison tree 决策树

decison tree 决策树

熵信息增益信息增益描述的是在分叉过程中获得的熵减，信息增益即熵减。熵减可以用来决定什么时候停止分叉，当熵减很小的时候你只是在不必要的增加树的深度，并且冒着过拟合的风险决策树训练(构建)过程离散值特征处理：One-Hot…

阅读更多...

Microsoft Visual Studio 2022 主题修改（补充）

Microsoft Visual Studio 2022 主题修改（补充）

Microsoft Visual Studio 2022 透明背景修改这方面已经有很多佬介绍过了，今天闲来无事就补充几点细节。具体的修改可以参考：Microsoft Visual Studio 2022 透明背景修改（快捷方法）_material studio怎么把背景弄成透明-CSDN博客文…

阅读更多...

Python实现U盘数据自动拷贝

Python实现U盘数据自动拷贝

功能：当电脑上有U盘插入时，自动复制U盘内的所有内容主要特点： 1、使用PyQt5创建图形界面，但默认隐藏 2、通过CtrlAltU组合键可以显示/隐藏界面 3、自动添加到Windows启动项 4、监控USB设备插入 5、按修改时间排序复制文件 6、静…

阅读更多...

[c语言日寄]越界访问：意外的死循环

[c语言日寄]越界访问：意外的死循环

【作者主页】siy2333 【专栏介绍】⌈c语言日寄⌋：这是一个专注于C语言刷题的专栏，精选题目，搭配详细题解、拓展算法。从基础语法到复杂算法，题目涉及的知识点全面覆盖，助力你系统提升。无论你是初学者，还是…

阅读更多...

数据分析系列--①RapidMiner软件安装

数据分析系列--①RapidMiner软件安装

目录一、软件下载及账号注册 1.软件下载 1.1 CSDN下载国内下载,国内镜像相对快,点击下载 1.2 官网软件下载地址:AI Studio 2025.0 ,服务器在国外相对较慢. 2.软件注册 2.1 点击注册界面开始注册,如图: 3.邮箱验证二、软件安装 1. 新年文件夹,名字最好为英文名 2. 双…

阅读更多...

新增文章功能

新增文章功能

总说过程参考黑马程序员SpringBoot3Vue3全套视频教程，springbootvue企业级全栈开发从基础、实战到面试一套通关_哔哩哔哩_bilibili 之前又偷懒几天。回老家没事干，玩也玩不好，一玩老是被家里人说。写代码吧还是，他们都看不懂&a…

阅读更多...

最新文章

推荐文章