Hadoop分布式文件系统(二)

目录

  • 1. 引言
  • 1. Hadoop文件操作命令
  • 2. 部分常用的Hadoop FS Shell命令
    • 2.1 ls列出文件
    • 2.2 mkdir创建目录
    • 2.3 put上传文件
    • 2.4 cat查看文件
    • 2.5 get复制文件
    • 2.6 rm删除文件
  • 3. Hadoop系统管理命令
  • 4. HDFS Java API 示例
  • 参考

1. 引言

  大多数HDFS Shell命令的行为和对应的Unix Shell命令类似,主要不同之处是HDFS Shell命令操作的是远程Hadoop服务器的文件,而Unix Shell命令操作的是本地文件。

1. Hadoop文件操作命令

  调用Hadoop文件系统(FS)Shell命令应使用hadoop fs -cmd <args>的形式(需要把hadoop文件下的bin目录添加到系统的PATH环境变量中)。所有的FS命令使用URI路径作为参数,URI的格式为scheme://authority/path。对于HDFS系统来说,scheme是hdfs;对于本地文件系统来说,scheme是file。scheme和authority都是可选的参数,未加指定就会使用配置中的默认值(我配置的镜像中默认值为hdfs://172.17.0.2:9000,这个值可在hadoop文件下etc/hadoop/core-site.xml中找到)。
  Hadoop Shell命令都可在Hadoop3.3.6 FS Shell这个链接里查找。

2. 部分常用的Hadoop FS Shell命令

  如果学过Linux Shell命令的话,就很容易上手。可以通过hadoop fs -help获取hadoop fs命令的使用帮助,如下图所示(这个使用帮助很长,仅展示了部分)。
在这里插入图片描述

2.1 ls列出文件

  命令:hadoop fs -ls <args>。
  列出指定目录或者文件的信息。

hadoop fs -ls /

在这里插入图片描述

2.2 mkdir创建目录

  命令:hadoop fs -mkdir <paths>。
  接收路径指定的URI作为参数创建目录。

hadoop fs -mkdir /test1 /test2 && hadoop fs -ls /

在这里插入图片描述

2.3 put上传文件

  命令:hadoop fs -put <localsrc> ··· <dst>。
  从本地文件系统中复制单个或多个文件到目标文件系统。

touch text1 text2 && hadoop fs -put text1 text2 /test1 && hadoop fs -ls /test1

在这里插入图片描述

2.4 cat查看文件

  命令:hadoop fs -cat URI [URI···]。
  查看指定文件的内容。

echo "hello" | tee text3 && hadoop fs -put text3 /test2 && hadoop fs -cat /test2/text3

  第一个hello是echo命令打印到终端并同时写入text3中,第二个hello才是/test2/text3中的内容。
在这里插入图片描述

2.5 get复制文件

  命令:hadoop fs -get <src> <localsrc>。
  复制文件到本地文件系统。

hadoop fs -get /test2/text3 text4 && ls -l .

在这里插入图片描述

2.6 rm删除文件

  命令:hadoop fs -rm URI [URI···]。
  删除指定的文件。

hadoop fs -rm -r /test1 /test2 && hadoop fs -ls /

  -rm -r使用递归删除,不管目录空不空,全部强制删除。
在这里插入图片描述

3. Hadoop系统管理命令

命令作用
hadoop version查看Hadoop版本
hadoop namenode -format格式化一个新的分布式文件系统
start-dfs.sh启动HDFS
stop-dfs.sh停止HDFS
start-yarn.sh启动yarn
stop-yarn.sh停止yarn
hdfs dfsadmin -safemode enter手动进入安全模式
hdfs dfsadmin -safemode leave退出安全模式
hdfs dfsadmin -safemode get查看是否处于安全模式
hdfs dfsadmin -help列出hadoop dfsadmin支持的命令

  Namenode在启动时会进入安全模式,安全模式是Namenode的一种状态,在这个阶段,文件系统不允许有任何修改。安全模式的目的是在系统启动时检查各个Datanode上数据块的有效性,同时根据策略对数据块进行必要的复制或删除,当数据块副本满足最小副本数条件时,会自动退出安全模式。HDFS进入安全模式后会导致Hive和HBase的启动异常。

4. HDFS Java API 示例

  我配置的镜像中安装了code-server,只要你启动镜像时把端口映射到宿主机上,就可以通过宿主机的网页(localhost:映射到宿主机上的端口)进行编程。我推荐使用maven来管理Java项目,并且在code-server中安装好Java的插件。
在这里插入图片描述
  接下来按住ctrl+shift+p启动code-server的命令面板,输入java,点击Create Java Project,选择Maven,选择maven-archetype-quickstart,顺着引导一路配置,等待生成Java项目(Java大佬请随意,本人初识Maven)。
  生成的Java项目中有一个pom.xml文件,这个文件里包含项目的一些信息和Java依赖。在<dependencies>和<\dependencies>中添加如下依赖。

	<dependency><groupId>org.apache.hadoop</groupId><artifactId>hadoop-common</artifactId><version>3.3.6</version><exclusions><exclusion><groupId>org.slf4j</groupId><artifactId>slf4j-log4j12</artifactId></exclusion></exclusions></dependency><dependency><groupId>org.apache.hadoop</groupId><artifactId>hadoop-hdfs</artifactId><version>3.3.6</version><exclusions><exclusion><groupId>org.slf4j</groupId><artifactId>slf4j-log4j12</artifactId></exclusion></exclusions></dependency><dependency><groupId>org.apache.hadoop</groupId><artifactId>hadoop-mapreduce-client-core</artifactId><version>3.3.6</version></dependency>

  在项目src文件下找到App.java文件,输入以下代码。

import java.net.URI;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.BlockLocation;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.hdfs.DistributedFileSystem;
import org.apache.hadoop.hdfs.protocol.DatanodeInfo;
import org.apache.hadoop.io.IOUtils;public class App {public static void main(String[] args) throws Exception {uploadFile("/root/hadoop-3.3.6/logs/hadoop-root-namenode-0aa49d1e16ae.log", "/");createFile("Hello Hadoop root@0aa49d1e16ae\n", "/testcreate");createDir("/test");fileRename("/hadoop-root-namenode-0aa49d1e16ae.log", "/hadoop-root-namenode.log");deleteFile("/test");readFile("/testcreate");isFileExists("/testcreate");fileLastModify("/testcreate");fileLocation("/testcreate");nodeList();}static FileSystem getFileSystem() throws Exception {URI uri = new URI("hdfs://172.17.0.2:9000/");FileSystem fileSystem = FileSystem.get(uri, new Configuration());return fileSystem;}public static void uploadFile(String inputPath,String outputPath) throws Exception {FileSystem hdfs = getFileSystem();Path src = new Path(inputPath);Path dst = new Path(outputPath);hdfs.copyFromLocalFile(src, dst);}public static void createFile(String string, String outputPath) throws Exception {byte[] buff = string.getBytes();FileSystem hdfs = getFileSystem();Path dfs = new Path(outputPath);FSDataOutputStream outputStream = hdfs.create(dfs);outputStream.write(buff, 0, buff.length);outputStream.close();}public static void createDir(String dirPath) throws Exception {FileSystem hdfs = getFileSystem();Path dfs = new Path(dirPath);hdfs.mkdirs(dfs);}public static void fileRename(String oldName, String newName) throws Exception {FileSystem hdfs = getFileSystem();Path frPath = new Path(oldName);Path toPath = new Path(newName);boolean isRenamed = hdfs.rename(frPath, toPath);String result = isRenamed ? "success" : "failure";System.out.println("The result of renaming the file: " + result);}public static void deleteFile(String path) throws Exception {FileSystem hdfs = getFileSystem();Path delef = new Path(path);boolean isDeleted = hdfs.delete(delef, true);System.out.println("Delete? " + isDeleted);}public static void readFile(String readPath) throws Exception {FileSystem hdfs = getFileSystem();FSDataInputStream openStream = hdfs.open(new Path(readPath));IOUtils.copyBytes(openStream, System.out, 1024, false);IOUtils.closeStream(openStream);}public static void isFileExists(String path) throws Exception {FileSystem hdfs = getFileSystem();Path findf = new Path(path);boolean isExisted = hdfs.exists(findf);System.out.println("Exist? " + isExisted);}public static void fileLastModify(String path) throws Exception {FileSystem hdfs = getFileSystem();Path fPath = new Path(path);FileStatus fileStatus = hdfs.getFileStatus(fPath);long modiTime = fileStatus.getModificationTime();System.out.println("the modify time of testcreate is " + modiTime);}public static void fileLocation(String path) throws Exception {FileSystem hdfs = getFileSystem();Path fPath = new Path(path);FileStatus fileStatus = hdfs.getFileStatus(fPath);BlockLocation[] blockLocations = hdfs.getFileBlockLocations(fileStatus, 0, fileStatus.getLen());int blockLen = blockLocations.length;for (int i = 0; i < blockLen; i++) {String[] hosts = blockLocations[i].getHosts();System.out.println("block_" + i + "_location: " + hosts[0]);}}public static void nodeList() throws Exception {FileSystem fs = getFileSystem();DistributedFileSystem hdfs = (DistributedFileSystem) fs;DatanodeInfo[] dataNodeStats = hdfs.getDataNodeStats();for (int i = 0; i < dataNodeStats.length; i++) {System.out.println("DataNode_" + i + "_Name: " + dataNodeStats[i].getHostName());}}
}

  点击App.java的右上角按钮,选择Run Java,得到如下运行结果。
在这里插入图片描述

参考

吴章勇 杨强著 大数据Hadoop3.X分布式处理实战

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/483511.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ESP32-S3模组上跑通ES8388(13)

接前一篇文章&#xff1a;ESP32-S3模组上跑通ES8388&#xff08;12&#xff09; 二、利用ESP-ADF操作ES8388 2. 详细解析 上一回解析了es8388_init函数中的第6段代码&#xff0c;本回继续往下解析。为了便于理解和回顾&#xff0c;再次贴出es8388_init函数源码&#xff0c;在…

LearnOpenGL学习(光照 -- 颜色,基础光照,材质,光照贴图)

光照 glm::vec3 lightColor(0.0f, 1.0f, 0.0f); glm::vec3 toyColor(1.0f, 0.5f, 0.31f); glm::vec3 result lightColor * toyColor; // (0.0f, 0.5f, 0.0f); 说明&#xff1a;当我们把光源的颜色与物体的颜色值相乘&#xff0c;所得到的就是这个物体所反射的颜色。 创建…

Linux条件变量线程池详解

一、条件变量 【互斥量】解决了线程间同步的问题&#xff0c;避免了多线程对同一块临界资源访问产生的冲突&#xff0c;但同一时刻对临界资源的访问&#xff0c;不论是生产者还是消费者&#xff0c;都需要竞争互斥锁&#xff0c;由此也带来了竞争的问题。即生产者和消费者、消费…

Figma入门-自动布局

Figma入门-自动布局 前言 在之前的工作中&#xff0c;大家的原型图都是使用 Axure 制作的&#xff0c;印象中 Figma 一直是个专业设计软件。 最近&#xff0c;很多产品朋友告诉我&#xff0c;很多原型图都开始用Figma制作了&#xff0c;并且很多组件都是内置的&#xff0c;对…

威联通-001 手机相册备份

文章目录 前言1.Qfile Pro2.Qsync Pro总结 前言 威联通有两种数据备份手段&#xff1a;1.Qfile Pro和2.Qsync Pro&#xff0c;实践使用中存在一些区别&#xff0c;针对不同备份环境选择是不同。 1.Qfile Pro 用来备份制定目录内容的。 2.Qsync Pro 主要用来查看和操作文…

大R玩家流失预测在休闲社交游戏中的应用

摘要 预测玩家何时会离开游戏为延长玩家生命周期和增加收入贡献创造了独特的机会。玩家可以被激励留下来&#xff0c;战略性地与公司组合中的其他游戏交叉链接&#xff0c;或者作为最后的手段&#xff0c;通过游戏内广告传递给其他公司。本文重点预测休闲社交游戏中高价值玩家…

基于Java Springboot宠物咖微信小程序

一、作品包含 源码数据库全套环境和工具资源部署教程 二、项目技术 前端技术&#xff1a;Html、Css、Js、Vue、Element-ui 数据库&#xff1a;MySQL 后端技术&#xff1a;Java、Spring Boot、MyBatis 三、运行环境 开发工具&#xff1a;IDEA/eclipse 微信开发者工具 数…

ultralytics-YOLOv11的目标检测解析

1. Python的调用 from ultralytics import YOLO import os def detect_predict():model YOLO(../weights/yolo11n.pt)print(model)results model(../ultralytics/assets/bus.jpg)if not os.path.exists(results[0].save_dir):os.makedirs(results[0].save_dir)for result in…

蓝桥杯准备训练(lesson1,c++方向)

前言 报名参加了蓝桥杯&#xff08;c&#xff09;方向的宝子们&#xff0c;今天我将与大家一起努力参赛&#xff0c;后序会与大家分享我的学习情况&#xff0c;我将从最基础的内容开始学习&#xff0c;带大家打好基础&#xff0c;在每节课后都会有练习题&#xff0c;刚开始的练…

vscode 如何支持点击跳转函数,以C++为例,Python等其它编程语言同理,Visual Studio Code。

VScode(Visual Studio Code)按住Ctrl鼠标左键&#xff0c;没法跳转到对应的函数怎么办。 如下图所示 1、点击有四个小方块的图标 2、输入C&#xff08;如果你的编程语言是C&#xff0c;其它的就输其它的&#xff09; 3、找到C Extension&#xff08;其它编程语言&#xff0…

【包教包会】CocosCreator3.x——重写Sprite,圆角、3D翻转、纹理循环、可合批调色板、不影响子节点的位移旋转缩放透明度

一、效果演示 重写Sprite组件&#xff0c;做了以下优化&#xff1a; 1、新增自变换&#xff0c;在不影响子节点的前提下位移、旋转、缩放、改变透明度 新增可合批调色板&#xff0c;支持色相、明暗调节 新增圆角矩形、3D透视旋转、纹理循环 所有功能均支持合批、原生平台&…

Java八股文(11-29start)

p1 缓存预热也要预热到布隆过滤器.过滤不存在的数据 布隆过滤器需要存储 添加数据的时候进行预热.布隆过滤器里面是位图结构,通过多个hash函数获得下标.改为1. 查询 id进行查询获得对应下标是否为1.可能会出现误判. 判断id是否存在. 穿透就是查询一个不存在的id.一直查询数…

【Gitlab】gitrunner并发配置

并发介绍 涉及到并发控制的一共有4个参数: concurrent , limit ,request_concurrency,parallel 全局的配置: [rootiZ2vc6igbukkxw6rbl64ljZ config]# vi config.toml concurrent 4 #这是一个总的全局控制&#xff0c;它限制了所有pipline&#xff0c;所有runner执行器…

智能运维在配电所设备监控中的应用与洞察

在配电所的设备监控中&#xff0c;智能运维正发挥着越来越重要的作用。通过对配电所内各关键设备的实时监测和数据分析&#xff0c;智能运维系统不仅提高了运维效率&#xff0c;还为我们提供了更深入的设备运行洞察。 一、设备监控概况 配电所内设有多个监测点&#xff0c;包括…

Lumos学习王佩丰Excel第十九讲:Indirect函数

一、认识indirect单元格引用 1、了解Indirect函数的意义及语法 Indirect&#xff1a;引用函数&#xff0c;间接引用。 函数语法&#xff1a;INDIRECT(ref_text,[a1]) 其中&#xff0c;ref_text是一个表示单元格地址或名称的字符串&#xff0c;a1是一个可选的逻辑值参数&…

QT6学习第八天 QFrame 类

QT6学习第八天 QFrame 类族QLabel 标签部件按钮部件QLineEdit 行编辑器部件QAbstractSpinBoxQAbstractSlider 今天来学一学 QFrame 类。 QFrame 类族 QFrame 类是带有边框的部件的基类。它的子类包括常用的标签部件 QLabel、以及 QLCDNumber、QSplitter、QStackedWidget、QToo…

Nginx学习-安装以及基本的使用

一、背景 Nginx是一个很强大的高性能Web和反向代理服务&#xff0c;也是一种轻量级的Web服务器&#xff0c;可以作为独立的服务器部署网站&#xff0c;应用非常广泛&#xff0c;特别是现在前后端分离的情况下。而在开发过程中&#xff0c;我们常常需要在window系统下使用Nginx…

【AI系统】Ascend C 语法扩展

Ascend C 语法扩展 Ascend C 的本质构成其实是标准 C加上一组扩展的语法和 API。本文首先对 Ascend C 的基础语法扩展进行简要介绍&#xff0c;随后讨论 Ascend C 的两种 API——基础 API 和高阶 API。 接下来针对 Ascend C 的几种关键编程对象——数据存储、任务间通信与同步…

java将word docx pdf转换为图片(不需要额外下载压缩包,直接导入maven坐标)

(本代码实现的是将第1页转为图片&#xff0c;主要用于制作文件缩略图) pdf转图片容易 docx转图片麻烦&#xff0c;看其他博客可以直接导入maven坐标&#xff0c;但我知道那是需要付费且有时限的包 本着简单实用的心&#xff0c;我找到法子了 pdf转图片&#xff1a;有库直接转…

工作:三菱PLC防止程序存储器爆满方法

工作&#xff1a;三菱PLC防止程序存储器爆满方法 一、防止程序存储器爆满方法1、编程时&#xff0c;添加行注释时&#xff0c;记得要选“外围”&#xff0c;这样不会占用PLC程序存储器内存&#xff1b;2、选择“外围”的注释&#xff0c;前面会有个*星号&#xff0c;方便检查 二…