Hadoop的安装和使用

Hadoop的安装和使用

news/2024/11/27 11:10:54/文章来源:https://blog.csdn.net/qq_73340809/article/details/142423650

1. Hadoop简介

Hadoop是一个能够对大量数据进行分布式处理的软件框架，并且是以一种可靠、高效、可伸缩的方式进行处理的，它具有以下几个方面的特性。

高可靠性。
高效性。
高可扩展性。
高容错性。
成本低。
运行在Linux平台上。
支持多种编程语言。

2. 分布式文件系统HDFS

简介

Hadoop分布式文件系统（Hadoop Distributed File System，HDFS）是Hadoop项目的两大核心之一，是针对谷歌文件系统（Google File System，GFS）的开源实现。
总体而言，HDFS要实现以下目标：

兼容廉价的硬件设备。
流数据读写。
大数据集。
简单的文件模型。
强大的跨平台兼容性。

体系结构

HDFS采用了主从（Master/Slave）结构模型，一个HDFS集群包括一个名称节点和若干个数据节点。

安装

Hadoop包括三种安装模式：

单机模式：只在一台机器上运行，存储是采用本地文件系统，没有采用分布式文件系统HDFS；
伪分布式模式：存储采用分布式文件系统HDFS，但是，HDFS的名称节点和数据节点都在同一台机器上；
分布式模式：存储采用分布式文件系统HDFS，而且，HDFS的名称节点和数据节点位于不同机器上。
这里介绍Hadoop伪分布式模式的安装方法。

3. Hadoop的安装

4. HDFS的基本使用方法

1>使用WEB管理页面操作HDFS

首先启动Hadoop，然后可以在浏览器中输入“http://localhost:9870”，就可以访问Hadoop的WEB管理页面
在WEB管理页面中，点击顶部右侧的菜单选项“Utilities”，在弹出的子菜单中点击“Browse the file system”，会出现HDFS文件系统操作页面，在这个页面中可以创建、查看、删除目录和文件。

2>使用命令操作HDFS

除了在浏览器中通过WEB方式操作HDFS以外，还可以在cmd窗口中使用命令对HDFS进行操作。
首先，创建一个名称为“user”的目录，命令如下：

cd c:\hadoop-3.1.3\bin
hadoop fs -mkdir hdfs://localhost:9000/user/
hadoop fs -mkdir hdfs://localhost:9000/user/xiaoming

然后，在“C:\”下创建一个文件test.txt，里面输入一行语句“I love hadoop”，使用如下命令把该文件上传到HDFS中：

hadoop fs -put C:\test.txt hdfs://localhost:9000/user/xiaoming
使用如下命令查看HDFS中的目录和文件：
hadoop fs -ls hdfs://localhost:9000/user/xiaoming

使用如下命令把HDFS中的文件内容显示到本地屏幕上：
hadoop fs -cat hdfs://localhost:9000/user/xiaoming/test.txt

把上面的HDFS中的文件test.txt下载到本地文件系统，并重命名为test1.txt：

hadoop fs -get hdfs://localhost:9000/user/xiaoming/test.txt C:\test1.txt

使用如下命令删除HDFS中的一个文件：

hadoop fs -rm hdfs://localhost:9000/user/xiaoming/test.txt

使用如下命令删除HDFS中的一个目录及其下面的文件：

hadoop fs -rm -r hdfs://localhost:9000/user/xiaoming

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/429621.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

表观组学分析丨杰青博导团队为您提供完整的基因功能分析解决方案

表观组学分析丨杰青博导团队为您提供完整的基因功能分析解决方案

文库构建蛋白表达亲和纯化测序分析

阅读更多...

【计算机网络 - 基础问题】每日 3 题（十八）

【计算机网络 - 基础问题】每日 3 题（十八）

✍个人博客：Pandaconda-CSDN博客 📣专栏地址：http://t.csdnimg.cn/fYaBd 📚专栏简介：在这个专栏中，我将会分享 C 面试中常见的面试题给大家~ ❤️如果有收获的话，欢迎点赞👍收藏&…

阅读更多...

数据结构：二叉树（一）

数据结构：二叉树（一）

ps：偷懒了几天，接着更新树的概念树是一种非线性的数据结构，它是由n（n>0）个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的…

阅读更多...

独立站冷启动SOP之市场和竞品调研1.0丨出海笔记

独立站冷启动SOP之市场和竞品调研1.0丨出海笔记

大家好，我是出海笔记Club的创始人Alan，过去半年我们做了15期的操盘手面对面，主要围绕的是跨境电商独立站的冷启动，基本上大部分方法和路径我们都覆盖到了。我把目的，调研内容和可以使用的工具都罗列出来，…

阅读更多...

Java继承教程！(o|o)

Java继承教程！(o|o)

Java 继承 Java面向对象设计 - Java继承子类可以从超类继承。超类也称为基类或父类。子类也称为派生类或子类。从另一个类继承一个类非常简单。我们在子类的类声明中使用关键字extends，后跟超类名称。 Java不支持多重继承的实现。 Java中的类不能有多个超类。…

阅读更多...

CVE-2024-46101

CVE-2024-46101

前言自己挖的第一个CVE~ 喜提critical 这里简单说一下。漏洞简介 GDidees CMS < 3.9.1 的版本，存在一个任意文件上传漏洞。允许登录后的攻击者上传webshell获得网站的权限。影响版本： GDidees CMS < 3.9.1 （其它的我没测。。&am…

阅读更多...

专题七_分治_快排_归并_算法专题详细总结

专题七_分治_快排_归并_算法专题详细总结

目录分治一、分治思想的概念二、分治思想的步骤 1. 颜⾊分类（medium） 解析： 2. 快速排序（medium） 解析： 总结： 3. 快速选择算法（medium） 解析： …

阅读更多...

xinference linux系统下部署

xinference linux系统下部署

1.创建虚拟环境 conda create -n xinfer pyrhon3.10 2.使用虚拟环境 conda activate xinfer (xinfer) roothome:~$ python -V Python 3.10.14 3.pip安装环境 pip install "xinference[all]" 4.启动服务 nohup xinference-local --host 0.0.0.0 --port 9997 &…

阅读更多...

认识结构体

认识结构体

目录一.结构体类型的声明 1.结构的声明 2.定义结构体变量 3.结构体变量初始化 4.结构体的特殊声明二.结构体对齐(重点难点) 1.结构体对齐规则 2.结构体对齐练习 (一)简单结构体对齐 (二)嵌套结构体对齐 3.为什么存在内存对齐 4.修改默认对齐数三.结构体传参 1…

阅读更多...

python新手的五个练习题

python新手的五个练习题

代码 # 1. 定义一个变量my_Number,将其设置为你的学号，然后输出到终端。 my_Number "20240001" # 假设你的学号是20240001 print("学号:", my_Number) # 2. 计算并输出到终端:两个数(例如3和5)的和、差、乘积和商。 num1 3 num2 5 print(&…

阅读更多...

nacos适配人大金仓的数据库

nacos适配人大金仓的数据库

前言在微服务架构中，服务发现和配置管理是关键组件。Nacos作为一个动态服务发现和配置管理平台，支持多种数据库作为其后端存储。本文将探讨如何在Nacos中适配人大金仓数据库，以及在此过程中的最佳实践。 Nacos简介 Nacos（Nami…

阅读更多...

安卓数据存储——SharedPreferences

安卓数据存储——SharedPreferences

共享参数 SharedPreferences 1、sharedPreferences是Android的一个轻量级存储工具，采用的存储结构是key - value的键值对方式 2、共享参数的存储介质是符合XML规范的配置文件。保存路径是：/data/data/应用包名/shared_prefs/文件名.xml 使用场景&…

阅读更多...

[Python学习日记-26] Python 中的文件操作

[Python学习日记-26] Python 中的文件操作

[Python学习日记-26] Python 中的文件操作简介操作模式循环文件其他功能混合模式修改文件简介在 Python 中的文件操作其实和我们平时使用的 Word 的操作是比较类似的，我们先说一下 Word 的操作流程，流程如下： 找到文件&#x…

阅读更多...

LeetCode题练习与总结：回文链表--234

LeetCode题练习与总结：回文链表--234

一、题目描述给你一个单链表的头节点 head ，请你判断该链表是否为回文链表。如果是，返回 true ；否则，返回 false 。示例 1： 输入：head [1,2,2,1] 输出：true示例 2： 输入&#x…

阅读更多...

【笔记】第三节组织与性能

【笔记】第三节组织与性能

3.1 基本成分 3.2 微观组织特征 0.6-0.8C%碳素钢的组织为珠光体和少量的铁素体。如何把组织和性能联系起来？德国克虏伯公司的研究——珠光体片间距与渗碳体片层厚度成比例： t s 0 ( ρ 15 ( C % ) − 1 ) ts_0(\frac{\rho}{15(C\%)}-1) ts0(15(C%)…

阅读更多...

go的结构体、方法、接口

go的结构体、方法、接口

结构体： 结构体：不同类型数据集合结构体成员是由一系列的成员变量构成，这些成员变量也被称为“字段” 先声明一下我们的结构体： type Person struct {name stringage intsex string } 定义结构体法1： var p1 P…

阅读更多...

谷歌收录批量查询，怎么查看批量查询谷歌收录情况

谷歌收录批量查询，怎么查看批量查询谷歌收录情况

在SEO（搜索引擎优化）领域，确保网站内容被谷歌等搜索引擎有效收录是提升网站可见性和流量的关键步骤。批量查询谷歌收录情况，能够帮助网站管理员快速了解哪些页面已被搜索引擎识别并编入索引，哪些页面可能存在问题需要优…

阅读更多...

SpringBoot项目License证书生成与验证(TrueLicense) 【记录】

SpringBoot项目License证书生成与验证(TrueLicense) 【记录】

SpringBoot项目License证书生成与验证(TrueLicense) 【记录】在非开源产品、商业软件、收费软件等系统的使用上，需要考虑系统的使用版权问题，不能随便一个人拿去在任何环境都能用。应用部署一般分为两种情况： 应用部署在开发者自己的云服务…

阅读更多...

变电站缺陷数据集8307张，带xml标注和txt标注，可以直接用于yolo训练

变电站缺陷数据集8307张，带xml标注和txt标注，可以直接用于yolo训练

变电站缺陷数据集8307张， 带xml标注和txt标注，可以直接用于yolo训练，赠附五个脚本变电站缺陷数据集数据集概述变电站缺陷数据集是一个专门针对变电站设备和环境缺陷检测的图像数据集。该数据集包含了8307张经过标注的图像，旨…

阅读更多...

Java 入门指南：JVM（Java虚拟机）垃圾回收机制 —— 垃圾收集器

Java 入门指南：JVM（Java虚拟机）垃圾回收机制 —— 垃圾收集器

文章目录垃圾回收机制Stop-the-World垃圾收集器垃圾收集器分类Serial 收集器Serial Old 收集器ParNew 收集器Parallel Scavenge 收集器Parallel Old 收集器CMS 收集器CMS 收集器缺点 G1 收集器G1 收集器特点G1 收集器的分代理念G1 收集器运作过程垃圾回收机制垃圾回收&…

阅读更多...

最新文章

推荐文章