搭建hadoop集群的常见问题及解决办法

问题一: namenode -format重复初始化

出现问题的原因是重复初始化时会重新生成集群ID,而dn还是原先的集群ID,两者不匹配时无法启动相应的dn进程。
怎么查找问题原因:在logs目录下找到对应节点的.log文件,使用tail -200 文件名来查看日志信息。
解决办法1:修改data/name/路径下的version文件中的集群ID为老的集群ID,事实修改后仍然报错,初始化不只是集群ID不一致,建议使用方法2:。
解决办法2:删除hadoop文件中的data文件和logs文件。

问题二:免密登录配置出错,permission denied没有权限;拒绝访问

重新使用加密算法生成公钥私钥,并将公钥发送给相应的主机。

  1. ssh-keygen -t rsa
  2. ssh-copy-id hadoop10xxx

常用的端口号

rpc内部通信http外部web端口
namenode802050070 / 9870
mapreduce80888088
历史服务器1988819888

集群的时间同步

  • 有网络的情况
    • systemctl start ntpd:开启网络时间同步
    • systemctl status ntpd : 查看开启状态
  • 没有外部网络的情况
    • sudo vim /etc/ntp.conf:设置102作为基准服务器
    • ntpdate hadoop102: 向102发送请求同步时间
    • sudo crontab -e: 设置定时任务

HDFS文件系统

概述

全称为Hadoop distributed file system, 是一个分布式文件系统,通过目录树来定位文件。适合一次写入,多次读出的场景。一个文件经过创建、写入和关闭之后就不能改变

  1. 优点:
    • 高容错性:通过增加副本的形式,提高容错性;副本丢失后会自动补全
    • 适合处理大数据:数据规模达到PB级别,文件数量达到9亿个
    • 可以构建在廉价机器上
  2. 缺点:
    • 不适合低延时数据访问,比如毫秒级的存储数据。
    • 无法高效对大量小文件进行存储,小文件存储的寻址时间超过了读取时间
    • 不支持并发写入,文件随机修改。仅支持数据的追加,不支持随机修改

组成架构

在这里插入图片描述

  1. NameNode:主管
    • 管理HDFS的名称空间
    • 配置副本策略
    • 管理数据块映射信息
    • 处理客户端读写请求
  2. DataNode: 工人
  3. Client:客户端
    • 文件切分,上传之前就切分。
      • 如果上传后切分,有可能存不下
      • 上传后切分,有三个备份,需要多切几次。
    • 管理HDFS,如namenode格式化
  4. SecondaryNameNode:辅助NameNode,并非热备。

文件块大小

由磁盘的传输速率决定,由于目前磁盘的传输速率为100M/s,按照程序员的进制进行整数转换为2进制则为128。

根据专家的结论:寻址时间为传输时间的1%时,是最佳状态。

  1. 文件块太小会增加寻址时间
  2. 文件块太大,磁盘传输数据的时间会明显大于定位这个块开始位置所需的时间。大于1%这个最佳状态。

hdfs文件操作系统的常用命令

  • hadoop fs 等价于 hdfs dfs
  • 上传文件到hdfs文件系统
    • hadoop fs -copyFromLocal caocao.txt /sanguo : 上传
    • hadoop fs -moveFromLocal liubei.txt /sanguo:上传后删除
    • hadoop fs -put sunquan.txt /sanguo:上传
    • hadop fs appendToFIle sunquan.txt /sanguo/liubei.txt:追加文件内容
  • 从hdfs文件系统下载文件到本地
    • hadoop fs -copyToLocal /sanguo/liubei.txt ./:拷贝下载
    • hadoop fs -get /README.txt ./: 拷贝下载
    • hadoop fs moveToLocal: 剪切到本地,暂时没有实现
  • hadoop fs -ls /sanguo: 查询文件列表
  • hadoop fs -cat /sanguo/caocao.txt: 查看文件内容
  • hadoop fs -chmod 77 /sanguo/caocao.txt: 修改文件权限
  • hadoop fs -du /sanguo: 查询文件夹下的文件的大小
  • hadoop fs -setrep 10 /sanguo/caocao.txt:设置副本数量

HDFS的API操作

IDEA常用快捷键

  1. 双击shift : 搜索框
  2. ctrl + h: 查询当前类的父子关系
  3. ctrl + F12: 查询当前类的所有方法
  4. ctrl+p: 显示方法的形参列表
  5. ctrl+alt+f:快速将局部变量提升为全局变量

配置文件优先级

  1. 代码中的conf.set
  2. resources目录下的xxx-site.xml配置文件
  3. jar包中的xxx-default.xml配置文件

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/125480.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

远程工作面试:特殊情况下的面试技巧

🌷🍁 博主猫头虎(🐅🐾)带您 Go to New World✨🍁 🦄 博客首页——🐅🐾猫头虎的博客🎐 🐳 《面试题大全专栏》 🦕 文章图文…

Web3 solidity编写cancelorder取消订单函数 并梳理讲述逻辑

上文 Web3 solidity订单池操作 中 我们讲述了订单池的基本概念 并手动编写了创建订单的操作 最近的 我们还是先将 ganache 环境起起来 然后 我们打开项目 上文中 我们写了makeOrder创建订单的函数 但是 也带出一个问题 我们创建之后 如果不要了 怎么干掉呀? js中我…

MongoDB常用的比较符号和一些功能符号

比较符号 results collection.find({age: {$gt: 20}})功能符号 results collection.find({name: {$regex: ^M.*}})

电水壶上要求亚马逊美国站SOR/2016-181和CSA22.1标准?

电水壶作为一种常见的小家电,受到了广大消费者的喜爱。然而,由于安全问题的日益重视,亚马逊加拿大站决定加强对电水壶产品的审核,以确保消费者的安全和权益。 近日,亚马逊平台发布公告,要求在加拿大站销售…

鸿蒙应用程序入口UIAbility详解

一、UIAbility概述 UIAbility是一种包含用户界面的应用组件,主要用于和用户进行交互。UIAbility也是系统调度的单元,为应用提供窗口在其中绘制界面。每一个UIAbility实例,都对应于一个最近任务列表中的任务。一个应用可以有一个UIAbility&am…

java从入门到起飞(八)——循环和递归

文章目录 Java循环1. 什么是循环?1.1 为什么需要循环?1.2 循环的分类 2. Java中的循环结构2.1 for循环2.2 while循环2.3 do-while循环 3. 循环控制语句3.1 break语句3.2 continue语句 4. 总结 Java递归1. 什么是递归2. 递归的原理3. 递归的实现4. 递归的…

【二分答案 dp】 Bare Minimum Difference

分析: 首先我们能够得知这个优秀值具有单调性: 如果一个优秀值 x 1 x1 x1能够满足题目要求,那么任何 x ( x > x 1 ) x(x>x1) x(x>x1)显然都能符合要求 基于这一特性,我们想到二分答案 直接二分这个答案好像难以维护。 …

Php“梦寻”淘宝天猫商品详情数据接口,淘宝商品详情数据API接口,淘宝API接口申请指南(含代码示例)

淘宝商品详情接口 API 是开放平台提供的一种 API 接口,它可以帮助开发者获取淘宝商品的详细信息,包括商品的标题、描述、图片等信息。在淘宝电商平台的开发中,淘宝详情接口 API 是非常常用的 API,因此本文将详细介绍淘宝详情接口 …

【笔试强训选择题】Day37.习题(错题)解析

作者简介:大家好,我是未央; 博客首页:未央.303 系列专栏:笔试强训选择题 每日一句:人的一生,可以有所作为的时机只有一次,那就是现在!! 文章目录 前言一、Day…

macbookpro怎么删除软件没有鼠标

macbookpro怎么删除软件没有鼠标,macbookpro触摸板可以替代鼠标进行操作。左右键功能与鼠标相同,可用于执行删除操作。此外,还可以利用键盘上的Delete键来删除选中的文件。 删除软件方法 方法1、打开应用程序,键盘按住control,加点…

Android Automotive编译

系统准备 安装系统 准备一台安装Ubuntu系统的机器(windows系统的机器可以通过WSL安装ubuntu系统) 安装docker 本文使用docker进行编译,因此提前安装docker。参考网络链接安装docker并设置为不使用sudo进行docker操作。 参考链接&#xff…

E5071C是德科技网络分析仪

描述 E5071C网络分析仪提供同类产品中最高的RF性能和最快的速度,具有宽频率范围和多功能。E5071C是制造和R&D工程师评估频率范围高达20 GHz的RF元件和电路的理想解决方案。特点: 宽动态范围:测试端口的动态范围> 123 dB(典型值)快速测量速度:41毫秒全2端口…

什么是IIFE(Immediately Invoked Function Expression)?它有什么作用?

聚沙成塔每天进步一点点 ⭐ 专栏简介⭐IIFE 的基本语法⭐IIFE 的主要作用⭐如何使用 IIFE 来创建私有变量和模块封装⭐ 写在最后 ⭐ 专栏简介 前端入门之旅:探索Web开发的奇妙世界 记得点击上方或者右侧链接订阅本专栏哦 几何带你启航前端之旅 欢迎来到前端入门之旅…

界面控件DevExpress WinForms工具栏菜单组件,模拟流行办公软件!

DevExpress WinForms的工具栏和菜单组件灵感来自于Microsoft Office,并针对WinForms开发人员进行了优化,可以帮助开发者快速模拟当下流行的办公软件应用程序。 DevExpress WinForms有180组件和UI库,能为Windows Forms平台创建具有影响力的业…

Matlab(画图进阶)

目录 大纲 1.特殊的Plots 1.1 loglog(双对数刻度图) ​1.3 plotyy(创建具有两个y轴的图形) 1.4yyaxis(创建具有两个y轴的图) 1.5 bar 3D条形图(bar3) 1.6 pie(饼图) 3D饼图 1.7 polar 2.Stairs And Ste阶梯图 3.Boxplot 箱型图和Error Bar误差条形图 3.1 boxplot 3.2 …

ASP.NET Core 中的 MVC架构

MVC 架构 MVC架构把 App 按照逻辑分成三层: Controllers,接收 http request,配合 model,通过http response 返回 view,尽量不做别的事Models, 负责业务逻辑,App 的状态,以及数据处理Views&…

借助AI分析哥斯拉木马原理与Tomcat回显链路挖掘

前言 本次分析使用了ChatGPT进行辅助分析&#xff0c;大大提升了工作效率&#xff0c;很快就分析出木马的工作流程和构造出利用方式。 分析 首先对该木马进行格式化,以增强代码的可读性。得到如下代码 <jsp:root xmlns:jsp"http://java.sun.com/JSP/Page" vers…

如何解决前端传递数据给后端时精度丢失问题

解决精度丢失 有时候我们在进行修改操作时&#xff0c;发现修改既不报错也不生效。我们进行排查后发现服务器端将数据返回给前端时没有出错&#xff0c;但是前端js将数据进行处理时却出错了&#xff0c;因为id是Long类型的&#xff0c;而js在处理后端返回给前端的Long类型数据…

职责链设计模式

职责链模式又叫命令链、CoR、Chain of Command、Chain of Responsibility。 该模式允许你将请求沿着处理者链进行发送&#xff0c;使多个对象都可以处理请求&#xff0c;每个对象有权决定处理或传递给下个节点。 客户端&#xff1a;用来定义职责链条。 处理者&#xff1a;声明…

OpenCV 07(图像滤波器)

一、卷积 什么是图片卷积? 图像卷积就是卷积核在图像上按行滑动遍历像素时不断的相乘求和的过程 步长 步长就是卷积核在图像上移动的步幅. 上面例子中卷积核每次移动一个像素步长的结果, 如果将这个步长修改为2, 结果会如何? 为了充分扫描图片, 步长一般设为1. padding …