​​​​​​​CDP集群安全指南系列文章导读

[一]大数据安全综述

1-认证

身份验证是任何计算环境的基本安全要求。简单来说,用户和服务必须在使用系统功能并获得授权之前,向系统证明其身份(进行身份验证)。身份验证与授权紧密配合,共同保护系统资源。大多数 CDH 组件,包括 Apache Hive、Hue 和 Apache Impala,都可以使用 Kerberos 进行身份验证。MIT ,微软 Active Directory 的 Kerberos ,Redhat的Freeipa实现均可集成用于 Cloudera 集群。

集群如何开启 Active Directory 的 Kerberos认证请参考文章
​​​​​​​CDP集群安全指南-开启Kerberos认证篇(Active Directory)

【为何使用Kerberos】

  • ​​​​​​​避免密码网络传输:Kerberos 通过票据机制避免了用户密码在网络中的传输,降低了密码被截获的风险。这是Kerberos最厉害的机制!!!
  • 双向认证:Kerberos不仅可以验证用户的身份,还验证用户要访问的服务的身份。如A用户访问了hive中a表。Kerberos不仅要认证用户的身份,还要认证hive服务以及hive表存放数据的hdfs服务的身份。这是Kerberos第二最厉害的机制!!!
  • 票据授权&简化用户体验:Kerberos 使用票据(Ticket)机制进行认证,用户在初次登录时获取一个票据,后续访问资源时无需重复输入密码,提高了安全性和便利性。用户只需一次身份验证即可访问多个服务和资源,无需为每个服务重复登录。这不仅提升了用户体验,还减少了密码泄露的风险。
  • 加密通信&防止重放攻击:Kerberos 使用对称密钥加密技术,确保在传输过程中数据的机密性和完整性,防止数据被截获或篡改。票据具有时间限制和唯一性,防止攻击者重放旧的认证请求,增强了系统的安全性。
  • 跨平台支持&与现有系统集成:Kerberos 可以与多种目录服务(如 LDAP、Active Directory)无缝集成,方便在现有基础设施中部署和使用。Kerberos 支持多种操作系统和平台,包括 Windows、Linux、macOS 等,适用于多样化的计算环境。

既然Kerberos很厉害但如hive服务,impala服务为何要配置既支持Kerberos认证又要支持Ldap认证还要配置Ldap认证呢?

Kerberos 和 LDAP 在大数据集群和企业级系统中各自发挥着重要作用,彼此互补。Kerberos 专注于提供强大的认证机制,确保用户和服务的身份真实性;而 LDAP 则负责集中管理用户和组的信息,支持细粒度的授权和访问控制。通过将 Kerberos 与 LDAP 集成,组织可以构建一个全面、安全且高效的身份和访问管理体系,满足复杂的安全需求和业务场景。(LDAP 认证通常更贴近用户的使用习惯,例如在 Web UI 登录或使用 Beeline、Impala 等工具时,通过用户名和密码完成身份验证。此外,LDAP 能提供用户组信息,用于实现更细粒度的权限控制,适应不同的业务需求)。好消息是在AD或Freeipa中无论是Kerberos认证或Ldap认证他们都共享一套用户密码数据库,这方便进行用户管理

集群如何开启 Active Directory 的Ldap认证请参考文章

CDP集群安全指南-开启Ldap认证篇

2-认证-knox

如何你长期管理过CDP集群,你就会发现,一旦集群开启了Kerberos认证,如果有新的用户或者业务要访问集群,新用户或业务所在的服务器也必须被纳入集群的Kerberos认证体系内。如果新业务的服务器处在大数据之外的认证系统里。整个打通过程非常难受。这时你就明白了Knox存在的意义

Apache Knox Gateway 用于帮助 Cloudera 客户确保边界安全。借助 Knox,企业可以放心地将 Hadoop REST API 扩展到新用户,而无需面对 Kerberos 的复杂性,同时仍能保持对企业安全策略的合规性。Knox 为 Hadoop REST API 提供了一个中央网关,支持不同级别的授权、认证、SSL 和单点登录(SSO)功能,从而实现 Hadoop 的单一访问点。

集群如何开启Knox网关请参考:

CDP集群安全指南-开启Knox网关篇

Knox网关如何使用请参考:

CDP集群安全指南-Knox网关的使用(未完成)

3-授权&审计

授权(Authorization)关注的是谁或什么对特定资源或服务具有访问权限或控制权。由于 Hadoop 将多个不同且先前独立的 IT 系统的功能整合为一个企业数据中心,用于存储和处理组织内的所有数据,因此需要多种授权控制,具有不同的细粒度。在这种情况下,Hadoop 管理工具通过以下方式简化了设置和维护:

  • 将所有用户绑定到组,这些组可以在现有的 LDAP 或 AD 目录中指定。
  • 为类似的交互方式(如批处理和交互式 SQL 查询)提供基于角色的访问控制。例如,Apache Ranger 的权限适用于 Hive(HiveServer2)和 Impala。

目前,Cloudera 数据平台(CDP)提供以下形式的访问控制:

  1. 传统的 POSIX 风格权限
    适用于目录和文件,每个目录和文件都分配了一个所有者和一个组,并且每个分配都有一组基本的权限。文件权限包括读取、写入和执行,而目录则额外具有控制子目录访问的权限。

  2. Apache HDFS 的 ACL
    通过允许为特定的命名用户或用户组设置不同的权限,为 HDFS 文件提供细粒度的权限控制。

  3. Apache HBase 的 ACL
    使用 ACL 来授权列、列族和列族限定符的各种操作(如读取、写入、创建和管理)。HBase 的 ACL 可以授予和撤销用户和用户组的权限。

  4. 使用 Apache Ranger 进行的访问控制
    Apache Ranger 提供了一个集中的访问控制框架,支持对多个 Hadoop 组件的细粒度权限管理,确保统一和高效的策略管理。

集群如何开启Ranger授权请参考

CDP集群安全指南-开启Ranger授权和审计篇

如何为Ranger配置Ldap认证以及如何为Usersync组件配置同步Ldap用户请参考

 CDP集群安全指南-开启Ldap认证篇

如何使用ranger请参考

CDP集群安全指南-Ranger的使用(未完成)

4-加密-动态数据

传输层安全协议 (TLS) 是一套行业标准的加密协议,用于保护网络通信的安全。TLS 是从安全套接字层 (SSL) 演变而来的。由于 SSL 的术语仍被广泛使用,Cloudera 的软件和文档中将 TLS 称为 TLS/SSL,但实际上使用的协议是 TLS。Cloudera 软件中并未使用 SSL。

除了 TLS/SSL 加密之外,HDFS 和 HBase 通过远程过程调用 (RPC) 传输数据。为了确保这种传输的安全性,您必须启用 RPC 加密。

如何开启hdfs数据动态加密请参考
CDP集群安全指南-动态数据加密

5-加密-静态数据

简单的说,静态数据就是把数据再数据盘上进行加密,加密后即便数据盘被物理盗取,也无法读取数据内容。Cloudera 集群可以结合使用多种数据静态加密机制,包括 HDFS 透明加密和 Cloudera Navigator Encrypt。这两种数据静态加密机制都可以通过 Ranger KMS 的密钥管理功能进行增强。

如何开启hdfs数据静态加密请参考
CDP集群安全指南-静态数据加密​​​​​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/501752.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Chapter4.2:Normalizing activations with layer normalization

文章目录 4 Implementing a GPT model from Scratch To Generate Text4.2 Normalizing activations with layer normalization 4 Implementing a GPT model from Scratch To Generate Text 4.2 Normalizing activations with layer normalization 通过层归一化(La…

MyBatis-plus sql拦截器

因为业务需求,重新写了一套数据权限。项目中用的是mybtis-plus,正好MyBatis-Plus提供了插件数据权限插件 | MyBatis-Plus,那就根据文档来实现这个需求。 实现: 实现MultiDataPermissionHandler 首先创建MultiDataPermissionHan…

数据挖掘——关联规则挖掘

数据挖掘——关联数据挖掘 关联数据挖掘关联规则关联规则挖掘问题:具体挖掘过程Apriori 产生关联规则 关联数据挖掘 关联分析用于发现隐藏在大型数据集中的令人感兴趣的联系,所发现的模式通常用关联规则或频繁项集的形式表示。 关联规则反映一个事物与…

启航数据结构算法之雅舟,悠游C++智慧之旅——线性艺术:顺序表之细腻探索

人无完人,持之以恒,方能见真我!!! 共同进步!! 文章目录 一、线性表的概念二、顺序表1.概念与结构2.顺序表的分类静态顺序表动态顺序表 三、顺序表的实现1.顺序表的结构2.顺序表的初始化和销毁初…

数据库进阶教程之DDL语句(万字详解)

文章目录 一、数据库操作-上1.1、DDL概述1.2、创建数据库1.3、查看数据库 二、数据库操作-下2.1、修改数据库2.2、删除数据库2.3、使用数据库 三、数据库表操作-上3.1、创建表3.2、数据类型(mysql)3.3、查看表 四、数据库表操作-中4.1、快速建表4.2、删除…

自动驾驶三维重建

大概八成估计是未来的科研方向了 文章目录 自动驾驶中的NeRF[4]CLONeR:Urban Radiance Fields[6]S-NERFBlock-NeRFSwitch-NeRFSceneRFBehind the Scenes 大规模与自动驾驶场景重建:3D高斯VastGaussianPeriodic Vibration Gaussian(复旦大学)…

OWASP ZAP之API 请求基础知识

ZAP API 提供对 ZAP 大部分核心功能的访问,例如主动扫描器和蜘蛛。ZAP API 在守护进程模式和桌面模式下默认启用。如果您使用 ZAP 桌面,则可以通过访问以下屏幕来配置 API: Tools -> Options -> API。 ZAP 需要 API 密钥才能通过 REST API 执行特定操作。必须在所有 …

【小程序开发】- 小程序版本迭代指南(版本发布教程)

一,版本号 版本号是小程序版本的标识,通常由一系列数字组成,如 1.0.0、1.1.0 等。版本号的格式通常是 主版本号.次版本号.修订号 主版本号:当小程序有重大更新或不兼容的更改时,主版本号会增加。 次版本号&#xff1a…

电子应用设计方案85:智能 AI门前柜系统设计

智能 AI 门前柜系统设计 一、引言 智能 AI 门前柜系统旨在提供便捷、安全和智能的物品存储与管理解决方案,适用于家庭、公寓或办公场所的入口区域。 二、系统概述 1. 系统目标 - 实现无接触式物品存取,减少交叉感染风险。 - 具备智能识别和分类功能&am…

CG顶会论文阅读|《科技论文写作》硕士课程报告

文章目录 一、基本信息1.1 论文基本信息1.2 课程基本信息1.3 博文基本信息 二、论文评述(中英双语)2.1 研究问题(Research Problem)2.2 创新点(Innovation/Contribution)2.3 优点(Why this pape…

Deepseek v3 的笔记

基本概述 Deepseek v3是Deepseek发布的旗舰模型,属于607B的混合专家(MoE)模型,其中活跃参数为37B。在当前的模型领域,它堪称最佳的开源模型,性能超越了Llama 3.1 405b、Qwen和Mistral等知名模型。根据基准…

基于单片机的家庭智能垃圾桶(论文+源码)

1系统整体方案设计 本次课题为基于单片机的家庭智能垃圾桶,在此将目标功能设计如下: (1)实现垃圾桶的智能开关盖当检测到有人停留三秒以上自动开启,并当人走后自动关闭开关盖; (2&#xff0…

Niushop商城商业插件_cps联盟_包装转换_视频购物_同城配送_上门预约等插件的安装方法

一.简介 使用Niushop已经多年,积累下很多有用的常识,有人让我评价下这个系统!怎么说呢!系统是好系统因为它开源!且更新也很及时几乎是一周一更新,开发团队也很尽职,在用户群内得到很高的评价&am…

一文讲清楚HTTP常见的请求头和应用

文章目录 一文讲清楚HTTP常见的请求头和应用1. 啥是个HTTP请求头2. 常见的请求头,作用和示例3.协商缓存4.会话状态 一文讲清楚HTTP常见的请求头和应用 1. 啥是个HTTP请求头 一句话,说白了就是限定HTTP传输的一些规则参数,比如Accept&#xf…

vim 的基础使用

目录 一:vim 介绍二:vim 特点三:vim 配置四:vim 使用1、vim 语法格式2、vim 普通模式(1)保存退出(2)光标跳转(3)文本删除(4)文本查找&…

RocketMQ面试题:进阶部分

🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/?__c1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,精通Java编…

设计模式之桥接设计模式

简介 与适配器模式类似,桥接设计模式也是结构型模式将抽象部分与实现部分分离,使它们都可以独立的变化通俗来说,是通过组合来桥接其它的行为/维度 应用场景举例 传统方式 使用桥接设计模式之后 编码示例 /*** 抽象角色:手机*/ …

个人健康信息系统|Java|SSM|VUE| 前后端分离

【技术栈】 1⃣️:架构: B/S、MVC 2⃣️:系统环境:Windowsh/Mac 3⃣️:开发环境:IDEA、JDK1.8、Maven、Mysql5.7 4⃣️:技术栈:Java、Mysql、SSM、Mybatis-Plus、VUE、jquery,html 5⃣️数据库可…

个人交友系统|Java|SSM|JSP|

【技术栈】 1⃣️:架构: B/S、MVC 2⃣️:系统环境:Windowsh/Mac 3⃣️:开发环境:IDEA、JDK1.8、Maven、Mysql5.7 4⃣️:技术栈:Java、Mysql、SSM、Mybatis-Plus、JSP、jquery,html 5⃣️数据库可…

每天40分玩转Django:Django Celery

Django Celery 一、知识要点概览表 模块知识点掌握程度要求Celery基础配置、任务定义、任务执行深入理解异步任务任务状态、结果存储、错误处理熟练应用周期任务定时任务、Crontab、任务调度熟练应用监控管理Flower、任务监控、性能优化理解应用 二、基础配置实现 1. 安装和…