DataLight(V1.4.5) 版本更新,新增 Ranger、Solr

DataLight(V1.4.5) 版本更新,新增 Ranger、Solr

DataLight 迎来了重大的版本更新,现已发布 V1.4.5 版本。本次更新对平台进行了较多的功能拓展和优化,新增了对 Ranger 和 Solr 服务组件的支持,同时对多项已有功能进行了改进,旨在提升更好的使用体验。

一. 更新日志

  • 新增 SOLR 服务:

    • 支持 Solr 服务的部署与维护,为用户提供强大的全文搜索和索引功能,方便对大数据集进行高效检索。
  • 新增 RANGER 服务:

    • 支持 RangerAdmin、RangerUserSync、RangerTagSync 的部署与管理,实现集中的权限控制和安全审计。

新增 RANGER 插件:

  • RANGER-HDFS 插件:
    • 支持文件和目录级别的权限控制。
    • 提供详细的访问审计日志,满足合规性要求。
  • RANGER-YARN 插件:
    • 管理作业提交和队列级别的访问权限。
    • 防止资源滥用,确保资源的公平分配和安全性。
  • RANGER-HBASE 插件:
    • 实现表、列族、列级别的权限管理。
    • 保障数据的读写安全,防止未经授权的操作。
  • RANGER-KAFKA 插件:
    • 设置主题和消费组的访问权限。
    • 保护消息的生产和消费环节,确保数据传输安全。
  • RANGER-HIVE 插件:
    • 提供行、列、单元格级别的访问控制。
    • 具备数据脱敏功能,保护敏感信息。
  • RANGER-SOLR 插件:
    • 控制查询和索引的访问权限。
    • 防止未经授权的搜索和数据泄露。
  • 优化日志管理的滚动效果:

    新增用户身份判定机制,解决了除 root 用户外其他普通用户无法登录的问题,提升了系统的安全性和用户友好性。

  • 优化配置文件联动机制:

    当 Ranger 服务部署或发生变动时,系统将自动联动修改相关服务的配置文件,减少手动操作的繁琐,降低错误发生的可能性。

  • 新增脚本耗时显示:

    在执行 datalight.sh 操作 Master 和 Worker 进程时,增加了耗时打印功能,方便用户了解操作执行时间,优化性能调试流程。

二. 部分更新内容预览

2.1 新增 Ranger、Solr 服务

2.2 RangerAdmin

提供友好的 Web 界面,可以方便地创建、修改和查看权限策略。

2.3 RangerUserSync

支持从 LDAP、Active Directory 或本地 Unix 系统同步用户和组信息,确保权限管理的准确性和同步性。

2.4 SolrServer

支持 Solr 集群部署,提供容错和负载均衡能力,且支持全文检索、模糊查询、范围查询等多种查询方式,满足多样化的业务需求。

2.5 一键启用、禁用 Ranger 插件

在 DataLight 平台上,可以一键启用或禁用各服务的 Ranger 插件,灵活控制权限管理功能。

2.6 Ranger 插件审计

详细记录各服务的访问和操作日志,帮助管理员监控用户行为,防范安全风险。

2.7 Ranger 插件状态

在平台上查看各 Ranger 插件的运行状态,及时发现和处理异常情况,保障系统稳定运行。

2.8 优化脚本耗时显示

增加了 datalight.sh 脚本操作过程的耗时打印,帮助用户分析和优化系统性能,提升运维效率。

三. 如何增量更新到 1.4.5 版本

我们提供了详细的升级指南,帮助您顺利将现有的 DataLight 平台更新到最新版本。

3.1 停止 Master/Worker进程

进入主节点,在所有服役的节点上,执行以下命令,停止并删除所有节点上的 Master、Worker 进程:

# 停止 Master 进程
/opt/datalight/bin/datalight.sh stop master# 停止 Worker 进程
/opt/datalight/bin/datalight.sh stop worker# 删除原有的 Master、Worker Jar 包
rm -rf /opt/datalight/app/*.jar

注:Master 进程所在节点称之为主节点,下同

3.2 更新主包

前往百度网盘,下载如下内容,获取最新的主程序包。

下载完成后,将新包覆盖至 /opt/datalight 目录下,替换原有文件。

3.3 更新插件包

前往百度网盘,下载如下插件包内容,将其覆盖更新至 /opt/datalight/plugins 目录下的相应位置,确保插件版本与主程序一致。

3.4 手动分发到所有节点

将更新后的 DataLight 目录从 主节点 推送至所有 从节点。可以使用 scp 或其他同步命令进行分发。例如,将更新内容推送至节点 node02

# 以推送至 node02 节点为例
scp -r /opt/datalight node02:/opt

3.6 重新启动 Master 进程

进入主节点,通过以下命令启动 Master 进程,Master 进程重启后,稍等片刻,Master 将自动拉起所有节点上的 Worker 进程。

/opt/datalight/bin/datalight.sh start master 8001

四. Ranger 的功能与场景

DataLight 平台现已支持与 Ranger 深度集成,实现对各大数据组件的统一权限管理和安全审计。

  • 4.1 Ranger 与 HDFS

    使用场景:数据分层存储

    在一个企业数据湖中,不同部门需要访问不同的数据集。Ranger 可以为每个部门设置特定的文件夹权限:

    • 场景: 财务部门需要访问财务报告,但不应该访问研发数据。
    • 解决方案: 使用 Ranger 创建规则,只允许财务部门的用户组访问 /data/finance 目录,而 /data/research 只能由研发部门访问。
    • 好处: 确保数据隔离,防止敏感信息泄露。

    4.2 Ranger 与 YARN

    使用场景:资源公平调度

    在共享计算资源的环境中,确保不同用户的公平使用:

    • 场景: 数据科学团队和营销团队共享一个 YARN 集群。
    • 解决方案: 通过 Ranger 限制每个团队提交的作业数量和资源使用量。
    • 好处: 防止某一团队过度占用资源,提升整体资源利用率。

    4.3 Ranger 与 HBase

    使用场景:客户数据保护

    公司需要存储和处理敏感的客户信息,确保数据安全:

    • 场景: 客户服务团队需要访问客户联系信息,但不应查看财务数据。
    • 解决方案: 使用 Ranger 在 HBase 中设置列级权限,允许访问 contact_info 列族,而限制 financial_data
    • 好处: 保护敏感数据,符合隐私法规要求。

    4.4 Ranger 与 Hive

    使用场景:敏感数据分析

    在执行大规模数据分析时,保护敏感数据:

    • 场景: 分析师需要访问销售数据进行趋势分析,但不应查看具体客户信息。
    • 解决方案: 在 Hive 中设置列级权限,允许访问销售数据列,但限制客户信息列。
    • 好处: 保证分析的同时,保护个人隐私。

    4.5 Ranger 与 Kafka

    使用场景:日志数据流管理

    管理跨部门的日志数据流:

    • 场景: 安全团队和开发团队需要访问不同的日志数据。
    • 解决方案: 使用 Ranger 设置 Kafka 主题权限,安全团队可以访问 security_logs 主题,而开发团队访问 app_logs
    • 好处: 确保数据流的安全性和隐私性。

    4.6 Ranger 与 Solr

    使用场景:搜索查询控制

    在企业搜索平台中,管理不同用户的查询权限:

    • 场景: 员工可以搜索公共文档,但只有人力资源可以搜索员工记录。
    • 解决方案: 使用 Ranger 控制 Solr 查询权限,限制员工只能搜索公共索引。
    • 好处: 防止敏感信息泄露,确保合规性。

关注我们,获取更多最新资讯。

一起见证数据世界的无限可能!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/434982.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Oracle 配置恢复目录catalog

一.介绍 Oracle中使用RMAN备份的数据我们分为两类 RMAN知识库数据库的数据块 Oracle默认把 RMAN知识库 放在目标数据库的控制文件中,在以后进行恢复的时候 我们要先读知识库的信息然后才能恢复。 但这样就产生了一个问题,知识库放在了控制文件上&#xf…

【C++】set与map

目录 一、预备知识: 1、关联式容器: 2、键值对: 3、树形结构的关联式容器: 二、set: 1、set的介绍: 2、使用: 1、set的构造: 2、set的各种功能: 3、multiset 三…

AOP-代理实现

三种代理实现 1 JDK动态代理实现-基于接口代理 2 CGLIB动态代理实现-基于类代理 3 AspectJ 适配实现 为什么Proxy.newProxyInstance 会生成新的字节码? 创建代理类: Proxy.newProxyInstance 首先会检查缓存中是否有已存在的代理类字节码。 如果没有&…

计算机毕业设计 C语言学习辅导网站的设计与实现 Java实战项目 附源码+文档+视频讲解

博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。CSDN、掘金、华为云、InfoQ、阿里云等平台优质作者✌ 🍅文末获取源码联系🍅 👇🏻 精…

14.安卓逆向-frida基础-编写hook脚本2

免责声明:内容仅供学习参考,请合法利用知识,禁止进行违法犯罪活动! 内容参考于:图灵Python学院 本人写的内容纯属胡编乱造,全都是合成造假,仅仅只是为了娱乐,请不要盲目相信。 工…

16. C++ TinyWebServer项目总结(16. 服务器调制、调试和测试)

主要包括: 使用 tcpdump 抓包;使用 gdb 调试器;使用压力测试工具,模拟现实世界中的高并发请求,测试服务器在高压状态下的稳定性。 最大文件描述符数 Linux 对应用进程能打开的最大文件描述符数量有两个层次的限制&a…

node的版本管理工具volta

安装方式 # mac curl https://get.volta.sh | bash # Windows Installation winget install Volta.Volta切换版本 volta install node指定版本根据项目固定node和包管理器版本和 该命令会在package.json生成volta的配置,volta会自动读取项目的该配置来决定node的…

【STM32】TCP/IP通信协议--LWIP内存管理

五、LWIP内存管理 1.什么是内存管理? (1)内存管理,是指软件运行时对计算机内存资源的分配的使用的技术,其主要目的是如何高效、快速的分配,并且在适当的时候释放和回收内存资源(就比如C语言当…

安全的价值:构建现代企业的基础

物理安全对于组织来说并不是事后才考虑的问题:它是关键的基础设施。零售商、医疗保健提供商、市政当局、学校和所有其他类型的组织都依赖安全系统来保障其人员和场所的安全。 随着安全技术能力的不断发展,许多组织正在以更广泛的视角看待他们的投资&am…

SQL学习1

24.9.28学习目录 一.数据库1.SQL语句基础2.匹配条件 一.数据库 对于嵌入式的数据库,其使用的是SQLite这种小型数据库; 在ubuntu中的下载方法 //字符界面 sudo apt-get install sqlite3//图形界面 sudo apt-get install sqlitemanSQLite特点&#xff1a…

ACL 2023--MetaAdapt: 通过元学习实现领域自适应的少量样本虚假信息检测

https://github.com/Yueeeeeeee/MetaAdapt 随着社交媒体上出现的新话题(例如COVID-19)成为虚假信息传播的来源,克服原始训练领域(即源领域)与这些目标领域之间的分布变化,仍然是虚假信息检测中的一项复杂任…

5分钟精通Excel在go中的使用

一些简单操作可以在官方文档中找到,应该足够无经验的朋友们入门 介绍 - 《Excelize v2.2 中文文档》 - 书栈网 BookStack 这里贴一个中文版的链接(以excelize库为例,相对其他库来说,体验很不错),不过要注…

PWA(Progressive web APPs,渐进式 Web 应用): manifest.json、 Service Worker

文章目录 引言I 什么是 PWA功能特性技术上分为三个部分安装应用II Web 应用清单将Web 应用清单文件链接到站点manifest.json字段说明III Service Worker( 缓存管理)IV 结合构建工具让项目支持 PWA应用使用插件vite-plugin-pwaworkbox-webpack-plugin插件扩展知识将 PWA 作为脱机…

紫光 FPGA固化RAM位置的操作流程

1. 前提条件:需要已经编译出一个功能完整的没有时序违例的版本出来; 2. 将RAM导出至txt文件: 这个过程需要几分钟,耐心等待一下。 等待提示成功就可以进行下一步操作了。 3. 将【2】中的txt文件中的内容全选复制粘贴到pcf文件的…

物体实例分割,机器人拾取

物体实例分割是计算机视觉领域的一个关键任务,它旨在从图像中分割出每个独立物体,并且为每个物体实例提供一个独特的标识。这一任务不仅识别出图像中的物体,还能区分出多个同类物体的不同实例,例如在一张桌子上摆放的多个相同的杯…

AI直播巅峰!2024年AI无人直播app排行榜领先者揭晓!

AI直播巅峰!2024年AI无人直播app排行榜领先者揭晓! 在科技日新月异的今天,AI技术正以惊人的速度渗透到我们生活的每一个角落,其中,AI无人直播app的兴起无疑成为了直播行业的一股革新力量。随着技术的不断成熟和市场的…

瓶子类型检测系统源码分享

瓶子类型检测检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer Vis…

论文阅读:A Generalization of Transformer Networks to Graphs

论文阅读:A Generalization of Transformer Networks to Graphs 论文地址1 摘要2 贡献Graph TransformerOn Graph Sparsity(图稀疏)On Positional Encodings(位置编码)3 Graph Transformer Architecture(架…

关于Fake Location定位,运动世界校园问题

不好意思,之前那个文章其实是很早之前的,不知道为什么审核了很久一直没有通过,然后前几周莫名其妙点了一下重新发布,竟然发布成功了,这个方法已经失效了,要可以稳定,我建议是买一台root的手机&a…