datahub安装部署

作者:恩慈

背景:由于某客户需要建立sparksql的血缘关系,于是提出了datahub,由于网上关于datahub资料较少,因此这里做以记录。

datahub作为一个元数据管理平台,可以对数据资产进行有效的组织,还可以帮助数据专业人员收集、组织、访问和丰富元数据,以支持数据治理,下面我来介绍下如何部署datahub。

一、python3安装

Datahub需要Python3的支持,而CentOS7默认安装的是Python2,所以需要安装Python3。

1.下载软件包

(1)下载并解压Python3

命令如下:

wget https://www.python.org/ftp/python/3.9.9/Python-3.9.9.tgz

tar -zxf Python-3.9.9.tgz

请添加图片描述

(2)安装python3依赖包

使用yum安装ptyhon的依赖包,命令如下:

yum install --downloadonly --downloaddir=./python3.9.9 zlib-devel bzip2-devel openssl-devel ncurses-devel epel-release gcc gcc-c++ xz-devel readline-devel gdbm-devel sqlite-devel tk-devel db4-devel libpcap-devel libffi-devel

请添加图片描述

2.安装python3

(1)安装python3依赖包

rpm -Uvh ./*.rpm --nodeps --force

请添加图片描述

(2)安装python3

mkdir /usr/local/python3

cd Python-3.9.9

./configure --prefix=/usr/local/python3

make && make install

有如下显示则表示安装成功

(3)修改配置

修改系统默认python指向,默认pip指向

rm -rf /usr/bin/python

ln -s /usr/local/python3/bin/python3 /usr/bin/python

rm -rf /usr/bin/pip

ln -s /usr/local/python3/bin/pip3 /usr/bin/pip

验证

python --version

pip --version

因为yum支持python2,因次要修复yum

vi /usr/bin/yum

把 #! /usr/bin/python 修改为 #! /usr/bin/python2

vi /usr/libexec/urlgrabber-ext-down

把 #! /usr/bin/python 修改为 #! /usr/bin/python2

vi /usr/bin/yum-config-manager

#!/usr/bin/python 改为 #!/usr/bin/python2 (没有的不用修改)

二、Datahub安装

1.下载datahub依赖包

pip3 download acryl-datahub==0.8.40 -d /opt/datahub/software/datahub-package(自定义路径)

检查环境

python3 -m pip uninstall datahub acryl-datahub || true # sanity check - ok if it fails

检查环境 收到这样的提示说明没有问题
请添加图片描述

2.安装datahub

python3 -m pip install --upgrade pip wheel setuptools

python3 -m pip install --upgrade acryl-datahub

请添加图片描述

python3 -m datahub version

请添加图片描述

三、docker安装

1.下载docker安装包

下载docker-20.10.0包

https://download.docker.com/linux/static/stable/x86_64/docker-20.10.0.tgz

下载docker-compose对应系统的包

下载docker-composean安装包

https://github.com/docker/compose/releases选择2.20.2版本

2.安装docker

tar -zxf docker-20.10.0.tgz

将解压出来的docker文件内容移动到 /usr/bin/ 目录

cp docker/* /usr/bin/

查看docker版本

docker version

请添加图片描述

3.配置docker

配置Docker开机自启动服务

vi /etc/systemd/system/docker.service

添加如下内容:

[Unit]

Description=Docker Application Container Engine

Documentation=https://docs.docker.com

After=network-online.target firewalld.service

Wants=network-online.target

[Service]

Type=notify

#the default is not to use systemd for cgroups because the delegate issues still

#exists and systemd currently does not support the cgroup feature set required

#for containers run by docker

ExecStart=/usr/bin/dockerd

ExecReload=/bin/kill -s HUP $MAINPID

#Having non-zero Limit*s causes performance problems due to accounting overhead

#in the kernel. We recommend using cgroups to do container-local accounting.

LimitNOFILE=infinity

LimitNPROC=infinity

LimitCORE=infinity

#Uncomment TasksMax if your systemd version supports it.

#Only systemd 226 and above support this version.

#TasksMax=infinity

TimeoutStartSec=0

#set delegate yes so that systemd does not reset the cgroups of docker containers

Delegate=yes

#kill only the docker process, not all processes in the cgroup

KillMode=process

#restart the docker process if it exits prematurely

Restart=on-failure

StartLimitBurst=3

StartLimitInterval=60s

[Install]

WantedBy=multi-user.target

添加文件可执行权限

chmod +x /etc/systemd/system/docker.service

重新加载配置文件

systemctl daemon-reload

启动Docker

systemctl start docker

查看docker启动状态

systemctl status docker

查看启动容器

docker ps

设置开机自启动

systemctl enable docker.service

查看docker开机启动状态 enabled:开启, disabled:关闭

systemctl is-enabled docker.service

4.安装docker-compose

将3.1下载的docker-compose放到/usr/local/bin/里面

给docker compose 目录授权

chmod +x /usr/local/bin/docker-compose

查看一下version,显示有版本号那就说明安装成功了

docker-compose version

四、Datahub启动

1.镜像包下载

下载的包在https://github.com/datahub-project/datahub/blob/master/docker/quickstart/docker-compose-without-neo4j.quickstart.yml文件中的image行

如下图红框中所示:

请添加图片描述

例:docker pull confluentinc/cp-kafka:7.4.0

docker save confluentinc/cp-kafka:7.4.0 -o kafka.tar(名字自定义)

请添加图片描述

2.镜像包导入

将包上传至节点并使用 docker load -i xxx.tar 进行加载

如:docker load -i kafka.tar

使用docker images 查看是否成功

其他镜像也依次传入

请添加图片描述

3.启动Datahub

下载docker-compose-without-neo4j.quickstart.yml 文件

下载地址:https://github.com/datahub-project/datahub/blob/master/docker/quickstart/docker-compose-without-neo4j.quickstart.yml

执行如下命令启动datahub

datahub docker quickstart --quickstart-compose-file ./docker-compose-without-neo4j.quickstart.yml --no-pull-images

参数说明:
–quickstart-compose-file 指定启动时加载的yml文件
–no-pull-images 使用本地加载镜像不去外网更新,4.1和4.2已经加载过镜像了,可以节省约6小时

如果失败可以使用这个命令

docker-compose -f docker-compose-without-neo4j.start.yml up -d

(未执行4.2章节的话执行时间就会比较长)

请添加图片描述

登陆datahub

登陆用户和密码为datahub/datahub

请添加图片描述

更多技术信息请查看云掣官网https://yunche.pro/?t=yrgw

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/379027.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HarmonyOS 开发者联盟高级认证最新题库

本篇文章包含 Next 版本更新后高级认证题库中95%的题目。 答案正确率 50-60%,答案仅做参考。 请在考试前重点看一遍题目,勿要盲目抄答案。 欢迎在评论留言正确答案和未整理的题目。 1、下面关于方舟字节码格式PREF_IMM16_v8_v8描述正确的是 16位前缀操作…

中间件的理解

内容来源于学习网站整理。【一看就会】什么是前端开发的中间件?_哔哩哔哩_bilibili 每日八股文~白话说mq,消息中间件_哔哩哔哩_bilibili 例如: 1)两个人打电话,中间的通信网络就是中间件。 2)菜鸟驿站&…

Java.Net.UnknownHostException:揭开网络迷雾,解锁异常处理秘籍

在Java编程的浩瀚宇宙中,java.net.UnknownHostException犹如一朵不时飘过的乌云,让开发者在追求网络畅通无阻的道路上遭遇小挫。但别担心,今天我们就来一场说走就走的探险,揭秘这个异常的真面目,并手把手教你几招应对之…

巧用通义灵码助力护网面试

前言 前几年护网还算是一个比较敏感的话题,但是随着近段时间的常态化开始,护网行动也是逐渐走进了大众的视野,成为了社会各界共同关注的安全盛事。本篇也是受通义灵码备战求职季活动的启发,结合近期要开始的护网行动&#xff0c…

每日一题,力扣leetcode Hot100之128. 最长连续序列

题目理解: 从示例1可以看出简单的连续数字就算,从示例2可以看出当有重复数字时,是不算长度的 解法一: 第一个想到的解法,就是对nums排序,然后双层循环遍历进行判断,当前一个和后一个相减等于…

Yolov8网络结构学习

详解YOLOv8网络结构/环境搭建/数据集获取/训练/推理/验证/导出/部署 深入解析YOLOv8:网络结构与推理过程 YOLO? You Know! --YOLOV8详解 一:yolov8总体结构 1.Backbone:它采用了一系列卷积和 反卷积层只来提取特征,同时也使用了残差连接和…

广联达Linkworks ArchiveWebService XML实体注入漏洞复现

0x01 产品简介 广联达 LinkWorks(也称为 GlinkLink 或 GTP-LinkWorks)是广联达公司(Glodon)开发的一种BIM(建筑信息模型)协同平台。广联达是中国领先的数字建造技术提供商之一,专注于为建筑、工程和建筑设计行业提供数字化解决方案。 0x02 漏洞概述 广联达 LinkWorks…

小程序图片下载保存方法,图片源文件保存!

引言 现在很多时候我们在观看到小程序中的图片的时候,想保存图片的原文件格式的话,很多小程序是禁止保存的,即使是让保存的话,很多小程序也会限制不让保存原文件,只让保存一些分辨率很低的,非常模糊的图片…

【.NET全栈】ASP.NET开发web应用——ASP.NET中的样式、主题和母版页

文章目录 前言一、在ASP.NET中应用CSS样式1、创建CSS样式(1)内联样式(2)内部样式表(3)外部样式表 2、应用CSS样式(1)菜鸟教程-简单例子(2)菜鸟教程-用户界面&…

详解:adobe国际认证有多少种

Adobe国际认证,作为全球公认的数字媒体和创意设计技能认证,涵盖了多个专业领域和软件应用。这一认证体系为专业人士提供了展示自己技能水平的平台,并帮助他们在职场中脱颖而出。那么,Adobe国际认证到底有多少种呢? Ado…

【常见开源库的二次开发】基于openssl的加密与解密——Base的编解码(二进制转ascll)(二)

目录: 目录: 一、 Base64概述和应用场景 1.1 概述 1.2 应用场景 二、Base16 2.1 Base16编码 2.2 Base16编解码 三、Base64 四、OpenSSL BIO接☐ 4.1 Filter BIOs: 4.2 Source/Sink BIOs: 4.3 应用场景: 4.4 具体使用&…

从挑战到实战!TDengine 新能源行业研讨会要点回顾

近年来,随着全球对可再生能源需求的不断增长,新能源行业迎来了前所未有的发展机遇。然而,伴随着行业的快速发展,海量数据的管理和高效利用成为了行业面临的重要挑战。如何通过先进的数据管理技术提升新能源系统的效率和可靠性&…

前端vue3 实现pdf 生成的 类插件

前端 PDF 打印插件,基于 jspdf 和 html2canvas 开发 jspdfhtml2canvas 安装依赖 jspdf、html2canvas npm i jspdf html2canvas直接上代码 hooks

Hadoop3:MR程序的数据倾斜问题处理

一、数据倾斜 什么是数据倾斜? 学过Redis集群的都知道数据倾斜这个问题。 就是大量数据,分配不均匀的现象。 二、MR数据倾斜 1、怎么判断出现数据倾斜? 数据频率倾斜——某一个区域的数据量要远远大于其他区域。 数据大小倾斜——部分记…

ArkUI组件——循环控制/List

循环控制 class Item{name: stringprice:number}private items:Array<Item> [new Item("A0",2399),new Item("BE",1999),new Item("Ro",2799)] ForEach(this.items,(item:Item) > {})List组件 列表List是一种复杂的容器&#xff0c;…

RISC-V在线反汇编工具

RISC-V在线反汇编工具&#xff1a; https://luplab.gitlab.io/rvcodecjs/#q34179073&abifalse&isaAUTO 不过&#xff0c;似乎&#xff0c;只支持RV32I、RV64I、RV128I指令集&#xff1a;

web安全之跨站脚本攻击xss

定义: 后果 比如黑客可以通过恶意代码,拿到用户的cookie就可以去登陆了 分类 存储型 攻击者把恶意脚本存储在目标网站的数据库中(没有过滤直接保存)&#xff0c;当用户访问这个页面时&#xff0c;恶意脚本会从数据库中被读取并在用户浏览器中执行。比如在那些允许用户评论的…

Ubuntu 安装 XRDP,替代系统自带RDP远程桌面

起因&#xff0c;Ubuntu的自带RDP远程桌面很好用&#xff0c;但很傻卵&#xff0c;必须登录。 而设置了自动登录也不能解开KEYRING&#xff0c;必须必须必须用GUI手动登录。 &#xff08;我远程我用头给你坐机子面前开显示器先登录&#xff1f;&#xff1f;&#xff09; 比起VN…

vue 如何做一个动态的 BreadCrumb 组件,el-breadcrumb ElementUI

vue 如何做一个动态的 BreadCrumb 组件 el-breadcrumb ElementUI 一、ElementUI 中的 BreadCrumb 定义 elementUI 中的 Breadcrumb 组件是这样定义的 <template><el-breadcrumb separator"/"><el-breadcrumb-item :to"{ path: / }">主…

001、Mac系统上Stable Diffusion WebUI环境搭建

一、目标 如标题所述&#xff0c;在苹果电脑&#xff08;Mac&#xff09;上搭建一套Stable Diffusion本地服务&#xff0c;以实现本地AI生图目的。 二、安装步骤 1、准备源码【等价于准备软件】 # 安装一系列工具库&#xff0c;包括cmake,protobuf,rust,python3.10,git,wge…