【部署】Deploying Trino on linux

文章目录

  • 一. Requirements
    • 1. Linux operating system
    • 2. Java 环境
    • 3. Python
  • 二. Installing Trino
  • 三. Configuring Trino
    • 1. 节点配置
    • 2. JVM 配置
    • 3. Config properties
    • 4. Log levels
    • 5. Catalog properties
  • 四. Running Trino

一. Requirements

1. Linux operating system

  • 64位

  • 资源限制配置:/etc/security/limits.conf

trino soft nofile 131072
trino hard nofile 131072
trino soft nproc 128000
trino hard nproc 128000

 

2. Java 环境

最新的Trino版本需要Java的长期支持版本Java 17,特别是17.0.3或更新版本。Trino不支持更旧版本的Java,而在新版本的Java(Java 18 或 19)环境下它也许可以正常工作,但并未仔细测试。

下载安装JDK17:Linux系统下JDK17安装+环境配置

 
如果使用java17或者java18,需要配置charset为UTF-8,在etc/jvm.config

-Dfile.encoding=UTF-8 

java19不要配置

 

3. Python

version 2.6.x, 2.7.x, or 3.x
required by the bin/launcher script only

 
 

二. Installing Trino

下载地址:trino-server-434.tar.gz,

解压:tar -zxvf trino-server-434.tar.gz

trino需要数据目录来存储日志等。推荐将数据目录放在安装目录之外,便于Trino的更新。

 

三. Configuring Trino

在安装目录创建一个etc目录,此目录下有如下配置:

  • 节点配置:每个节点的环境配置。
  • JVM配置
  • Trino server配置
  • catalog配置:配置数据源

1. 节点配置

创建etc/node.properties文件,这里配置每个节点。一个节点代表一个trion的安装实例。当trino第一次安装时,有如下最小化配置:

node.environment=production
node.id=ffffffff-ffff-ffff-ffff-ffffffffffff
node.data-dir=/var/trino/data
  • node.environment:环境名字。所有的Trino节点都必须有同样的环境名字。名字开头必须小写,且只包含小写字母或_字符。
  • node.id :trion唯一标识,每个节点都不同。此标识在更新或者重启Trion时要保持不动。如果多个trino实例跑在同一个节点,每个安装实例必须有唯一标识。标识从一个字母开始,标识中只包含字母、- 或 _字符。
  • node.data-dir:数据目录位置,trion存储日志和其他数据在此目录。

 

2. JVM 配置

创建etc/jvm.config文件,这里包含一些启动java虚拟机的一些命令。文件格式是每行一个option组成的列表。

这些配置不由shell执行,所以文件中的空格或其他特殊字符不能用引号括起。如下参考:

-server
-Xmx10G
-XX:InitialRAMPercentage=80
-XX:MaxRAMPercentage=80
-XX:G1HeapRegionSize=32M
-XX:+ExplicitGCInvokesConcurrent
-XX:+ExitOnOutOfMemoryError
-XX:+HeapDumpOnOutOfMemoryError
-XX:-OmitStackTraceInFastThrow
-XX:ReservedCodeCacheSize=512M
-XX:PerMethodRecompilationCutoff=10000
-XX:PerBytecodeRecompilationCutoff=10000
-Djdk.attach.allowAttachSelf=true
-Djdk.nio.maxCachedBufferSize=2000000
-Dfile.encoding=UTF-8
# Reduce starvation of threads by GClocker, recommend to set about the number of cpu cores (JDK-8192647)
-XX:+UnlockDiagnosticVMOptions
-XX:GCLockerRetryAllocationCount=32

根据节点情况调整-Xmx配置,一般推荐设为节点总内存的70%-85%。比如所有的workers和coordinator使用64G的RAM,则你可以设置-Xmx54G

  • 分配的内存中大部分用于处理,小部分用于比如JVM的内部操作,比如垃圾回收。
  • 其他可用节点的内存必须足够用于系统操作、其他正在运行的服务,以及native code对堆外内存的使用。
  • 在较大节点上,内存比可以更小,不支持分配所有内存给JVM或者使用交换内存,不使用交换内存是比较推荐的。
  • 对于生产场景下,大于32GB的内存是比较推荐的。
  • 因为OutOfMemoryError通常会使JVM处于不一致的状态,所以我们写一个heap dump,用于调试,并在发生这种情况时强制终止进程。
  • JVM必须能够在临时目录下执行,在某些安装中,默认的/tmp目录被用作挂载标志,而这导致Trino启动不了。当然可以设置:-Djava.io.tmpdir=/path/to/other/tmpdir 来覆盖默认值。
  • 这里设置GCLocker retry allocation count (-XX:GCLockerRetryAllocationCount=32)来避免太早的OOM(JDK-8192647)

 

3. Config properties

创建etc/config.properties,用于配置Trino Server。每一个Trino server都可以有coordinator和worker两种身份。一个集群需要一个coordinator,将一台机器专门用于执行协调工作可以给大型集群提供最佳性能,对于集群拓展和MPP并行处理则由worker实现。

coordinator的最小化配置:

coordinator=true
node-scheduler.include-coordinator=false
http-server.http.port=8080
discovery.uri=http://example.net:8080

workers的最小化配置:

coordinator=false
http-server.http.port=8080
discovery.uri=http://example.net:8080

如果部署一个测试集群,coordinator 和 worker部署到一起,则可以配置:

coordinator=true
node-scheduler.include-coordinator=true
http-server.http.port=8080
discovery.uri=http://example.net:8080

配置说明:

  • coordinator:配置为true则设置此trino实例作为coordinator,用来接收客户端的查询请求,以及管理查询。
  • node-scheduler.include-coordinator:允许coordinator工作调度。对于更大的集群,coordinator的工作处理影响查询性能,因为机器的资源不能用于重要任务的调度,管理以及监控查询的执行。
  • http-server.http.port:http server端口,Trino使用http协议进行所有内外部的通讯。(没有RPC端口?)
  • discovery.uri:coordinator具备服务发现的能力。每个trino实例在启动时都会向发现服务注册自己,并持续的汇报心跳。发现服务分享http服务,所以使用同样的端口。如果coordinator上禁用了http,那么需要使用HTTPS。

以上是最小化配置说明。其他配置见:

All additional configuration is optional and varies widely based on the specific cluster and supported use cases. The Administration and Security sections contain documentation for many aspects, including Resource groups for configuring queuing policies and Fault-tolerant execution.

 

4. Log levels

创建etc/log.properties,来设置最小日志级别。每一个logger通过类的全限定名声明。如下设置日志级别:

io.trino=INFO

这会给io.trino.serverio.trino.plugin.hive 设置INFO的日志级别。不过默认的日志级别就是INFO,这里有四种日志级别:DEBUG, INFO, WARN and ERROR。

 

5. Catalog properties

Trino通过连接器访问数据,而连接器挂载到Catalog中。连接器向Catalog提供所有的schemas和表。例如:hive连接器映射每一个hive数据库为一个schema。如果hive连接器挂载为hive catalog,在hive.web.clicks页面上就可以访问hive表。

通过在etc/catalog目录下创建一个catalog配置文件来注册Catalogs。如果创建etc/catalog/jmx.properties,就会将jmx挂载到catalog中

connector.name=jmx

其他连接器配置见:Connectors

 

四. Running Trino

bin/launcher中提供了启动脚本,脚本可以被手动操作,或作为一个daemon执行。有如下命令:

命令说明
run前台启动,使用Ctrl+C关闭,或者在其他终端执行stop
start启动作为一个daemon,并返回PID
stop关闭服务
restart重启或启动一个服务,绑定一个新的PID
kill关闭可能挂起的服务
status打印状态,Stopped pid or Running as pid.
bin/launcher start

或者,它可以在前台运行,将日志和其他输出写入stdout/stderr。如果使用像daemontools这样的监控系统,两个流都应该被捕获:

bin/launcher run

launcher为etc目录、配置文件、数据目录var和数据目录中的日志文件配置默认值。
可以按需修改,例如使用安装目录之外的目录、特定的挂载点或位置,甚至使用其他文件名。例如,Trino RPM调整使用的目录以更好地遵循Linux文件系统层次标准(FHS)。

 
在这里插入图片描述

登录时需要写用户可以随便写,不需要输入密码

当trino启动后,可以在数据目录查看如下日志:

  • launcher.log:由launcher创建,包含stdout and stderr streams。server logging的初始化、JVM的错误以及分析会写到launcher.log中。
  • server.log:Trino主要日志,当sever初始化失败时会包含一些相关信息。日志会自动轮转和压缩。
  • http-request.log:记录所有http请求。日志同样会自动轮转和压缩。

 

参考:
官网:Trino Deploying

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/209759.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Django总结

文章目录 一、Web应用Web应用程序的优点Web应用程序的缺点应用程序有两种模式C/S、B/S C/S 客户端/服务端局域网连接其他电脑的MySQL数据库1.先用其他电脑再cmd命令行ping本机ip2.开放MySQL的访问 B/S 浏览器/服务端基于socket编写一个Web应用 二、Http协议1.http协议是什么2.h…

智能优化算法应用:基于动物迁徙算法无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用:基于动物迁徙算法无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用:基于动物迁徙算法无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.动物迁徙算法4.实验参数设定5.算法结果6.参考…

用Python创建日历详细指南与实用示例

更多Python学习内容:ipengtao.com 大家好,我是彭涛,今天为大家分享 用Python创建日历详细指南与实用示例,全文4800字,阅读大约15分钟。 在日常生活和工作中,创建和管理日历是一项关键任务。Python提供了丰富…

广州招聘用什么平台

广州招聘一般都会通过“广州吉鹿力招聘网”这个平台进行。广州吉鹿力招聘网是一个拥有多年经验的招聘平台,用户可以通过广州吉鹿力招聘网来寻找适合自己的职位,对于求职者来说,广州吉鹿力招聘网的要求相对较高,广州吉鹿力招聘网是…

【视觉SLAM十四讲学习笔记】第三讲——旋转向量和欧拉角

专栏系列文章如下: 【视觉SLAM十四讲学习笔记】第一讲——SLAM介绍 【视觉SLAM十四讲学习笔记】第二讲——初识SLAM 【视觉SLAM十四讲学习笔记】第三讲——旋转矩阵 本章将介绍视觉SLAM的基本问题之一:如何描述刚体在三维空间中的运动? 旋转向…

机器学习(1)机器学习类型和机器学习的主要概念

0.前提 深度学习(Deep Learing)是机器学习(Machine Learning)领域中的一个新的研究方向,在如今的时代研究深度学习的大模型是十分热门的。我不知道有多少人有关注到最近openai的事件啊,说个比较让我惊讶的…

[ISCTF 2023]——Web、Misc较全详细Writeup、Re、Crypto部分Writeup

前言 由于懒我直接把上交的wp稍加修改拉上来了,凑活看 文章目录 前言Pwntest_ncnc_shell ReverseCreakmeEasyRebabyReeasy_z3mix_reeasy_flower_tea Webwhere_is_the_flag圣杯战争!!!绕进你的心里easy_websitewafrez_ini1z_Ssqldouble_picklewebincludefuzz!恐怖G…

网盘系统设计:万亿 GB 网盘如何实现秒传与限速?

Java全能学习面试指南:https://javaxiaobear.cn 网盘,又称云盘,是提供文件托管和文件上传、下载服务的网站(File hostingservice)。人们通过网盘保管自己拍摄的照片、视频,通过网盘和他人共享文件&#xff…

Hdoop学习笔记(HDP)-Part.11 安装Kerberos

目录 Part.01 关于HDP Part.02 核心组件原理 Part.03 资源规划 Part.04 基础环境配置 Part.05 Yum源配置 Part.06 安装OracleJDK Part.07 安装MySQL Part.08 部署Ambari集群 Part.09 安装OpenLDAP Part.10 创建集群 Part.11 安装Kerberos Part.12 安装HDFS Part.13 安装Ranger …

jira创建用例,与任务关联

项目用的jira,但之前的用例放在禅道上,或者归档于svn,都不是很好用,所以研究了下jira的用法 1、下载插件: synapseRT - Test management and QA in JIRA 完成后在tab会多出一个test 2、常用的功能 1、建立用例&#…

线上超市小程序可以做什么活动_提升用户参与度与购物体验

标题:线上超市小程序:精心策划活动,提升用户参与度与购物体验 一、引言 随着移动互联网的普及,线上购物已经成为人们日常生活的一部分。线上超市作为线上购物的重要组成部分,以其便捷、快速、丰富的商品种类和个性化…

unity3d模型中缺失animation

在 模型的Rig-Animationtype 设置成Legacy https://tieba.baidu.com/p/2293580178

巧借C++算法实现冒泡排序算法

目录 引言冒泡排序原理具体实现步骤示例代码时间复杂度和稳定性优化可能性结束语 引言 作为计算机专业出身的开发者,以及从事软件开发相关的小伙伴,想必对C语言并不陌生,它是一门非常厉害的编程语言,不仅是基于程序底层的语言&a…

全网最新最全的自动化测试教程:python+pytest接口自动化-请求参数格式的确定

我们在做接口测试之前,先需要根据接口文档或抓包接口数据,搞清楚被测接口的详细内容,其中就包含请求参数的编码格式,从而使用对应的参数格式发送请求。例如某个接口规定的请求主体的编码方式为 application/json,那么在…

python中的字典

文章目录 字典字典的创建设置默认值(fromkeys函数)字典的基本操作字典的内建函数update方法(更新字典)删除字典字典的常用方法 字典 在Python中,字典是一种无序的、可变的数据结构,用于存储键值对。字典使…

SpringBoot+vue美食外卖点餐系统的研究与设计

目录 前言😃:一、项目简介二、技术选型三、系统功能架构四、功能实现商家端功能实现(1)商家端登录界面(2)工作台界面(3)数据统计界面(4)订单界面(…

Python中使用HTTP代码示例

在Python中,有多种方式可以通过HTTP协议与服务器进行通信。以下是使用requests库和http.client库的示例。 一、使用requests库 requests库是Python中用于发送HTTP请求的流行库。它可以轻松地发送GET、POST、PUT、DELETE等HTTP请求。以下是一个简单的示例&#xff…

实战分析和精华总结:服务器端请求伪造SSRF漏洞数据劫持、复现、分析、利用及修复过程

实战分析和精华总结:服务器端请求伪造SSRF漏洞数据劫持、复现、分析、利用及修复过程。 SSRF漏洞(服务器端请求伪造):是一种由攻击者构造形成由服务端发起请求的一个安全漏洞。一般情况下,SSRF攻击的目标是从外网无法访问的内部系统。(正是因为它是由服务端发起的,所以…

AI医疗交流平台【Docola】申请823万美元纳斯达克IPO上市

来源:猛兽财经 作者:猛兽财经 猛兽财经获悉,总部位于美国的AI医疗交流平台Docola近期已向美国证券交易委员会(SEC)提交招股书,申请在纳斯达克IPO上市,股票代码为 (DOCO) ,Docola计划…

面试必会-JAVA基础篇-02

文章目录 11. ArrayList 和 LinkedList 的区别是什么?12. 说一下HashMap的实现原理?13. HashMap的put方法的具体流程?14. 讲一讲HashMap的扩容机制15. ConcurrentHashMap 底层具体实现知道吗?16. 创建线程的四种方式17. runnable …