Systemd服务配置排坑-TasksMax参数

一、背景

        由于产品是Java程序,之前都是通过封装的start.sh运行即可。但是出于架构调整,改换为Ansible进行自动化部署,同时改用Systemd service的方式来对程序进行管理。

        但不知道为啥原因,使用systemctl启动这个程序,就会无脑报错。 报错信息看起来像是我们使用到nacos,一直停留在无法创建新的线程、堆内存溢出:

       晚上申请割接窗口时间进行排查,排查了2天都没排查出个所以然。 更奇怪的是,我们直接使用start.sh的方式能正常启动,但是使用systemctl 启动服务的方式就是死活起不来,这才是最坑的地方。

        从报错信息,我们以为是ulimit设置的文件句柄限制太小,查看了一下ulimit -a, 发现限制量是100w, 应该不是这个问题。

        也看了下nacos的端口可以正常访问,程序给了40G堆内存。并且是服务启动就报错咯,而不是运行起来才报错。  也没有生成dump文件。jstack分析了下线程运行情况,也正常。   百思不得其解。

        最后,我们根据现象大概率判断可能是我们的systemd service哪里出了问题,要不然无法解释为啥同样的程序,通过start.sh启动可以正常,但是通过systemd的方式起不来。

二、排查过程

1、查看service文件,发现参数LimitNOFILE

        刚开始我们发现service文件存在这个参数LimitNOFILE=81920, 以为是这个参数导致的。后面尝试把这个参数注释掉,重新启动发现还是一样起不来。

        那根本原因还是没找到,只能继续排查。

2、TasksMax参数

        后面使用systemctl start service, 直接通过systemcl status service观察服务的运行状态,看下是什么原因挂掉的。 此时发现了一个有趣的现象:

        这里有一个limit的限制,还没修复之前是512, Tasks的数量一直在涨,大于>=limit 512以后,整个service也挂了。

        很符合我们观察到的启动现象。

        查询了一下资料,这个参数的含义:

systemd的TasksMax参数用于限制systemd管理的服务的并发线程数。当服务的线程数达到这个限制时,新线程的创建将会失败,并可能导致服务出现错误或不稳定。TasksMax参数可以在系统级别或进程级别进行设置。系统级别的设置影响所有systemd管理的服务,而进程级别的设置则只影响特定的服务。TasksMax参数的作用和设置方法主要包括以下几点:限制并发线程数:TasksMax参数设定了一个服务可以创建的线程数的上限。这有助于防止因线程过多而导致的资源耗尽和服务崩溃。
系统级别设置:在系统级别,TasksMax参数可以在/etc/systemd/system.conf文件中进行设置。例如,可以将DefaultTasksMax的值修改为5120,以允许服务创建更多的线程。

        原来是systemd限定了进程的并发线程数量, 超过了则这个service会被systemd干掉。  顺藤摸瓜,我们看下这个默认值limit是不是512? 怎么修改参数值?

systemctl show --property=DefaultTasksMax

        还真是512.对应得上了。  那么我们尝试修改下这个service的TaskLimit参数限制,调整到了10000.再尝试启动程序看是否正常,此时发现程序已经正常启动,不会挂了。 

 三、总结

        针对systemd的配置信息,需要我们详细的去了解相关参数,才能写出较少的坑的sevrice文件。 

        我们可以直接通过systemctl --show | grep 的方式来过滤一些关键词,从而学习这些配置项的含义,要不然遇到这种坑真的难以排查。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/342313.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

The First项目报告:AI+元宇宙+链游,Ultiverse能否引发新一轮GameFi浪潮?

2 月 19 日,由AI 驱动的 Web3 游戏制作和发布一站式平台 Ultiverse 宣布上线 Ulti-Pilot,Ulti-Pilot 允许用户以零成本的方式获得积分、SOUL、和 Ultiverse 生态的其他游戏内资产。 链游赛道一直是Web3领域热议的话题,其数字资产天然契合加密…

七月份大理站、ACM独立出版、高录用稳检索,2024年云计算与大数据国际学术会议(ICCBD 2024)

【ACM独立出版 | 高录用 | EI核心检索稳定】 2024年云计算与大数据国际学术会议(ICCBD 2024) 2024 International Conference on Cloud Computing and Big Data (ICCBD 2024) 一、重要信息 大会官网:www.iccbd.net (点击投稿/参会/了解会…

【Python】【PVE】使用PVE-API对虚拟机进行远程关机

源代码 import requests import urllib3 urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)address "填写PVE的域名/IP:端口" path "/api2/json/nodes/填写节点名称/qemu/填写虚拟机VMID/status/shutdown" url "https://&quo…

【探索全球精彩瞬间,尽享海外短剧魅力!海外短剧系统,您的专属观影平台】

🌟 海外短剧系统,带您走进一个全新的视界,让您随时随地欣赏到来自世界各地的精选短剧。在这里,您可以感受到不同文化的碰撞,品味到各种题材的精髓,让您的生活更加丰富多彩! 🎬 精选…

解决Mac ~/.bash_profile 配置的环境变量重启终端后失效问题

在Mac系统中,配置环境变量通常是在~/.bash_profile文件中进行。然而,有时会遇到配置的环境变量在重启终端后失效的问题。 解决办法: 在~/.zshrc文件最后或最前面,增加一行 source ~/.bash_profile

爬虫——有道云翻译

废话不多说直接上代码 固定文本内容 import timefrom selenium import webdriver from selenium.common.exceptions import NoSuchElementException, TimeoutException from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWai…

五大PS插件推荐,让你的设计效率翻倍!

前言 PS插件可以在繁忙的设计工作中,帮助设计师们快速高效地完成任务,是每个设计师都渴望解决的问题。这些插件不仅能够提升设计效率,还能让设计师的创意得到更好的展现。接下来,就为大家推荐五款必备的PS插件,让你的…

GA/T 1400视频汇聚平台EasyCVR级联后,平台显示无通道是什么原因?

国标GB28181安防视频监控/视频集中存储/云存储/磁盘阵列EasyCVR平台部署轻快,可支持的主流标准协议有GA/T 1400、国标GB28181、RTSP/Onvif、RTMP等,以及支持厂家私有协议与SDK接入,包括海康Ehome、海大宇等设备的SDK等。 有用户反馈&#xff…

小程序 UI 风格,独具匠心

小程序 UI 风格,独具匠心

uni-app预览pdf(适配多端)

前言 今天有个功能要在当前页面预览pdf,并且适配多端,研究了好久,也踩了好多坑,写个文章记一下,也给各位避避坑~ uni-app预览pdf 1.下载pdf.js 官方下载地址(有坑!待会儿说) 外部…

深度神经网络——什么是扩散模型?

1. 概述 在人工智能的浩瀚领域中,扩散模型正成为技术创新的先锋,它们彻底改变了我们处理复杂问题的方式,特别是在生成式人工智能方面。这些模型基于高斯过程、方差分析、微分方程和序列生成等坚实的数学理论构建。 业界巨头如Nvidia、Google…

锐捷校园网自助服务系统 login_judge.jsf 任意文件读取漏洞复现(XVE-2024-2116)

0x01 产品简介 锐捷校园网自助服务系统是锐捷网络推出的一款面向学校和校园网络管理的解决方案。该系统旨在提供便捷的网络自助服务,使学生、教职员工和网络管理员能够更好地管理和利用校园网络资源。 0x02 漏洞概述 校园网自助服务系统/selfservice/selfservice/module/sc…

Alibbaba RocketMQ笔记

作用场景 异步解耦: 将比较耗时且不需要即时(同步)返回结果 的操作放入消息队列; 流量削峰: 历史简介 基本使用 深入了解\原理

目标检测-AnyLabeling标注格式转换成YOLO格式

Anylabel可以极大的增加数据的标注效率,但是其标注格式如何能转换成YOLO标注格式,具体内容如下所示。 关于AnyLabeling的其它详细介绍如下链接所示 https://blog.csdn.net/u011775793/article/details/134918861 Github链接 https://github.com/vietanhd…

关于按键消抖方法—软件消抖

在设计单片机按键输入的时候,进行按键消抖是防止按键输入被CPU误读多次的必要手段。 一、按键消抖方法(软件) 如果按键较多的情况下,常用软件方法消抖 (1)延时消抖(延时函数按键消抖&#xf…

【Linux 网络编程】OSI 七层模型初识、网络传输的流程、IP地址和MAC地址!

文章目录 1. OSI七层模型2. TCP/IP五层(或四层)模型3. 网络传输基本流程 🐧🐧🐧🐧🐧🐧🐧🐧🐧🐧🐧🐧🐧🐧&#…

uni-app基础框架搭建(vue3+ts+vite)

1.基础准备 uni-app官网uni-app,uniCloud,serverless,环境安装,创建uni-app,自定义模板,国内特殊情况,更新依赖到指定版本,运行、发布uni-app,运行并发布快应用,运行并发布快应用(webview),运行并发布快应用(webview)-华为,cli创建项目和HBuilderX可视化界面创https://uniapp.…

人大金仓数据库报sys_user表字段不存在的问题

目录 一.问题: 二.原因 三.解决方法: 一.问题: 公司的一个项目从oracle切换到人大金仓之后,突然报了一个sys_user里面的字段不存在。 二.原因 检查了很多次确信sys_user表没问题,查了相应的文档之后发现原来人大金…

企业数字化转型的主要方面有哪些?

本人研究企业数字化转型10余年,为企业软件选型、数字化提供咨询服务!目前重点研究低代码数字化转型玩法,力争为各行各业探索出一条最具性价比的数字化方式。 关于“企业数字化转型包括哪些方面”这个问题,咱先来看个例子哈~ 比如…

前端将xlsx转成json

第一种方式,用js方式 1.1先安装插件 万事都离不开插件的支持首先要安装两个插件 1.2. 安装xlsx cnpm install xlsx --save注:这块我用的cnpm,原生的是npm,因为镜像的问题安装了cnpm,至于怎么装网上一搜一大堆 1.3安…