阿里云项目启动OOM问题解决

在这里插入图片描述

问题描述

随着项目业务的增长,系统启动时内存紧张,每次第一次启动的时候就会出现oom第二次或者第n的时候,就启动成功了。

带着这个疑问,我就在阿里云上提交了工单,咨询为什么第一次提交失败但是后面却能提交成功尼?

解决方案

就按照提交工单的时间线看看就行:

问题描述

[10018:0x1b45650]    64727 ms: Mark-sweep 863.6 (895.3) -> 857.2 (895.6) MB, 312.0 / 0.4 ms  (average mu = 0.272, current mu = 0.172) allocation failure scavenge might not succeed
[10018:0x1b45650]    65096 ms: Mark-sweep 865.3 (895.6) -> 858.1 (896.1) MB, 302.1 / 0.4 ms  (average mu = 0.229, current mu = 0.181) allocation failure scavenge might not succeed<--- JS stacktrace --->FATAL ERROR: Ineffective mark-compacts near heap limit Allocation failed - JavaScript heap out of memory

售后工程师
2024-09-22 00:02:10
已收到您提交的问题

售后工程师
2024-09-22 00:02:36
请问这个报错是什么地方输出的,麻烦详细描述下并提供服务器ip。

真累什么名字都不能用 – 这是我的用户名
2024-09-22 10:45:27
公网IP 00.100.100.00(这个我还是要处理下的)
启动node项目的时候报出来的

售后工程师
2024-09-22 11:11:12
从报错信息来看是内存不足,您可以free -m看下系统自身内存是否充足,系统内存充足的情况下,检查下程序是否有最大内存限制等导致启动报错,可以根据报错信息外站搜索相关参考案例排查下,修改程序之前建议优先做好备份

售后工程师
2024-09-22 14:39:32
您好,如您暂无其他问题,请关闭下工单。后续有新的问题可以提交新的工单联系我们,感谢您的支持。

真累什么名字都不能用
2024-09-23 17:55:24
swap 的内存很足,怎么swap到磁盘上

# free -mtotal        used        free      shared  buff/cache   available
Mem:           1756        1426          63           0         266         169
Swap:          2047          72        1975

售后工程师
2024-09-23 18:22:32
您好,请问您是指swap扩大?还是什么意思呢?能否详细描述下呢

售后工程师
2024-09-24 09:55:48
尊敬的客户,请您关注工单回复并进行验证,您可以在3天内继续反馈此工单与我们联系。如遇其它问题您可以提交新工单反馈。感谢您的支持!(如果您在工单中提供了账号密码等敏感信息,请您及时修改)

真累什么名字都不能用
2024-09-24 14:18:16
这个错误是项目启动的时候报的错误,内存不足溢了,为了解决内存不足可以使用swap机制,将部分数据swap到磁盘保证项目正常启动。

现在是我的项目启动的时候,第一次都会oom第二次就能正常启动成功,不符合常理。要么每次都失败要么一次就成功。

售后工程师
2024-09-24 14:48:23
您好,oom 是因为您的业务有内存溢出的问题,这个您得从业务侧去查看呢,从您上面命令反馈看配置了2G的Swap,swap使用并不多,有可能是swap分配的并不合理,您可以考虑增大swap,或者调整应用程序的内存使用策略进行优化的。

售后工程师
2024-09-25 01:01:10
尊敬的客户,一直未等到您的回复先将工单置为待确认状态,您可以在3天内继续反馈此工单与我们联系。如遇其它问题您可以提交新工单反馈。感谢您的支持!(如果您在工单中提供了账号密码等敏感信息,请您及时修改,同时建议定期做好数据备份)

真累什么名字都不能用
2024-09-26 15:59:33
Swap他是不用分配的,如果内存不足就会swap到磁盘。 第一次报错,第二次启动成功,这个也不正常呀!

售后工程师
2024-09-26 16:03:41
请稍等,这边看下。

售后工程师
2024-09-26 16:55:21
您好

1麻烦您在程序启动失败时在服务器内部执行下free -m

2然后请您在程序启动成功后,也在服务器内部执行下free -m

请您提供下两次的截图,这边看下,谢谢

真累什么名字都不能用
2024-09-28 15:28:40
第一次启动失败的报文:
在这里插入图片描述

第二次启动成功的报文
image.png

售后工程师
2024-09-28 16:14:49
您好,前后两次的swap分区使用情况看差异不大的,区别看是物理内存使用量不同,可用内存也不同

swap的使用是系统管理的,配置了swap分区,即使将vm.swappiness 设置为100 也并不能保证一定能使用到swap分区的,建议您可以考虑将swap分区增大下,并优化下node程序启动申请的内存最大大小再看下
在这里插入图片描述
在这里插入图片描述

真累什么名字都不能用
2024-10-02 16:35:31
我知道应该优化项目启动占用的内存大小,知识郁闷的是为什么第一次和第二次存在区别。

售后工程师
2024-10-02 17:09:05
您好,您也查看下问题时间服务器messages日志看有报错记录吗,此情况应是开始没有使用swap的,swap和真实内存使用是有区别的,是否使用swap是系统侧进行决定。

真累什么名字都不能用
2024-10-03 15:34:09
刚次1次启动就成功了,很奇怪

售后工程师
2024-10-03 15:56:59
您好,建议您使用观察下,如果后续启动报错您也检查下messages系统日志看下是否有错误记录。
真累什么名字都不能用

2024-10-04 10:31:16
大清早起来项目第一次崩掉了。。。。。
image.png

真累什么名字都不能用
2024-10-04 10:33:35
怎么演变成了,运行一段时间,自动oom了,这谁扛得住

<--- Last few GCs --->[25560:0x21b3650]  9596697 ms: Mark-sweep 876.0 (893.3) -> 874.5 (893.3) MB, 265.6 / 0.3 ms  (average mu = 0.931, current mu = 0.908) allocation failure scavenge might not succeed
[25560:0x21b3650]  9603818 ms: Mark-sweep 876.2 (893.3) -> 874.5 (893.6) MB, 351.2 / 0.4 ms  (average mu = 0.944, current mu = 0.951) allocation failure scavenge might not succeed<--- JS stacktrace --->FATAL ERROR: Reached heap limit Allocation failed - JavaScript heap out of memory1: 0x7fd1989ead78 node::Abort() [/lib64/libnode.so.93]2: 0x7fd1988d8a73  [/lib64/libnode.so.93]3: 0x7fd199be8a20 v8::Utils::ReportOOMFailure(v8::internal::Isolate*, char const*, bool) [/lib64/libnode.so.93]4: 0x7fd199be8de7 v8::internal::V8::FatalProcessOutOfMemory(v8::internal::Isolate*, char const*, bool) [/lib64/libnode.so.93]5: 0x7fd199da87e5  [/lib64/libnode.so.93]6: 0x7fd199dbe654  [/lib64/libnode.so.93]7: 0x7fd199dc0749 v8::internal::Heap::AllocateRawWithLightRetrySlowPath(int, v8::internal::AllocationType, v8::internal::AllocationOrigin, v8::internal::AllocationAlignment) [/lib64/libnode.so.93]8: 0x7fd199dc07d7 v8::internal::Heap::AllocateRawWithRetryOrFailSlowPath(int, v8::internal::AllocationType, v8::internal::AllocationOrigin, v8::internal::AllocationAlignment) [/lib64/libnode.so.93]9: 0x7fd199d80fcd v8::internal::Factory::NewFillerObject(int, bool, v8::internal::AllocationType, v8::internal::AllocationOrigin) [/lib64/libnode.so.93]
10: 0x7fd19a11958a v8::internal::Runtime_AllocateInYoungGeneration(int, unsigned long*, v8::internal::Isolate*) [/lib64/libnode.so.93]
11: 0x7fd199ae3d19  [/lib64/libnode.so.93]

售后工程师
2024-10-04 11:32:17
您好,查看报错是和内存不足有关的,您程序是java相关的话,java的XMX 参数设置的多少,有指定吗,如果是默认配置,可以考虑对XMX设置为1个G观察下

真累什么名字都不能用
2024-10-08 12:43:26
项目是vuepress项目

服务助手
2024-10-09 22:35:27
i-uf65h6i43ltlzhqolumy
d-uf6j9l10qgp2yr97o20n(系统盘). (这个时候给阿里云授权了)

真累什么名字都不能用
2024-10-09 22:35:27
已操作授权

售后工程师
2024-10-10 01:03:59
您好,请问您的这个程序如何启动,配置文件路径麻烦也提供一下,另外您的这个程序属于第三方软件超出了阿里云的服务范围这边会尽力帮您尝试排查下但是无法保证可以解决,这个请了解,谢谢

真累什么名字都不能用
2024-10-11 11:06:16
screen -r -d

npm run docs:dev
售后工程师
2024-10-11 11:44:13
您好,刚刚尝试与您电话,但是电话没有接通

screen -r -d后出现了附件中的提示,麻烦您看下,谢谢
在这里插入图片描述
真累什么名字都不能用
2024-10-11 20:19:02
你干啥了,搞坏了

真累什么名字都不能用
2024-10-11 20:19:53
刚他们说网站崩掉了

服务助手
2024-10-11 20:24:04
真累什么名字都不能用
2024-10-11 20:39:18
Ctrl+a+d 可以退出 窗口管理器,查看服务器的信息, screen -r -d 是打开我程序运行窗口,不能终止的,终止了系统就挂了。

售后工程师
2024-10-11 23:56:38
您好,抱歉给您使用带来不便,您提供启动程序命令后,没有和您确认执行命令的影响,执行 screen -r -d 后 没有什么反应,当时尝试电话联系您核实情况也没有联系通,不清楚是否会影响到您网站。
关于您反馈的网站情况,专员已和您电话沟通,给您带来不便请谅解。

真累什么名字都不能用
2024-10-12 21:38:00
造成的损失你我一块承担一些吧

售后工程师
2024-10-12 22:02:44
您好,您反馈的问题我们已经记录并转交给后端专项处理人员,核实需要些时间,请您耐心等待,有结果我们会第一时间反馈。

售后工程师
2024-10-13 11:32:17
您好,您反馈的问题预计周一工作时间专员会和您联系沟通。

真累什么名字都不能用
2024-10-13 15:10:29
好的

售后工程师
2024-10-13 15:16:43
届时会有专员跟您联系沟通,有其他问题您随时反馈。

售后工程师
2024-10-14 17:22:07
您好

1 关于损失的情况,专员已和您电话沟通好方案,给您账号补偿500元代金券,已经发放完成,请您查看。

2 服务器里网站应用程序出现out of memory的问题,建议优化程序的内存使用,或者考虑给服务器升级配置增加内存。

3 对于第一次启动程序会出现out of memory,第二次启动程序就正常的情况,目前还没有排查到原因,如果要继续排查,避免影响您网站使用,请您给服务器创建一个镜像,把镜像共享给我们的测试账号(1833241755205400),我们用测试账号创建服务器进行分析排查看看,因为升级到第三方应用程序,也不能保证一定可以查到原因。

使用实例创建自定义镜像 https://help.aliyun.com/zh/ecs/user-guide/create-a-custom-image-from-an-instance?spm=a2c4g.11186623.0.i0

共享自定义镜像 https://help.aliyun.com/zh/ecs/user-guide/share-a-custom-image?spm=a2c4g.11186623.0.i3

真累什么名字都不能用
2024-10-14 18:25:11
这个创建镜像的流程看着比较麻烦,我晚上搞一下,谢谢

售后工程师
2024-10-14 19:00:17
好的,有问题,请您再反馈,谢谢

真累什么名字都不能用
2024-10-14 23:24:28
镜像已经创建好了,镜像名:Created_from_i-uf65h6i43ltlzhqolumy
售后工程师
2024-10-15 00:38:41
您好

请您参考:https://help.aliyun.com/zh/ecs/user-guide/share-a-custom-image?spm=a2c4g.11186623.0.i3 将您创建的镜像共享到这个1833241755205400账号的上海地域,共享完成后,请您工单反馈下,谢谢
真累什么名字都不能用
2024-10-17 12:37:37
o , 已经创建好了,忘记回复了

售后工程师
2024-10-17 13:02:37
您好,您的问题正在核实,请您不要关闭工单,等待我们进一步答复,谢谢

售后工程师
2024-10-17 14:05:39
您好,npm run docs:dev 是需要先切换到某一路径下在执行吗,目前登录测试服务器后多次执行查看均提示报错。
image.png

服务助手
2024-10-20 14:05:39

真累什么名字都不能用
2024-10-21 11:01:15
打电话聊聊?

真累什么名字都不能用
2024-10-21 11:02:52
主窗口用来执行命令的,使用 screen -r -d 开启了一个新窗口用来启动服务的。这个窗口进去的时候,就是系统运行的窗口,ctrl+c停止运行,但是必须5分钟内启动起来。 npm run docs:dev 启动项目

售后工程师
2024-10-21 12:19:42
您好

刚刚与您电话,您目前不确定再测试机上执行命令是否会影响您的网站,需要执行命令前提前与您确认下.

后续这边操作前会提前与您联系的,您稍等
售后工程师
2024-10-21 12:47:02
.
售后工程师
2024-10-21 13:17:51
您好,您的问题正在为您处理中,请您耐心等待回复。

售后工程师
2024-10-21 13:51:02
您好,经排查分析结果如下:
原因分析:报错原因是Node.js 的 max_old_space_size 设置太小而无法构建此应用程序。 您可以尝试通过设置 NODE_OPTIONS 环境变量来增加 max_old_space_size。
max_old_space_size 以 MB 为单位,默认情况下 max_old_space_size 是机器内存大小的一半。该值可以大于你机器的实际内存大小。
全文核心
解决方法:
先执行export NODE_OPTIONS=–max_old_space_size=2048 后,再执行npm run docs:dev 启动项目

我们多次在测试机上测试,问题可以解决。

售后工程师
2024-10-21 14:55:38
尊敬的客户,请您关注工单回复并进行验证,您可以在3天内继续反馈此工单与我们联系。如遇其它问题您可以提交新工单反馈。感谢您的支持!(如果您在工单中提供了账号密码等敏感信息,请您及时修改)

真累什么名字都不能用
2024-10-22 09:55:10
好的,我今天操作一下,么问题的话,我就关了,非常感谢
售后工程师

2024-10-22 09:57:00
您好,不客气。

真累什么名字都不能用
2024-10-23 22:12:02
嗯,可以了,谢谢

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/455304.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Matlab学习01-矩阵

目录 一&#xff0c;矩阵的创建 1&#xff0c;直接输入法创建矩阵 2&#xff0c;利用M文件创建矩阵 3&#xff0c;利用其它文本编辑器创建矩阵 二&#xff0c;矩阵的拼接 1&#xff0c;基本拼接 1&#xff09; 水平方向的拼接 2&#xff09;垂直方向的拼接 3&#xf…

shell脚本-函数

文章目录 一、函数介绍什么是函数、为什么使用函数、如何使用函数 二、shell脚本中如何定义函数Way1Way2Way3 三、shell脚本中如何调用函数四、shell脚本中使用内置变量(1、#、?、2等等)五、函数的返回值、shell脚本中函数的返回值函数的返回值概念shell脚本中函数的返回值ret…

梦金园三闯港交所上市:年营收200亿元,靠加盟模式取胜

近日&#xff0c;梦金园黄金珠宝集团股份有限公司&#xff08;以下简称“梦金园”&#xff09;向港交所递交IPO申请&#xff0c;中信证券为其独家保荐人。贝多财经了解到&#xff0c;这已经是梦金园第三次向港股发起冲击&#xff0c;此前曾于2023年9月、2024年4月两度递表。 继…

刷题 - 图论

1 | bfs/dfs | 网格染色 200. 岛屿数量 访问到马上就染色&#xff08;将visited标为 true)auto [cur_x, cur_y] que.front(); 结构化绑定&#xff08;C17&#xff09;也可以不使用 visited数组&#xff0c;直接修改原始数组时间复杂度: O(n * m)&#xff0c;最多将 visited 数…

Deepinteraction 深度交互:通过模态交互的3D对象检测

一.前提 为什么要采用跨模态的信息融合? 点云在低分辨率下提供必要的定位和几何信息&#xff0c;而图像在高分辨率下提供丰富的外观信息。 -->因此必须采用跨模态的信息融合 提出的原因? 传统的融合办法可能会由于信息融合到统一表示中的不太完美而丢失很大一部分特定…

磁珠的工作原理:【图文讲解】

1&#xff1a;什么是磁珠 磁珠是一种被动组件&#xff0c;用来抑制电路中的高频噪声。磁珠是一种特别的扼流圈&#xff0c;其成分多半为铁氧体&#xff0c;利用其高频电流产生的热耗散来抑制高频噪声。磁珠有时也称为磁环、EMI滤波器、铁芯等。 磁珠是滤波常用的器件&#xf…

SpringMVC常用注解

RequestMapping接口的映射&#xff0c;可以将HTTP请求映射到控制器方法上&#xff0c;通过这个注解使用不同的映射&#xff0c;就可以区分不同的控制器&#xff0c;其中RequestMapping中还有不同的属性&#xff0c;比如method&#xff0c;params&#xff0c;produces等在这里我…

快速搭建SpringBoot3+Prometheus+Grafana

快速搭建SpringBoot3PrometheusGrafana 一、搭建SpringBoot项目 1.1 创建SpringBoot项目 1.2 修改pom文件配置 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://…

25年山东高考报名时间为10月23日-29日

今日&#xff0c;山东省招生考试院发布关于《山东省2025年普通高等学校招生考试报名工作的通知》 其中高考报名时间定为&#xff1a;2024年10月23日29日&#xff08;每天9&#xff1a;0018&#xff1a;00&#xff09; 资格审查时间为&#xff1a;10月30日~11月11日 网上缴费时间…

Android问题记录 - 适配Android Studio Ladybug/Java 21/AGP 8.0

文章目录 前言开发环境问题描述问题分析1. 适配Java 212. 适配AGP 8.0 解决方案补充内容最后 前言 Android Studio版本从Koala Feature Drop升级到Ladybug&#xff0c;出现了一系列报错。 开发环境 Flutter: 3.24.3Android Studio: 2024.2.1 Patch 1Java: 21.0.3Gradle: 7.4…

FPGA实现PCIE采集电脑端视频转SFP光口万兆UDP输出,基于XDMA+GTX架构,提供2套工程源码和技术支持

目录 1、前言工程概述免责声明 2、相关方案推荐我已有的PCIE方案10G Ethernet Subsystem实现万兆以太网物理层方案 3、PCIE基础知识扫描4、工程详细设计方案工程设计原理框图电脑端视频PCIE视频采集QT上位机XDMA配置及使用XDMA中断模块FDMA图像缓存UDP视频组包发送UDP协议栈MAC…

高效改进!防止DataX从HDFS导入关系型数据库丢数据

高效改进&#xff01;防止DataX从HDFS导入关系型数据库丢数据 针对DataX在从HDFS导入数据到关系型数据库过程中的数据丢失问题&#xff0c;优化了分片处理代码。改动包括将之前单一分片处理逻辑重构为循环处理所有分片&#xff0c;确保了每个分片数据都得到全面读取和传输&…

Git文件操作指令和文件状态

一、Git 文件操作指令 1、查看指定文件的状态 git status [filename] 我们在新创建且初始化过后的 git 仓库中新建一个 文件&#xff0c;然后在 git 的命令行中输入此指令后&#xff0c;就可以看到 的状态&#xff1a; 在此显示的是 Untracked 的状态&#xff0c;也就是未…

visual studio设置修改文件字符集方法

该方法来自网文&#xff0c;特此记录备忘。 添加两个组件&#xff0c;分别是Force UTF-8,FileEncoding。 截图如下&#xff1a; 方法如下&#xff1a;vs中点击“扩展”->“管理扩展”&#xff0c;输入utf搜索&#xff0c;安装如下两个插件&#xff0c;然后重启vs&#xf…

【pytorch DistributedDataParallel 及amp 使用过程遇到的问题记录 】

目录 环境问题单机多卡时&#xff1a;超时错误部分报错内容:解决方法: 存在没有使用梯度的参数报错内容:解决方法:方法1 找到不参与梯度计算的层**且**没有用处的层&#xff0c;删除方法2 DistributedDataParallel 增加参数:find_unused_parameters True DDP 训练时第一个batc…

2 两数相加

解题思路&#xff1a; \qquad 这道题可以用模拟很直观的解决&#xff0c;模式加法的计算过程&#xff0c;只不过套了一层链表的外衣。题目给出的数字在链表中是按照逆序排列的&#xff0c;即链表头节点的值代表相加数字的个位&#xff0c;这样只需要从链表头开始计算加法即可得…

系统登录接口文档Demo

接口描述 该接口用于用户登录验证。通过用户名和密码进行身份验证&#xff0c;成功后返回一个用于后续请求的认证 token。这个 token 是访问受保护资源的凭证。 时序图&#xff1a; 登录请求&#xff1a; 登录查询接口: POST {url}/api/user/login 请求体: {"username…

简单的 curl HTTP的POSTGET请求以及ip port连通性测试

简单的 curl HTTP的POST&GET请求以及ip port连通性测试 1. 需求 我们公司有一个演示项目&#xff0c;需要到客户那边进行项目部署&#xff0c;项目部署完成后我们需要进行项目后端接口的测试功能&#xff0c;但是由于客户那边么有条件安装类似于postman这种的测试工具&am…

Linux:进程优先级 进程调度切换 调度算法

#1024程序员节&#xff5c;征文# 目录 1.进程优先级 1.1 概念 1.2 为什么有优先级 1.3 Linux进程优先级 2. 概念预备 2.1 并发 2.2 寄存器 主要类型&#xff1a; 2. 进程的调度与切换 3.1 进程调度 3.2 进程切换 4. 调度算法 4.1 runqueue内部结构 4.2 如何调度…

Git使用GUI界面实现任意历史版本对比

首先进入版本历史查看界面 标记某次提交 选择某次提交并和标记的提交对比 可以查看比较结果了&#xff0c;具体到每一个文件每一行代码