监控目标
监控 Linux 服务器的基本信息以及各项性能指标,包括:
-
CPU
-
内存、Swap
-
网络
-
文件系统、磁盘 IO
解决方案
使用 Node exporter 收集硬件以及操作系统内核的指标数据,并通过 HTTP API 提供数据
使用 Vector agent 通过 Node exporter HTTP API 采集数据,并将数据通过 HEI 导入指定的数据集
使用仪表板展示 Linux 节点的状态信息
操作步骤
1、部署 Node exporter [操作步骤]
(https://prometheus.io/docs/guides/node-exporter/#installing-and-running-the-node-exporter)
(详细代码请至官网加入鸿鹄技术社区获取)
2、创建数据集 [操作步骤]
(https://www.yanhuangdata.com/honghu_manual/docs/data_management/eventset/#%E5%88%9B%E5%BB%BA%E6%95%B0%E6%8D%AE%E9%9B%86)
如使用已经存在的数据集,可跳过此步骤
3、创建 HEI endpoint [操作步骤]
(https://www.yanhuangdata.com/honghu_manual/docs/gdi/push_based/#%E6%96%B0%E5%BB%BAhei%E7%AB%AF%E5%8F%A3%E6%8E%A5%E6%94%B6%E6%95%B0%E6%8D%AE)
如使用已经存在的 HEI endpoint,可跳过此步骤
4、部署 Vector agent 导入数据 [操作步骤]
(https://vector.dev/docs/setup/quickstart/)
(详细代码请至官网加入鸿鹄技术社区获取)
5、导入 Linux 主机监控仪表板 [操作步骤]
(https://www.yanhuangdata.com/honghu_manual/docs/dashboard/#%E5%88%9B%E5%BB%BA%E4%BB%AA%E8%A1%A8%E6%9D%BF)
📎linux_node_monitoring.json
(具体内容请至官网加入鸿鹄技术社区获取)
仪表板 Screenshot
Linux 主机监控
后续工作
上述监控方案实现了 Linux 主机指标数据的仪表板展示,后续还将针对关键主机指标数据配置告警功能,提高异常状况出现后的响应速度。