1. 前言
昨天给大家分享了【DBA从入门到实践】第八期:OceanBase数据库诊断调优、认证体系和用户实践 中obdiag的部分,今天将其中的内容以博客的形式给大家展开一下,方便大家阅读。
2. 正文
在介绍敏捷诊断工具之前,先说说OceanBase数据库问题的分类,从我们处理的工单、论坛的问题、用户的反馈情况总体来看,故障的类型可以分为两大类,一类是SQL类的问题,一类是非SQL类的问题。SQL类型的问题包括烂SQL\慢SQL\异常SQL,非SQL的问题就比较多了,比如磁盘IO、内存、cpu、网络问题、集群配置不合理、主机配置的问题、合并转储问题等等。
软件下载中心: OceanBase分布式数据库-海量数据 笔笔算数
•一键集群巡检:使用 obdiag check 命令可帮助 OceanBase 数据库集群相关状态巡检,目前支持从系统内核参数、内部表等方式对 OceanBase 的集群进行分析,发现已存在或可能会导致集群出现异常问题的原因分析并提供运维建议。
•一键诊断分析:使用 obdiag analyze 命令可帮助 OceanBase 数据库相关的诊断信息分析,目前支持对 OceanBase 的日志进行一键分析,找出发生过的错误信息;一键全链路诊断分析,展示全链路诊断树,定位链路慢在何处。
•一键信息收集:使用 obdiag gather 命令可帮助 OceanBase 数据库相关的诊断信息收集。目前支持基础诊断信息收集和基于场景的诊断信息一键收集。
•一键根因分析:使用 obdiag rca 命令可帮助 OceanBase 数据库相关的诊断信息分析,目前支持对 OceanBase 的异常场景进行分析,找出可能导致问题的原因。
3. 总结
OceanBase是原生分布式数据库系统,故障根因分析通常是比较繁琐的,因为涉及的因素可能有很多,如机器环境、配置参数、运行负载等等。专家在排查问题的时候需要获取大量的信息来分析故障,如何高效的获取故障场景下分散在各个节点的信息,挖掘出其中的关联性,帮助用户自助诊断问题便是obdiag的价值。后续obdiag就将SQL Diagnoser的能力实现。
4. 结语
为了构建完善的OceanBase诊断生态系统,汇聚各方力量,形成涵盖工具、知识在内的全方位诊断生态体系,助力开发者更高效地驾驭 OceanBase,OceanBase 社区也成立了诊断SIG,名称:obdiag SIG。obdiag sig成立公告参见: OceanBase 开源社区新进展🥰|obdiag SIG成立
加入obdiag SIG 方式:请添加 OB社区小助手(微信号:obce666)并备注“obdiag SIG”,工作人员会联系并指引您加入SIG的相关事宜。
5. 附录
- obdiag 下载地址: OceanBase分布式数据库-海量数据 笔笔算数
- obdiag 官方文档: OceanBase分布式数据库-海量数据 笔笔算数
- obdiag github地址: https://github.com/oceanbase/oceanbase-diagnostic-tool
- obdiag SIG 营地: 诊断工具 · OceanBase 技术交流