GreatSQL是MySQL的一个分支,专注于提升MGR(MySQL Group Replication)的可靠性及性能。乐维监控平台可以有效地监控GreatSQL,帮助用户及时发现并解决潜在的性能问题。
通过在GreatSQL服务器上安装监控代理,收集数据库性能数据,进而配置监控项,配置需要监控的GreatSQL指标,再为关键性能指标设置告警阈值,在性能下降或出现问题时及时通知,即可实现对GreatSQL数据库的监控。
PART01 性能相关关键指标
01事务指标1. 每秒事务量。帮助用户了解数据库在单位时间内的工作负载强度。如果每秒事务量突然下降或者远超正常水平,都可能暗示数据库出现性能问题或业务负载的异常变化。2. 事务提交数量和事务回滚数量。提交和回滚的事务数量对比可以反映事务执行的成功率。较高的回滚率可能表示应用程序逻辑错误、数据冲突或者数据库约束问题。这两个指标对于评估数据库事务的健康状况至关重要。3. 事务锁等待数量和事务锁住内存大小。过多的锁等待数量表明可能存在严重的并发冲突,会导致事务执行延迟。事务锁住内存大小则可以帮助判断锁操作对内存资源的占用情况,有助于发现潜在的内存瓶颈。02查询指标1. 每秒慢查询。慢查询是数据库性能的关键瓶颈。大量的慢查询会显著影响系统响应时间和用户体验。监控每秒慢查询数量可以及时发现性能问题,并且通过对慢查询的分析可以针对性地优化查询语句或者数据库结构。2. 每秒查询操作总数量。和每秒事务量类似,它从查询操作的角度反映数据库的负载情况。结合慢查询指标,可以更全面地评估数据库的查询性能,了解数据库的繁忙程度以及用户对数据库的访问模式。03I/O指标1. 每秒提取缓存数据写入硬盘数据量。体现了数据库的I/O操作频率和数据流动情况。频繁的数据写入硬盘可能会导致I/O瓶颈,特别是在高并发或者大数据量的场景下。这个指标对于评估数据库存储系统的性能以及缓存策略的有效性很重要。2. I/O线程运行状态。I/O线程负责数据库的数据读写操作。其运行状态直接关系到数据库的I/O性能。如果I/O线程出现故障或者长时间处于阻塞状态,会严重影响数据库的读写功能。
PART02 可用性和连接相关关键指标
01连接指标1. 数据库当前连接数和每秒试图连接到服务器的连接数。数据库连接数反映了当前数据库的负载情况。如果连接数接近或超过数据库最大连接数,可能会导致新的连接请求被拒绝,影响应用程序的正常访问。每秒试图连接的数量可以帮助预测连接数的增长趋势,提前做好资源规划和性能优化。2. 线程缓存内的线程的数量和激活的线程数。线程用于处理数据库的各种操作,包括查询、事务等。线程缓存数量和激活线程数可以帮助评估数据库线程资源的使用情况。合理的线程管理可以提高数据库的并发处理能力和性能。02状态指标1. 数据库状态和服务器运行时间。数据库状态直接表明数据库是否正常运行。服务器运行时间可以作为数据库稳定性的一个参考指标,长时间稳定运行的数据库通常更可靠。如果数据库状态频繁改变或者服务器运行时间过短(频繁重启),可能表示存在潜在的问题。2. slave状态(主从架构中)。在主从复制环境下,slave状态对于数据的同步和备份至关重要。如果slave状态异常,可能导致数据不一致或者备份失败,影响数据库的可用性和数据安全性。
PART03 数据安全和一致性关键指标
01日志和备份指标1. binlog日志占用的空间大小和统计binlog日志数量。binlog日志用于记录数据库的更改操作,对于数据恢复和复制非常重要。监控其空间大小和数量可以确保日志存储正常,并且能够及时发现异常增长或者日志丢失的情况。2. 日志序列号码和日志最后检查点。这些指标用于跟踪日志的位置和状态,对于数据库的恢复和一致性检查至关重要。它们可以帮助确保数据库在故障恢复时能够正确地应用日志,保证数据的完整性。