OceanBase 的ODP的路由说明
一、简述为什么使用ODP的原因
(强一致性情况下)
1.分布式数据库在SQL解析这块存在本地执行计划,远程执行计划,分布式执行计划。
本地执行计划:整个SQL的表都在session所在的Observer 节点上。
远程执行计划:整个SQL的表都不在session所在的Observer 节点上,但是全部分布在另外一个Observer节点上。
分布式计划:分区主副本存在跨多个Observer节点的情况,会触发数据的重分布,然后再进行SQL部分的jion计算。
2.本地,远程,分布式的情况说明
本地执行计划:可以说ODP多了一条网络连接耗时。
远程执行计划:存在Observer1将SQL解析后,将PLAN传给Observer2的情况,存在网络开销(PLAN>SQL)。并且会将结果传给Observer1,在反馈给ODP,最终反馈给客户。
如果Observer1直接将SQL传给Observer2,会进行硬解析。
分布式执行计划:对SQL进行解析,然后产生大量的数据重分布问题,然后再进行SQL部分的jion运算,并进行合并,导致占用大量的时间。
二、ODP的作用
前言:ODP 可以进行轻量级别的SQL解析,并根据本地的路由缓存进行SQL链路,减少远程执行计划,分布式执行计划的网络方面的消耗。
ODP路由的功能与策略
OBproxy 会通过proxy@sys账户获取租户的信息,然后根据租户的信息,以及根据SQL的from语句部分与where条件部分进行对比,确定路由规则(LDC,Leader,读写分离等),获取本地缓存的路由表(如果过期,会在接触到Observer后,反馈给ODP,然后进行目标Observer寻址),然后进行黑白名单确认,确认后,转发SQL。 转发SQL成功后,新的Observer会更替ODP的本地路由表。