论文-分布式-分布式计算|容错-分布式控制下的自稳定系统

  • 参考文献
  • Self-stabilizing systems in spite of distributed control
  • 可以把松散耦合的 循环序列过程 间的同步任务,看成是要保持一个这样的不变性:“系统要处于一种合法状态”
  • 因此每个进程在运行每一个可能会改变不变性的步骤之前都要先检查一下是可以执行,还是要延迟执行
  • 如果允许不同进程互斥地访问记录有“当前系统状态”的公共存储,解决方案就很简洁—并且可以很系统化地实现
  • 如果没有一个所有进程都可以访问的公共存储模块的话,复杂度就会增加,因为当前系统的状态就不得不分布式地存储在各个进程内的变量中;
  • 进一步地,如果再对通信进行限定,比如每个进程只能与它的邻居进行通信,复杂度还会上升
  • 问题的复杂性在于单个进程的状态只能被整个系统状态中对它可用的那一部分影响,而进程本地动作要基于本地信息实现全局性的目标
  • 这样的系统(可以称之为“分布式控制”系统)已经被设计出来,但是当时所知的所有设计都不是“自稳定”的,也就是说它们一旦进入非法状态,就会永远处于这种状态
  • 考虑一个由少数边连接的图,图中每个节点对应一个有限状态机;
  • 图中直接相连的那些状态机,它们相互之间称为邻居
  • 每个状态机定义一个或多个"特权",比如是关于它自己和邻居状态的一组布尔函数;
  • 当布尔函数值为 true 时,我们就认为对应的特权“存在”
  • 我们引入一个中央守护进程,采用中央守护进程只是为了方便说明,实际上可以采用一个分布式的 守护进程 来完成,具体算法本文没有涉及
  • 一个简单的观察是如果享有 特权 的是不相邻的状态机,它们的转换是可以并行进行的,它们不需要同步,因为并行运行的结果与通过一个中央守护进程选择一个进行执行是一致的,因为选择一个执行之后,由于它们两个不相邻,因此另一个的邻居状态不会改变,在新的状态中另一个依然是享有特权者,下一次可以继续选择它,而相邻的实际上因为可以相互通信,它们自己可以协调到底是谁进行状态转换
  • 在下面的状态转换手动演练中,实际上我们就充当了中央守护进程的角色,在有多个 特权 存在的情况下,选择其中一个进行状态转换,通过它从“存在”的 特权 中选择一个进行状态转换,每个合法状态中可能有多个特权“存在”,所以需要从里面选择一个进行状态转换
  • 允许多个享有特权者是一种更通用的需求,只有一个享有特权者的情况是互斥锁,而多个则可以类比信号量
  • 拥有该被选定的 特权 的状态机可以进行状态转换—根据一个以它的老状态和邻居状态为输入的状态函数进入新状态
  • 对于不止有一个 特权“存在”的状态机来说,新状态可能还依赖于被选定的特权
  • 状态转换完成后,守护进程再选择一个新的特权
  • 可以通过如下全局规则判断系统是否处于合法状态
  • 要求:
    • 1. 每个合法状态,必须至少要有一个 特权“存在”
    • 2. 在合法状态的每一个执行步骤都要确保系统还是会处于合法状态
    • 3. 每个 特权 至少出现在一个合法状态中
    • 4. 对于任意两个合法状态来说,总是可以通过一定执行步骤从一个到达另一个
  • 我们称一个系统是“自稳定”的,当且仅当无论系统初始状态如何也无论每次为下一个执行步骤选定的 特权 是谁,可以保证在有限数目的执行步骤之后总是至少存在一个 特权 并且系统可以发现它自己处于合法状态
  • “自稳定”的系统是否能通过各节点的本地执行步骤来满足上述的全局性条件,本来也不是可以很直接地得出结论
  • 而守护进程的不确定性引入了额外的复杂度
  • 实际上该问题可以通过如下三个方案解决:
  • 在如下三个解决方案中,我们假设有 N+1 个进程,它们以 0…N 进行编号
  • 假设当前机器编号为 nr.i
  • L,代表机器的左邻居的状态,对应的机器编号为 nr.(i-1) mod (N+1)
  • S,代表当前机器自己的状态,编号为 nr.i
  • R,代表机器的右邻居的状态,对应的机器编号为 nr.(i+1) mod (N+1)
  • 换句话说,我们假设机器是像环一样连接在一块
  • 机器 nr.0 又称为“底部机器”,机器 nr.N 则又被称为“顶部机器”
  • 同时在这里我们将那些只有一个 特权“存在”的状态作为合法状态
  • 同时所有的方案描述,均采用了如下格式:
  • “if privilege then corresponding move fi” 如果有特权,那么就进行相应的操作
  • Solution with K-state Machines (K>N)
  • 每个机器的状态由一个整数 S 表示,并且0=<S<K
  • 对于每个机器来说,只定义一个 特权,具体如下:
  • 对于底部机器来说,if L = S then S := (S+1)mod K fi
  • 对于其他机器来说,if L != S then S := L fi
  • 说明 1:对于一个中央式的守护进程来说,K>=N 就可以了
  • 说明 2:C.S.Scholten 扩展了该解决方案,使之可以应用到任意网络结构
  • 根据格式“if privilege then corresponding move fi”,我们可以看出,在上面的解决方案中,对于 底部机器 来说 L=S 就是 特权,意味着如果 L=S 它就是享有特权者,对于其他机器来说 L!=S 就是 特权,意味着如果 L!=S 它就是享有特权者
  • 我们可以以 3 个状态机为例,令 K=4,根据上面的算法进行模拟运行可以发现,即使一开始不满足有一个特权者,执行一段时间后会进入只有一个特权者的状态,并且此后一直处于只有一个特权者的状态
  • 比如如下状态转换序列,如下数组中的值分别代表编号为 0,1,2 的状态机的状态值
  • [0, 1, 2] -> [0, 0, 2] -> [0, 0, 0] -> [1, 0, 0] -> [1, 1, 0] -> [1, 1, 1] -> [2, 1, 1] -> [2, 2, 1] -> [2, 2, 2]……
  • 如上,初始状态状态机 0,1,2 对应的 S 值为[0, 1, 2]
  • 根据方案描述:
    • 对于状态 1 来说状态值是 1,左右值分别是 0 和 2,因此满足 L!=S,所以此时状态机 1 享有特权
    • 对于状态机 2 来说状态值是 2,左右值分别是 1 和 0,因此也满足 L!=S,因此它也是享有特权者
    • 对于 0 来说,要看 L 是否等于 S,由于 0 的左右值是 2和 1,因此它不享有特权
  • 可以看到这个初始状态,有两个享有特权者,不满足上面关于合法状态中只有一个特权者的定义
  • 然后我们根据状态转换函数,从初始状态开始不断进行状态转换,可以看到到了[0, 0, 0]后,变成了只有状态机 0为特权者,而此后就一直处于只有一个享有特权者的状态
  • 可以看到整个过程中,就是从初始处于非法状态,然后经过一定步骤进入了合法状态,此后就一直处于合法状态
  • 而这个过程中,进程只看了它左右邻居的状态,通过局部信息就实现了只有一个享有特权者这一全局性需求
  • 这实际上说明了在分布式系统中,我们仅通过部分节点的局部信息不需要得到全局状态,就可以实现全局性的状态要求
  • 其他两个方案代表的含义与上述解决方案类似,有个区别是状态机定义了两个特权
  • 以第三个方案为例,我们再手动模拟一个状态转换过程,假设有 4 个状态机,它们的初始状态值分别为[0,1,2,0]:
  • 按照下面的算法描述,可以得到如下一个状态转换过程
  • [0,1,2,0] 此时 0,1,2 均为享有特权者,选择 0 进行状态转换
  • [2,1,2,0] 此时 1,2 为享有特权者,选择 1 进行状态转换
  • [2,2,2,0] 此时 2,3 为享有特权者,选择 2 进行状态转换
  • [2,2,0,0] 此时 1 为享有特权者,1 进行状态转换
  • [2,0,0,0] 此时 0 为享有特权者,0 进行状态转换……
  • 可以看到,依然是初始不合法,然后一定步骤后变成合法,之后一直合法
  • 方案 3 具体算法如下:

  • 上述三个解决方案说明:对于一个分布式系统来言,即使节点只能跟所有节点中的部分节点进行通信,对于上述特权者(互斥,任意时刻只有一个特权者)问题而言,存在一个“自稳定”的算法
  • 无论系统初始状态如何,经历一定步骤之后它都可以进入合法状态
  • “自稳定”属性使得分布式算法可以从暂态错误中恢复
  • Dijskstra 在论文中提出了“自稳定”概念,并以上述“令牌环”问题为例给出了相应的自稳定算法
  • 在“令牌环”场景下,计算机网络连接成环状,每个计算机可以获取它前面的那个计算机的状态,该状态可以显示该计算机“持有令牌”还是“不持有令牌”
  • 对应的算法要满足如下两个条件:
  • 1.任意时刻只有一个计算机持有令牌
  • 2.持有令牌的计算机会将令牌传给它后面的计算机,最终该令牌可以在环上循环流转
  • 不持有令牌对于单个计算机来说是合法的,但是如果所有计算机都不持有令牌,对于整个系统来说就是非法的
  • 类似的,如果有不止一个计算机持有令牌,也是非法的,但是对于每个计算机来说这很难发现,因为他们每个都只能与邻居通信
  • 因此,论文中的算法并没有去检测错误,而是确保系统不断向着合法状态前进
  • 而且那个时候用于错误检测的传统方法很困难而且很耗时
  • 但是随着新的更高效的错误检测算法的提出,基于错误检测还可以将非自稳定算法结合自稳定算法实现更高效的自稳定算法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/172475.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Error: no matching distribution found for tensorflow-cpu==2.6.*

目录 install_tensorflow()安装过程中遇到的问题 查找解决方案过程中&#xff1a; 解决办法&#xff1a; install_tensorflow()安装过程中遇到的问题 在服务器上安装tensorflow时&#xff0c;遇到了一个报错信息&#xff1a; 在网上找到一个类似的错误&#xff08;TensorFlow…

米软科技客户单病种上报量云南省第一

近日米软获悉&#xff0c;在云南省统计的单病种上报情况中&#xff0c;截止2021年11月15日&#xff0c;上线单病种系统不足半年的红河州第一人民医院&#xff08;云南省滇南中心医院&#xff09;以占全省上报总数5%的22950例&#xff0c;遥遥领先于同省各家二三级医院。 全省上…

机器学习之查准率、查全率与F1

文章目录 查准率&#xff08;Precision&#xff09;&#xff1a;查全率&#xff08;Recall&#xff09;&#xff1a;F1分数&#xff08;F1 Score&#xff09;&#xff1a;实例P-R曲线F1度量python实现 查准率&#xff08;Precision&#xff09;&#xff1a; 定义&#xff1a; …

深度学习与计算机视觉(一)

文章目录 计算机视觉与图像处理的区别人工神经元感知机 - 分类任务Sigmoid神经元/对数几率回归对数损失/交叉熵损失函数梯度下降法- 极小化对数损失函数线性神经元/线性回归均方差损失函数-线性回归常用损失函数使用梯度下降法训练线性回归模型线性分类器多分类器的决策面 soft…

前端移动web高级详细解析二

移动 Web 第二天 01-空间转换 空间转换简介 空间&#xff1a;是从坐标轴角度定义的 X 、Y 和 Z 三条坐标轴构成了一个立体空间&#xff0c;Z 轴位置与视线方向相同。 空间转换也叫 3D转换 属性&#xff1a;transform 平移 transform: translate3d(x, y, z); transform…

Tensorflow2 中模型训练标签顺序和预测结果标签顺序不一致问题解决办法

本篇文章将详细介绍Tensorflow2.x中模型训练标签顺序和预测结果标签顺序不一致问题&#xff0c;这个问题如果考虑不周&#xff0c;或者标签顺序没有控制好的情况下会出现预测结果精度极其不准确的情况。 训练数据集的结构&#xff1a;数据集有超过10的类别数&#xff0c;这里包…

深入理解Java IO流: 包括字节流和字符流的用法、文件读写实践

文章目录 &#x1f4d5;我是廖志伟&#xff0c;一名Java开发工程师、Java领域优质创作者、CSDN博客专家、51CTO专家博主、阿里云专家博主、清华大学出版社签约作者、产品软文创造者、技术文章评审老师、问卷调查设计师、个人社区创始人、开源项目贡献者。&#x1f30e;跑过十五…

Vue 项目进行 SEO 优化

SSR 服务器渲染 服务端渲染, 在服务端 html 页面节点, 已经解析创建完了, 浏览器直接拿到的是解析完成的页面解构 关于服务器渲染&#xff1a;Vue 官网介绍 &#xff0c;对 Vue 版本有要求&#xff0c;对服务器也有一定要求&#xff0c;需要支持 nodejs 环境。 优势: 更好的 …

apk反编译修改教程系列-----修改apk中的图片 任意更换apk桌面图片【三】

往期教程&#xff1a; apk反编译修改教程系列-----修改apk应用名称 任意修改名称 签名【一】 apk反编译修改教程系列-----任意修改apk版本号 版本名 防止自动更新【二】 这次实例演示下如何更换apk安装后的桌面图标图片。其实这个步骤前面我有一个教程贴。这次针对步骤做个补…

基于Kubesphere容器云平台物联网云平台Devops实践

基于Kubesphere容器云平台物联网云平台Devops实践 项目背景 ​ 公司是做工业物联网相关业务的&#xff0c;现业务是云平台&#xff0c;技术栈 后端为 Springboot2.7JDK11 &#xff0c;前端为 Vue3Ts&#xff0c;需要搭建自动化运维平台以实现业务代码自动部署上线&#xff0c;…

B站视频下载工具的分享

直接解压使用1.5.9版本的就可以。 资源&#xff1a;链接&#xff1a;https://pan.baidu.com/s/1zWJWzxVss4h2lmMhCFFzDg?pwdw1v8 提取码&#xff1a;w1v8 先解压 解压 双击使用

day06-Flex布局

Flex布局 目标&#xff1a;熟练使用 Flex 完成结构化布局 01-标准流 标准流也叫文档流&#xff0c;指的是标签在页面中默认的排布规则&#xff0c;例如&#xff1a;块元素独占一行&#xff0c;行内元素可以一行显示多个。 02-浮动 基本使用 作用&#xff1a;让块元素水平排…

评论功能的选择难题:数据结构如何选定?

尊敬的小伙伴们&#xff0c;大家好&#xff01;我是小米&#xff0c;一个热爱技术、热衷分享的90后程序员。今天&#xff0c;我要和大家一起探讨一个在软件开发中常见&#xff0c;却又充满深度的话题——"面试题&#xff1a;评论功能采用什么数据结构&#xff1f;"。…

UE4/UE5 设置widget中text的字体Outline

想要在蓝图中控制Widget 中的 text字体&#xff0c;对字体outline参数进行设置。 但是蓝图中无法直接获取设置outline参数的方法&#xff1a; 没有outline相关的蓝图函数 该参数本身是在Font类别下的扩展&#xff0c;所以只要获取设置Font参数即可进行outline的设置 text连出…

顺序表的定义与实现(数据结构与算法)

一、顺序表的定义 1. 顺序表的定义 #define MaxSize 10 //定义最大长度 typedef struct{ ElemType data[MaxSize]; //用静态的“数组”存放数据元素int length; //顺序表的当前长度 …

设计模式:原型模式(C#、JAVA、JavaScript、C++、Python、Go、PHP)

上一篇《访问者模式》 下一篇《享元模式》 简介&#xff1a; 原型模式&#xff0c;它是一种创建型设计模式&#xff0c;它允许通过复制原型对象来创建新的对象&#xff0c;而无需知道创建的细节。其工作原…

[C++]——带你学习类和对象

类和对象——上 目录&#xff1a;一、面向过程和面向对象二、类的概念三、类的访问限定符和封装3.1 访问限定符3.2 封装 四、类的作用域五、类的实例化六、类的对象大小的计算七、类成员函数this指针7.1 this指针的引用7.2 this 指针的特性 目录&#xff1a; 类和对象是很重要…

职业技术认证:《研发效能(DevOps)工程师》——开启职业发展新篇章

在互联网行业中&#xff0c;资质认证可以证明在该领域内的专业能力和知识水平。各种技术水平认证也是层出不穷&#xff0c;而考取具有公信力和权威性的认证是从业者的首选。同时&#xff0c;随着国内企业技术实力的提升和国家对于自主可控的重视程度不断提高&#xff0c;国产证…

synchronized 的锁类型

之前的文章有讲过对同步锁的理解&#xff0c;实现同步锁的方式无非是多个线程抢占一个互斥变量&#xff0c;如果抢占成功则表示获得了锁&#xff0c;而没有获得锁的线程则阻塞等待&#xff0c;直到获得锁的线程释放锁 如图所示&#xff0c;在Mark Word中&#xff0c;我们发现锁…

Linux 基本语句_8_C语言_文件控制

为了解决多个进程同时操作一个文件&#xff0c;产生一些情况&#xff0c;通常对文件进行上锁&#xff0c;已解决对共享文件的竞争 对打开文件进行各种操作&#xff1a; int fcentl(int fd, int cmd, .../*arg*/如果cmd与锁操作有关&#xff0c;那么fcentl函数的第三个参数就要…