进化策略算法

前言

进化策略 (Evolution Strategy) 后面都简称 ES,其本质就是:种群通过交叉产生后代,我们只保留较好的父代和子代,一直这样迭代下去,
我们的保留方式是:

父代产生后代,然后将后代DNA和原来的父母DNA合并,然后根据适应度排序,
然后选取前POP_SIZE的个体,重新组成一个种群

相关文章:
微生物进化算法(MGA)
遗传算法
前两个文章都是以长度大于1的列表当作DNA序列,
本次我们用实数来代替,即DNA就是一个实数,长度为1

遗传算法(GA)和进化策略(ES)的区别:

  • 选好父母进行繁殖 (GA); 先繁殖, 选好的孩子 (ES)
  • 通常用二进制编码 DNA (GA); 通常 DNA 就是实数, 比如 1.221 (ES)
  • 通过随机让 1 变成 0 这样变异 DNA (GA); 通过正态分布(Normal distribution)变异 DNA (ES)

传统的 GA 的 DNA 形式是这样:

DNA=11010010

而传统的 ES DNA 形式分两种, 它有两条 DNA. 一个 DNA 是控制数值的, 第二个 DNA 是控制这个数值的变异强度. 比如一个问题有4个变量. 那一个 DNA 中就有4个位置存放这4个变量的值 第二个 DNA 中就存放4个变量的变动幅度值.

DNA1=1.23, -0.13, 2.35, 112.5 可以理解为4个正态分布的4个平均值.

DNA2=0.1, 2.44, 5.112, 2.144 可以理解为4个正态分布的4个标准差.

所以这两条 DNA 都需要被 crossover(交叉) 和 mutate(变异).

基础进化策略

本次以寻找曲线最大值为例
在这里插入图片描述

首先我们需要通过种群产生后代

首先的 make_kid 功能. 我们随机找到一对父母, 然后将父母的 DNA 和 mut_strength 基因都 crossover 给 kid. 然后再根据 mut_strength mutate 一下 kid 的 DNA. 也就是用正态分布抽一个 DNA sample. 而且 mut_strength 也能变异. 将变异强度变异以后, 他就能在快收敛的时候很自觉的逐渐减小变异强度, 方便收敛.

def make_kid(pop, n_kid):"""生成孩子:param pop::param n_kid::return:"""# DNAkids = {'DNA': np.empty((n_kid, DNA_SIZE))}# 变异强度kids['mut_strength'] = np.empty_like(kids['DNA'])for kv, ks in zip(kids['DNA'], kids['mut_strength']):# 随机从种群选取两个个体,一个父亲DNA,一个母亲DNAp1, p2 = np.random.choice(np.arange(POP_SIZE), size=2, replace=False)# 生成要变异的结点cp = np.random.randint(0, 2, DNA_SIZE, dtype=np.bool_)  # crossover points# 将父DNA和母DNA交叉生成子DNAkv[cp] = pop['DNA'][p1, cp]kv[~cp] = pop['DNA'][p2, ~cp]# 将父变异强度序列和母变异强度序列交叉生成子变异强度序列ks[cp] = pop['mut_strength'][p1, cp]ks[~cp] = pop['mut_strength'][p2, ~cp]# 将变异强度也产生一定的变异ks[:] = np.maximum(ks + (np.random.rand(*ks.shape)-0.5), 0.)    # 实现将变异强度限制在非负数范围内# 根据正态分布变异 mutate (change DNA based on normal distribution)kv += ks * np.random.randn(*kv.shape)  # 用于生成符合标准正态分布(均值为0,方差为1)的随机数,形状和kv的一样# 将数组中的元素限制在一个指定的范围内 它将数组中小于指定最小值的元素替换为最小值,将大于指定最大值的元素替换为最大值kv[:] = np.clip(kv, *DNA_BOUND)    # clip the mutated valuereturn kids

之后我们将产生的后代和原来的种群合并,然后筛选重新组成一个种群

def kill_bad(pop, kids):"""将孩子DNA和原来的父母DNA合并,然后根据适应度排序,然后选取前POP_SIZE的个体,重新组成一个种群:param pop::param kids::return:"""# put pop and kids together#将孩子DNA和原来的父母DNA合并for key in ['DNA', 'mut_strength']:pop[key] = np.vstack((pop[key], kids[key]))# 获取适应度fitness = get_fitness(F(pop['DNA']))            # calculate global fitness# 然后根据适应度排序,然后选取前POP_SIZE的个体,重新组成一个种群idx = np.arange(pop['DNA'].shape[0])good_idx = idx[fitness.argsort()][-POP_SIZE:]   # selected by fitness ranking (not value)for key in ['DNA', 'mut_strength']:pop[key] = pop[key][good_idx]return pop

完整代码如下:

#!/usr/bin/env python 
# -*- coding:utf-8 -*-
import numpy as np
import matplotlib.pyplot as pltDNA_SIZE = 1             # DNA (real number)  DNA大小
DNA_BOUND = [0, 5]       # solution upper and lower bounds
N_GENERATIONS = 200
POP_SIZE = 100           # population size
N_KID = 50               # n kids per generationdef F(x): return np.sin(10*x)*x + np.cos(2*x)*x     # to find the maximum of this functiondef get_fitness(pred):"""返回适应度:param pred::return:"""return pred.flatten()  #将多维数组压平为一维数组。def make_kid(pop, n_kid):"""生成孩子:param pop::param n_kid::return:"""# DNAkids = {'DNA': np.empty((n_kid, DNA_SIZE))}# 变异强度kids['mut_strength'] = np.empty_like(kids['DNA'])for kv, ks in zip(kids['DNA'], kids['mut_strength']):# 随机从种群选取两个个体,一个父亲DNA,一个母亲DNAp1, p2 = np.random.choice(np.arange(POP_SIZE), size=2, replace=False)# 生成要变异的结点cp = np.random.randint(0, 2, DNA_SIZE, dtype=np.bool_)  # crossover points# 将父DNA和母DNA交叉生成子DNAkv[cp] = pop['DNA'][p1, cp]kv[~cp] = pop['DNA'][p2, ~cp]# 将父变异强度序列和母变异强度序列交叉生成子变异强度序列ks[cp] = pop['mut_strength'][p1, cp]ks[~cp] = pop['mut_strength'][p2, ~cp]# 将变异强度也产生一定的变异ks[:] = np.maximum(ks + (np.random.rand(*ks.shape)-0.5), 0.)    # 实现将变异强度限制在非负数范围内# 根据正态分布变异 mutate (change DNA based on normal distribution)kv += ks * np.random.randn(*kv.shape)  # 用于生成符合标准正态分布(均值为0,方差为1)的随机数,形状和kv的一样# 将数组中的元素限制在一个指定的范围内 它将数组中小于指定最小值的元素替换为最小值,将大于指定最大值的元素替换为最大值kv[:] = np.clip(kv, *DNA_BOUND)    # clip the mutated valuereturn kidsdef kill_bad(pop, kids):"""将孩子DNA和原来的父母DNA合并,然后根据适应度排序,然后选取前POP_SIZE的个体,重新组成一个种群:param pop::param kids::return:"""# put pop and kids together#将孩子DNA和原来的父母DNA合并for key in ['DNA', 'mut_strength']:pop[key] = np.vstack((pop[key], kids[key]))# 获取适应度fitness = get_fitness(F(pop['DNA']))            # calculate global fitness# 然后根据适应度排序,然后选取前POP_SIZE的个体,重新组成一个种群idx = np.arange(pop['DNA'].shape[0])good_idx = idx[fitness.argsort()][-POP_SIZE:]   # selected by fitness ranking (not value)for key in ['DNA', 'mut_strength']:pop[key] = pop[key][good_idx]return popif __name__ == '__main__':# 随机生成种群# 这里直接用0-5的数字表示DNA,DNA长度为1pop = dict(DNA=5 * np.random.rand(1, DNA_SIZE).repeat(POP_SIZE, axis=0),  # initialize the pop DNA valuesmut_strength=np.random.rand(POP_SIZE, DNA_SIZE))  # initialize the pop mutation strength valuesplt.ion()  # something about plottingx = np.linspace(*DNA_BOUND, 200)plt.plot(x, F(x))for _ in range(N_GENERATIONS):# something about plottingif 'sca' in globals(): sca.remove()sca = plt.scatter(pop['DNA'], F(pop['DNA']), s=200, lw=0, c='red', alpha=0.5);plt.pause(0.05)# 进化策略开始kids = make_kid(pop, N_KID)pop = kill_bad(pop, kids)  # keep some good parent for elitismplt.ioff()plt.show()

(1+1)-ES进化策略

(1+1)-ES 总结如下:

  • 有一个父代;
  • 根据父代变异出一个子代;
  • 在父代和子代中选好的那个变成下一代父代.

因此本算法不会像之前的算法有好多个体,这里只存在两个个体,适应度高的个体变异出子代,然后父代与子代相互竞争,根据优胜劣汰的法则,适应度高的当作父代。然后循环下去

在这里插入图片描述

红点是父辈,当我比子代优秀的时候,我就一直在,子代受不了就自杀,当子代优于父辈的时候,父辈觉得很欣慰,便自己消失了,循环往复,直到某一代达到武林巅峰,在这个过程中,是什么决定了子代?实际上只有变异,因为我们的DNA实际上也只有横坐标。

这里只说与基础的进化策略的不同之处

首先是make_kid()函数,(1+1)-ESmake_kid()函数如下:

def make_kid(parent):"""产生子代的时候,不再进行交叉操作,只进行变异操作:param parent::return:"""# 使用正态分布np.random.randn(DNA_SIZE)进行变异k = parent + MUT_STRENGTH * np.random.randn(DNA_SIZE)# 将k限制在0到5k = np.clip(k, *DNA_BOUND)return k

就是极简的两行代码,(1+1)-ES算法只进行了变异的操作,而不用进行交叉操作

其次我们的变异强度是动态改变的

在 kill_bad 中, 我们选择更为适合的, 不管是爸爸还是孩子, 只要是适合的就留下, 不适合的杀掉. 但是还有注意的一点是, 在这一步我们还要对 MUT_STRENGTH 进行一点改变. 改变的方法遵循了 1/5 successful rule. 这个方法是 ES 的开山鼻祖提出来的. 文献在这:

Rechenberg, I. 1973. Evolutionsstrategie – Optimierung technischer Systeme nach Prinzipien der biologischen Evolution, Frommann-Holzboog.

在这里插入图片描述

图中的意思是, 还没到收敛的时候(上面左图), 我们增大 MUT_STRENGTH, 如果已经快到收敛了(上右图), 我们就减小 MUT_STRENGTH. 那如何判断是否快到收敛没呢, 就是如果有1/5的变异比原始的 parent 好的话, 就是快收敛了(像上右图). 在上左图中, 有一半比原始 parent 好, 一半比较差, 所以还没到收敛. 在上面提到的课件中, 用一个公式就能概括这种1/5关系.

在这里插入图片描述
然后我们就是利用上述公式来动态改变我们的变异强度

kill_bad()函数如下:

def kill_bad(parent, kid):global MUT_STRENGTH# 获取适应度fp = get_fitness(F(parent))[0]fk = get_fitness(F(kid))[0]p_target = 1/5# 如果父代适应度小于子代,就用子代去代替父代,否则保持不变if fp < fk:     # kid better than parentparent = kidps = 1.     # kid win -> ps = 1 (successful offspring)else:ps = 0.# adjust global mutation strength# 调整变异强度MUT_STRENGTH *= np.exp(1/np.sqrt(DNA_SIZE+1) * (ps - p_target)/(1 - p_target))return parent

完整代码如下:

#!/usr/bin/env python 
# -*- coding:utf-8 -*-
import numpy as np
import matplotlib.pyplot as pltDNA_SIZE = 1             # DNA (real number)
DNA_BOUND = [0, 5]       # solution upper and lower bounds
N_GENERATIONS = 200
MUT_STRENGTH = 5.        # initial step size (dynamic mutation strength)def F(x): return np.sin(10*x)*x + np.cos(2*x)*x     # to find the maximum of this function# find non-zero fitness for selection
def get_fitness(pred): return pred.flatten()def make_kid(parent):"""产生子代的时候,不再进行交叉操作,只进行变异操作:param parent::return:"""# 使用正态分布np.random.randn(DNA_SIZE)进行变异k = parent + MUT_STRENGTH * np.random.randn(DNA_SIZE)# 将k限制在0到5k = np.clip(k, *DNA_BOUND)return kdef kill_bad(parent, kid):global MUT_STRENGTH# 获取适应度fp = get_fitness(F(parent))[0]fk = get_fitness(F(kid))[0]p_target = 1/5# 如果父代适应度小于子代,就用子代去代替父代,否则保持不变if fp < fk:     # kid better than parentparent = kidps = 1.     # kid win -> ps = 1 (successful offspring)else:ps = 0.# adjust global mutation strength# 调整变异强度MUT_STRENGTH *= np.exp(1/np.sqrt(DNA_SIZE+1) * (ps - p_target)/(1 - p_target))return parentif __name__ == '__main__':# 生成一个父代,本质上就是一个0-5的实数parent = 5 * np.random.rand(DNA_SIZE)  # parent DNAplt.ion()  # something about plottingx = np.linspace(*DNA_BOUND, 200)for _ in range(N_GENERATIONS):# ES partkid = make_kid(parent)# 方便画图py, ky = F(parent), F(kid)  # for later plot# 比较出一个适应度好的个体parent = kill_bad(parent, kid)# something about plottingplt.cla()plt.scatter(parent, py, s=200, lw=0, c='red', alpha=0.5, )plt.scatter(kid, ky, s=200, lw=0, c='blue', alpha=0.5)plt.text(0, -7, 'Mutation strength=%.2f' % MUT_STRENGTH)plt.plot(x, F(x))plt.pause(0.05)plt.ioff()plt.show()

参考:

莫烦Python
莫烦python之进化策略(1+1)-ES

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/162118.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

02_单片机及开发板介绍

单片机简介 单片机&#xff0c;又称为微控制器&#xff08;Microcontroller&#xff09;&#xff0c;是一种集成了微处理器核心、存储器、输入/输出接口及各种功能模块的集成电路芯片。它通常由中央处理器&#xff08;CPU&#xff09;、存储器、输入/输出接口以及各种外设组成&…

【Leetcode】 707. 设计链表

你可以选择使用单链表或者双链表&#xff0c;设计并实现自己的链表。 单链表中的节点应该具备两个属性&#xff1a;val 和 next 。val 是当前节点的值&#xff0c;next 是指向下一个节点的指针/引用。 如果是双向链表&#xff0c;则还需要属性 prev 以指示链表中的上一个节点…

保序回归与金融时序数据

保序回归在回归问题中的作用是通过拟合一个单调递增或递减的函数&#xff0c;来保持数据点的相对顺序特性。 一、保序回归的作用 主要用于以下情况&#xff1a; 1. 有序数据&#xff1a;当输入数据具有特定的顺序关系时&#xff0c;保序回归可以帮助保持这种顺序关系。例如&…

rust学习—— 控制流if 表达式

控制流 根据条件是否为真来决定是否执行某些代码&#xff0c;或根据条件是否为真来重复运行一段代码&#xff0c;是大部分编程语言的基本组成部分。Rust 代码中最常见的用来控制执行流的结构是 if 表达式和循环。 if 表达式 if 表达式允许根据条件执行不同的代码分支。你提供…

vue-cli脚手架创建项目时报错Error: command failed: npm install --loglevel error

项目背景 环境&#xff1a;vue-cli 5.x 在工程文件中&#xff0c;后端模块wms已经创建完成&#xff0c;现在想新建一个名为vue-web的前端模块 执行命令vue create vue-web时&#xff0c; 报错Error: command failed: npm install --loglevel error 问题分析及解决 排查过程…

Linux性能优化--使用性能工具发现问题

9.0 概述 本章主要介绍综合运用之前提出的性能工具来缩小性能问题产生原因的范围。阅读本章后&#xff0c;你将能够&#xff1a; 启动行为异常的系统&#xff0c;使用Linux性能工具追踪行为异常的内核函数或应用程序。启动行为异常的应用程序&#xff0c;使用Linux性能工具追…

centos 7.9 源码安装htop

1.下载源码 wget http://sourceforge.net/projects/htop/files/latest/download 2.上传到tmp目录&#xff0c;并解压 tar xvzf htop-1.0.2.tar.gz mv htop-1.0.2 /opt/ 进入到 cd /opt/htop-1.0.2/ 3.编译并安装 ./configure && make && make install 4.…

基于混沌博弈优化的BP神经网络(分类应用) - 附代码

基于混沌博弈优化的BP神经网络&#xff08;分类应用&#xff09; - 附代码 文章目录 基于混沌博弈优化的BP神经网络&#xff08;分类应用&#xff09; - 附代码1.鸢尾花iris数据介绍2.数据集整理3.混沌博弈优化BP神经网络3.1 BP神经网络参数设置3.2 混沌博弈算法应用 4.测试结果…

什么是CSGO大行动,2023年CSGO大行动时间预测

什么是CSGO大行动&#xff0c;2023年CSGO大行动时间预测 什么是CSGO大行动&#xff0c;2023年CSGO大行动时间预测 那天群里在提大行动&#xff0c;不明所以的新同学在问&#xff0c;什么是大行动&#xff0c;是不是官方红锁大行动要来了&#xff1f;当然不是&#xff0c;别自己…

Linux内核的.config 配置文件和defconfig 配置文件

Linux 内核可以通过输入“make menuconfig”来打开图形化配置界面&#xff0c;menuconfig 是一套图形化的配置工具 一、图形化界面的操作 menuconfig 图形化的配置工具需要 ncurses 库支持。ncurses 库提供了一系列的 API 函数供调用者生成基于文本的图形界面&#xff0c;因此…

c++_learning-基础部分

文章目录 基础认识&#xff1a;语言特性&#xff08;面向对象编程&#xff09;&#xff1a;c的类&#xff08;相当于c中的结构体&#xff09;&#xff1a;三大特性&#xff1a;c包含四种编程范式&#xff1a;优缺点&#xff1a; c程序编译的过程&#xff1a;预处理->编译&am…

《软件方法》第1章2023版连载(07)UML的历史和现状

DDD领域驱动设计批评文集 做强化自测题获得“软件方法建模师”称号 《软件方法》各章合集 1.3 统一建模语言UML 1.3.1 UML的历史和现状 上一节阐述了A→B→C→D的推导是不可避免的&#xff0c;但具体如何推导&#xff0c;有各种不同的做法&#xff0c;这些做法可以称为“方…

WebDAV之π-Disk派盘 + 密码键盘

密码键盘是一款密码管理器,可以存储和管理需要受保护的数据。为方便日常使用,同时也是一款安全输入法,帮您安全便捷地填写账号密码、通用内容、卡包信息。 密码键盘使用军事级的 PBKDF2 有损加密算法保护您的根密码,使用军事级的 AES 加密算法保护您的存储数据。云端再额外…

VBA之正则表达式(43)-- 从网页中提取指定数据

实例需求&#xff1a;由网页中提取下图中颜色标记部分内容&#xff0c;网页中其他部分与此三行格式相同。 方法1 Sub Demo()Dim objRegex As ObjectDim inputString As StringDim objMatches As ObjectDim objMatch As ObjectSet objRegex CreateObject("VBScript.RegEx…

为什么不可大张旗鼓地推动“汉字编程”?

为什么不可大张旗鼓地推动“汉字编程”&#xff1f; 没有不可。 我之前看到过一个vscode插件&#xff0c;是给一个不知道叫什么名字的编程语言用的&#xff0c;从代码到注释全是西里尔字母写的&#xff0c;反正就只有东欧那片区域用。最近很多小伙伴找我&#xff0c;说想要一些…

2023年中国自动驾驶卡车市场发展趋势分析:自动驾驶渗透率快速增长[图]

自动驾驶卡车的技术原理是通过电脑算法控制车辆行驶&#xff0c;辅助驾驶员完成任务。其实现方式主要是基于传感器和计算处理技术。自动驾驶卡车可以随时感知周围环境&#xff0c;灵活避障&#xff0c;自适应调整行驶路径&#xff0c;相比之下传统卡车需要驾驶员进行手动操作&a…

使用postman做接口测试

1.接口测试&#xff1a;针对软件对外提供服务的接口的输入输出进行测试&#xff0c;以及接口间相互逻辑的测试&#xff0c;验证接口功能与接口描述文档的一致性 2.接口测试流程&#xff1a; 1&#xff09;获取接口信息&#xff1a;通过接口文档或抓包来获取接口的基本调用方式和…

C# 取消一个不带CancellationToken的任务?

在异步函数中&#xff0c;一般使用CancellationToken来控制函数的执行。这个Token需要作为参数传递到异步函数中&#xff1a; public staic Task<T> DoAsync(CancellationToken token) {... } 那么如果一个异步函数没有这个Token参数&#xff0c;如何取消呢? 之前看到一…

Dasviewer浏览器里显示模型裁剪不成功,输出无数据是什么原因?

答&#xff1a;Metadata文件需要先放在Terraosgb文件夹瓦块再试试 DasViewer是由大势智慧自主研发的免费的实景三维模型浏览器,采用多细节层次模型逐步自适应加载技术,让用户在极低的电脑配置下,也能流畅的加载较大规模实景三维模型,提供方便快捷的数据浏览操作。#DasViewer##…

JAVA基础(JAVA SE)学习笔记(三)流程控制语句

前言 1. 学习视频&#xff1a; 尚硅谷Java零基础全套视频教程(宋红康2023版&#xff0c;java入门自学必备)_哔哩哔哩_bilibili 2023最新Java学习路线 - 哔哩哔哩 正文 JAVA基础&#xff08;JAVA SE&#xff09;学习笔记&#xff08;一&#xff09;JAVA学习路线、行业了解、…