遗传算法 - 高级主题


在本节中,我们将介绍遗传算法中的一些高级主题。只想了解 GA 简介的读者可以选择跳过本节。

约束优化问题

约束优化问题是那些我们必须最大化或最小化受某些约束的给定目标函数值的优化问题。因此,并非解空间中的所有结果都是可行的,并且解空间包含如下图所示的可行区域。

约束优化

在这种情况下,交叉和变异算子可能会给我们提供不可行的解决方案。因此,在处理约束优化问题时,必须在遗传算法中采用额外的机制。

一些最常见的方法是 -

  • 使用降低不可行解的适合度的罚函数,优选地使得适合度与违反的约束的数量或距可行区域的距离成比例地降低。

  • 使用修复函数,采用不可行的解决方案并对其进行修改,以满足违反的约束。

  • 根本不允许不可行的解决方案进入大众。

  • 使用特殊的表示或解码器函数来确保解决方案的可行性。

基本理论背景

在本节中,我们将讨论模式和 NFL 定理以及构建块假设。

图式定理

研究人员一直在试图找出遗传算法工作背后的数学原理,而霍兰德的图式定理是朝这个方向迈出的一步。一年来,人们对图式定理进行了各种改进和建议,使其更加通用。

在本节中,我们不会深入研究图式定理的数学原理,而是尝试对图式定理是什么有一个基本的了解。要了解的基本术语如下 -

  • 模式是一个“模板”。形式上,它是字母表上的一个字符串 = {0,1,*},

    其中 * 不关心并且可以取任何值。

    因此,*10*1 可能表示 01001、01011、11001 或 11011

    从几何角度来看,模式是解决方案搜索空间中的超平面。

  • 模式的顺序是基因中指定固定位置的数量。

架构顺序
  • 定义长度是基因中两个最远的固定符号之间的距离。

模式定义长度

模式定理指出,具有高于平均适应性、短定义长度和较低阶的模式更有可能在交叉和变异中生存。

积木假设

构建块是具有上述给定平均适应度的低阶、低定义长度模式。构建块假说认为,这些构建块是 GA 成功和 GA 适应的基础,因为它通过连续识别和重新组合这些“构建块”而不断进步。

没有免费的午餐 (NFL) 定理

Wolpert 和 Macready 于 1997 年发表了一篇题为“优化没有免费午餐定理”的论文。它本质上表明,如果我们对所有可能问题的空间进行平均,那么所有非重新访问的黑盒算法将表现出相同的性能。

这意味着我们对问题了解得越多,我们的 GA 就会变得更加针对具体问题并提供更好的性能,但它通过在其他问题上表现不佳来弥补这一点。

基于遗传算法的机器学习

遗传算法也在机器学习中得到应用。分类器系统是基于遗传学的机器学习(GBML)系统的一种形式,常用于机器学习领域。GBML 方法是一种小众的机器学习方法。

GBML 系统有两类 -

  • 匹兹堡方法- 在这种方法中,一条染色体编码一个解决方案,因此适应度被分配给解决方案。

  • 密歇根方法- 一个解决方案通常由许多染色体表示,因此适应度被分配给部分解决方案。

应该记住,GBML 系统中也存在交叉、变异、拉马克或达尔文等标准问题。