展会信息港展会大全

[精华] Perl用于实现遗传算法
来源:互联网   发布日期:2011-09-13 15:31:43   浏览:5769次  

导读:ChinaUnix.net...


Perl用于实现遗传算法 
 
  

[编者的话] 

遗传算法在生物信息学尤其是蛋白结构预测与分析中有重要应用:Perl是现在生物信息学界中很热门的一种编程语言(我们在以前专题中曾做过专门介绍)。Perl的长处是文本分析,那么它在编写算法上是否能一样表现优异呢,它能不能做这方面的工作呢,别急,且看下文:)

 

创建您自己的达尔文式的繁殖基础 

Teodor Zlatanov (tzz@iglou.com)
程序员,Gold Software Systems
2001年8月 

遗传编程建立在达尔文适者生存的自然选择法则的基础之上,利用变异和复制来生成算法,该算法可创建不断改进的计算机程序。在本专栏里,您将开始了解用浅显的术语表述的遗传算法。Ted 给出了几种特定的任务的 Perl 实现,您可以用于广泛的用途。为了示范遗传算法,Ted 繁殖了一些数字和字母,应用于公式以测试这些数字的适应性,而繁殖的字母则形成了英语单词。 

如果您的机器上已经安装了Perl 5.005或者更高的版本,您可以运行一下文章中的例子。您的系统最好应该是安装了最近的(2000年或者更迟些)主流的 UNIX(Linux,Solaris,BSD),但其它种类的操作系统可能也可以。文中的例子可能可以在更老的版本的Perl、UNIX以及其它操作系统下运行,但是如果不行的话,读者应当把它看作是一次练习来解决。 

历史
进入20世纪以来,在速度和影响范围方面遗传学的发展只有电子学和计算机科学能与之相比。遗传算法是20世纪出现的最令人感兴趣的算法之一,这一说法是恰当的。 

遗传算法(以及普遍意义上的进化算法)出现在20世纪60年代早期,并在计算机科学的确定性和非确定性算法之间占据了一席之位。本质上,遗传算法具有如同您所希望的那样的确定性,意味着用户可以决定重复次数和结束条件。它模拟达尔文的自然选择,还有变异,把“适应性”(正如适用于个体的公式所决定的那样)作为主要因素选择生存繁衍和变异的个体。 

其它的进化算法试图模拟拉马克的进化论,在他看来,行为是一种生存的机制,可以在两代之间传递,甚至有一些进化程序是出于某种目的而自然出现的。以上这些都不在本文的论述范围之内。 

Perl用于实现遗传算法的主要缺点在于速度慢。由于遗传算法的计算需要,用C语言或其它低级的预编译语言来实现效率会更高。本文展示的Perl例程不如其C语言的等价程序快,但是可以使您明白遗传算法是如何工作的,况且,对于一些问题来说,已经够快了。 

那么什么是遗传算法呢?
遗传算法是如此简单,任何人只要用高中时学过的生物术语就可以理解。以一群个体为例,它们都有自己的DNA。然后衡量每一个个体的适应性(把它看作是适用于个体的DNA的官能来衡量),并且使那些更适应的个体更有可能繁衍。而最不适应的个体将会被灭绝。每个幸存者都会有机会繁衍(重要的是任何幸存者都可能会繁衍,如果不太适应的话,仅仅是降低了可能性)。合并双亲的DNA,对合并后的DNA应用随机变异以模拟繁衍。理论上说来,新的个体是和双亲一样适应的,由于变异或增或减会有些微小的变化。然后循环会周而复始。 

虽然,有许多变化的因素在影响遗传算法,包括人群大小、代(算法的迭代)、合并方法、适应性函数,适应性将如何影响繁衍的可能性,以及发生了多少变异。 

该算法也存在一些缺陷。如果把应用于DNA的适应性官能看成是一系列的二进制位,效果最好。换句话说,如果DNA是一系列二进制的选项,是还是不是。蓝眼睛?黑眼睛?红头发?黑头发?合并双亲的DNA和随后的变异应当不允许特定的一些位组合出现,因为得出的DNA可能不再是最初的问题的有效解答。请记住,所谓“DNA”仅仅是适应性公式纯数学的一种解答。该公式中用到的一些值可能是无效的—例如,除数为零。 

另外,遗传算法不受时间限制。由

赞助本站

人工智能实验室

相关热词: 精华 Perl 用于 实现 遗传 算法

AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港