Holland sématétele
Holland sématétele, amelyet a genetikus algoritmusok alaptételének is neveznek, egy olyan egyenlőtlenség, amely az evolúciós dinamika egyenletének durva szemcsésítéséből adódik. A sématétel kimondja, hogy az átlagon felüli fitneszű rövid, alacsony rendű sémák gyakorisága exponenciálisan növekszik az egymást követő generációkban. A tételt John Holland javasolta az 1970-es években. Kezdetben széles körben úgy vélték, hogy a genetikai algoritmusok teljesítményének magyarázatát alapozza meg. A következményeknek ezt az értelmezését azonban több, a , című folyóiratban áttekintett publikációban kritizálták, ahol a séma-tételt a Price-egyenlet speciális esetének mutatták ki, ahol a séma-indikátorfüggvény a makroszkopikus mérőszám.
A séma egy sablon, amely a karakterláncok egy részhalmazát azonosítja, amelyek bizonyos karakterláncpozíciókban hasonlóságot mutatnak. A sémák a hengerhalmazok speciális esete, és ezért topológiai teret alkotnak.
Leírás
Tekintsük a 6 hosszúságú bináris karakterláncokat. Az 1*10*1
séma az összes olyan 6 hosszúságú karakterlánc halmazát írja le, amelynek 1., 3. és 6. pozíciójában 1-es, a 4. pozíciójában pedig 0 van.
A * egy joker szimbólum, ami azt jelenti, hogy a 2. és az 5. pozíció 1 vagy 0 értékű is lehet. A séma o ( H ) {\displaystyle o(H)} sorrendjét a sablonban lévő rögzített pozíciók számaként határozzuk meg, míg a meghatározó hossz δ ( H ) {\displaystyle \delta (H)} az első és az utolsó konkrét pozíció közötti távolságot jelenti. Az 1*10*1
sorrendje 4, a meghatározó hossza pedig 5. Egy séma fitneszértéke a sémának megfelelő összes karakterlánc átlagos fitneszértéke. Egy karakterlánc alkalmassága a kódolt problémamegoldás értékének egy problémaspecifikus kiértékelő függvény által kiszámított mértéke. A genetikus algoritmusok bevált módszereit és genetikai operátorait alkalmazva a séma-tétel kimondja, hogy az átlagon felüli fitneszű rövid, alacsony rendű sémák exponenciálisan növekednek az egymást követő generációkban. Egyenletben kifejezve:
E ( m ( H , t + 1 ) ) ≥ m ( H , t ) f ( H ) a t [ 1 - p ] . {\displaystyle \operatorname {E} (m(H,t+1))\geq {m(H,t)f(H) \over a_{t}}[1-p]. }
Itt m ( H , t ) {\displaystyle m(H,t)} a H sémához {\displaystyle H} tartozó karakterláncok száma a t generációban {\displaystyle t}. , f ( H ) {\displaystyle f(H)} a H {\displaystyle H} séma megfigyelt átlagos fitneszértéke és a t {\displaystyle a_{t}} a t {\displaystyle t} generációban megfigyelt átlagos fitneszértéke. A p {\displaystyle p} bomlás valószínűsége annak a valószínűsége, hogy a keresztezés vagy a mutáció elpusztítja a H {\displaystyle H} sémát. Ez a következőképpen fejezhető ki:
p = δ ( H ) l - 1 p c + o ( H ) p m {\displaystyle p={\delta (H) \over l-1}p_{c}+o(H)p_{m}}}
ahol o ( H ) {\displaystyle o(H)} a séma sorrendje, l {\displaystyle l} a kód hossza, p m {\displaystyle p_{m}} a mutáció valószínűsége és p c {\displaystyle p_{c}} a keresztezés valószínűsége. Tehát egy rövidebb definíciós hosszúságú δ ( H ) {\displaystyle \delta (H)} séma kisebb valószínűséggel bomlik meg.
Gyakran félreértik, hogy a sématétel miért egyenlőtlenség és nem egyenlőség. A válasz valójában egyszerű: a tétel elhanyagolja azt a kis, de nem nulla valószínűséget, hogy a H {\displaystyle H} sémához tartozó karakterlánc "nulláról" jön létre egy olyan karakterlánc mutációjával (vagy két karakterlánc rekombinációjával), amely az előző generációban nem tartozott a H {\displaystyle H} sémához.
Korlátozás
A sématétel egy végtelen nagy populációt fenntartó genetikai algoritmus feltételezése mellett érvényes, de nem mindig érvényesül a (véges) gyakorlatban: a kezdeti populáció mintavételi hibája miatt a genetikai algoritmusok olyan sémákhoz konvergálhatnak, amelyek nem rendelkeznek szelektív előnnyel. Ez különösen a multimodális optimalizálásban fordul elő, ahol egy függvénynek több csúcsa is lehet: a populáció sodródhat úgy, hogy az egyik csúcsot preferálja, a többit pedig figyelmen kívül hagyja.
A sématétel azért nem tudja megmagyarázni a genetikai algoritmusok erejét, mert minden problémapéldányra érvényes, és nem tud különbséget tenni olyan problémák között, amelyekben a genetikai algoritmusok rosszul teljesítenek, és olyanok között, amelyekben a genetikai algoritmusok jól teljesítenek.
Egy multimodális függvény ábrázolása két változóban.
Kérdések és válaszok
K: Mi a Holland-féle sématétel?
V: Holland sématétele egy genetikai algoritmusokkal kapcsolatos tétel, amely szerint az átlagosnál magasabb fitneszű egyedek nagyobb valószínűséggel érvényesülnek.
K: Ki és mikor javasolta Holland sématételét?
V: John Holland az 1970-es években javasolta a Holland sématételt.
K: Mi az a séma a genetikai algoritmusokkal összefüggésben?
V: A genetikai algoritmusokkal összefüggésben a séma egy olyan sablon, amely azonosítja a karakterláncok egy részhalmazát, amelyek bizonyos karakterlánc-pozíciókban hasonlóságot mutatnak.
K: Hogyan értelmezhető Holland sématétele, amely a genetikai algoritmusok erejének magyarázatának alapjául szolgált?
V: Holland sématételének értelmezése, amelyet a genetikai algoritmusok erejének magyarázatának alapjául használtak, az, hogy az átlagosnál magasabb fitneszű egyedek nagyobb valószínűséggel érvényesülnek.
K: Mit mutatott ki a Holland sématételével kapcsolatos kritika?
V: A Holland sématételének kritikája azt mutatta ki, hogy az a Price-egyenlet egy speciális esete, amelyben a sémaindikátor-függvény a makroszkopikus mérőszám.
K: Mi a hengerhalmazok speciális esete?
V: A sémák a hengerhalmazok speciális esete.
K: Milyen teret alkotnak a sémák?
V: A sémák topológiai teret alkotnak.