Holland sématétele

Szerző: Leandro Alegsa

05-04-2022 16:01

Holland sématétele, amelyet a genetikus algoritmusok alaptételének is neveznek, egy olyan egyenlőtlenség, amely az evolúciós dinamika egyenletének durva szemcsésítéséből adódik. A sématétel kimondja, hogy az átlagon felüli fitneszű rövid, alacsony rendű sémák gyakorisága exponenciálisan növekszik az egymást követő generációkban. A tételt John Holland javasolta az 1970-es években. Kezdetben széles körben úgy vélték, hogy a genetikai algoritmusok teljesítményének magyarázatát alapozza meg. A következményeknek ezt az értelmezését azonban több, a , című folyóiratban áttekintett publikációban kritizálták, ahol a séma-tételt a Price-egyenlet speciális esetének mutatták ki, ahol a séma-indikátorfüggvény a makroszkopikus mérőszám.

A séma egy sablon, amely a karakterláncok egy részhalmazát azonosítja, amelyek bizonyos karakterláncpozíciókban hasonlóságot mutatnak. A sémák a hengerhalmazok speciális esete, és ezért topológiai teret alkotnak.

Leírás

Tekintsük a 6 hosszúságú bináris karakterláncokat. Az 1*10*1 séma az összes olyan 6 hosszúságú karakterlánc halmazát írja le, amelynek 1., 3. és 6. pozíciójában 1-es, a 4. pozíciójában pedig 0 van. A * egy joker szimbólum, ami azt jelenti, hogy a 2. és az 5. pozíció 1 vagy 0 értékű is lehet. A séma o ( H ) {\displaystyle o(H)} $o(H)$ sorrendjét a sablonban lévő rögzített pozíciók számaként határozzuk meg, míg a meghatározó hossz δ ( H ) {\displaystyle \delta (H)} $\delta (H)$ az első és az utolsó konkrét pozíció közötti távolságot jelenti. Az 1*10*1 sorrendje 4, a meghatározó hossza pedig 5. Egy séma fitneszértéke a sémának megfelelő összes karakterlánc átlagos fitneszértéke. Egy karakterlánc alkalmassága a kódolt problémamegoldás értékének egy problémaspecifikus kiértékelő függvény által kiszámított mértéke. A genetikus algoritmusok bevált módszereit és genetikai operátorait alkalmazva a séma-tétel kimondja, hogy az átlagon felüli fitneszű rövid, alacsony rendű sémák exponenciálisan növekednek az egymást követő generációkban. Egyenletben kifejezve:

E ( m ( H , t + 1 ) ) ≥ m ( H , t ) f ( H ) a t [ 1 - p ] . {\displaystyle \operatorname {E} (m(H,t+1))\geq {m(H,t)f(H) \over a_{t}}[1-p]. } $\operatorname {E} (m(H,t+1))\geq {m(H,t)f(H) \over a_{t}}[1-p].$

Itt m ( H , t ) {\displaystyle m(H,t)} $m(H,t)$ a H sémához {\displaystyle H} $H$ tartozó karakterláncok száma a t generációban {\displaystyle t}. $t$ , f ( H ) {\displaystyle f(H)} $f(H)$ a H {\displaystyle H} $H$ séma megfigyelt átlagos fitneszértéke és a t {\displaystyle a_{t}} $a_{t}$ a t {\displaystyle t} $t$ generációban megfigyelt átlagos fitneszértéke. A p {\displaystyle p} $p$ bomlás valószínűsége annak a valószínűsége, hogy a keresztezés vagy a mutáció elpusztítja a H {\displaystyle H} $H$ sémát. Ez a következőképpen fejezhető ki:

p = δ ( H ) l - 1 p c + o ( H ) p m {\displaystyle p={\delta (H) \over l-1}p_{c}+o(H)p_{m}}} $p={\delta (H) \over l-1}p_{c}+o(H)p_{m}$

ahol o ( H ) {\displaystyle o(H)} $o(H)$ a séma sorrendje, l {\displaystyle l} $l$ a kód hossza, p m {\displaystyle p_{m}} $p_{m}$ a mutáció valószínűsége és p c {\displaystyle p_{c}} $p_{c}$ a keresztezés valószínűsége. Tehát egy rövidebb definíciós hosszúságú δ ( H ) {\displaystyle \delta (H)} $\delta (H)$ séma kisebb valószínűséggel bomlik meg.
Gyakran félreértik, hogy a sématétel miért egyenlőtlenség és nem egyenlőség. A válasz valójában egyszerű: a tétel elhanyagolja azt a kis, de nem nulla valószínűséget, hogy a H {\displaystyle H} $H$ sémához tartozó karakterlánc "nulláról" jön létre egy olyan karakterlánc mutációjával (vagy két karakterlánc rekombinációjával), amely az előző generációban nem tartozott a H {\displaystyle H} $H$ sémához.

Korlátozás

A sématétel egy végtelen nagy populációt fenntartó genetikai algoritmus feltételezése mellett érvényes, de nem mindig érvényesül a (véges) gyakorlatban: a kezdeti populáció mintavételi hibája miatt a genetikai algoritmusok olyan sémákhoz konvergálhatnak, amelyek nem rendelkeznek szelektív előnnyel. Ez különösen a multimodális optimalizálásban fordul elő, ahol egy függvénynek több csúcsa is lehet: a populáció sodródhat úgy, hogy az egyik csúcsot preferálja, a többit pedig figyelmen kívül hagyja.

A sématétel azért nem tudja megmagyarázni a genetikai algoritmusok erejét, mert minden problémapéldányra érvényes, és nem tud különbséget tenni olyan problémák között, amelyekben a genetikai algoritmusok rosszul teljesítenek, és olyanok között, amelyekben a genetikai algoritmusok jól teljesítenek.

Egy multimodális függvény ábrázolása két változóban.

Kérdések és válaszok

K: Mi a Holland-féle sématétel?

V: Holland sématétele egy genetikai algoritmusokkal kapcsolatos tétel, amely szerint az átlagosnál magasabb fitneszű egyedek nagyobb valószínűséggel érvényesülnek.

K: Ki és mikor javasolta Holland sématételét?

V: John Holland az 1970-es években javasolta a Holland sématételt.

K: Mi az a séma a genetikai algoritmusokkal összefüggésben?

V: A genetikai algoritmusokkal összefüggésben a séma egy olyan sablon, amely azonosítja a karakterláncok egy részhalmazát, amelyek bizonyos karakterlánc-pozíciókban hasonlóságot mutatnak.

K: Hogyan értelmezhető Holland sématétele, amely a genetikai algoritmusok erejének magyarázatának alapjául szolgált?

V: Holland sématételének értelmezése, amelyet a genetikai algoritmusok erejének magyarázatának alapjául használtak, az, hogy az átlagosnál magasabb fitneszű egyedek nagyobb valószínűséggel érvényesülnek.

K: Mit mutatott ki a Holland sématételével kapcsolatos kritika?

V: A Holland sématételének kritikája azt mutatta ki, hogy az a Price-egyenlet egy speciális esete, amelyben a sémaindikátor-függvény a makroszkopikus mérőszám.

K: Mi a hengerhalmazok speciális esete?

V: A sémák a hengerhalmazok speciális esete.

K: Milyen teret alkotnak a sémák?

V: A sémák topológiai teret alkotnak.

Keres