Holland sématétele, amelyet gyakran a genetikus algoritmusok (GA-k) alaptételének is neveznek, egy formális egyenlőtlenség, amely a populáció evolúciós dinamikájának durva szemcsésítéséből származik. A tétel lényege, hogy a rövid, alacsony rendű és átlagon felüli fitneszű sémák (minták) relatív gyakorisága hajlamos növekedni az egymást követő generációkban. A megfogalmazást és az első vizsgálatokat John Holland végezte az 1970-es években; eredetileg sokan úgy vélték, hogy ez magyarázatot ad a genetikai algoritmusok működésére és sikerére. Az elmúlt évtizedekben azonban a tétel értelmezését és jelentőségét számos kritika érte, és publikációk mutatták be, hogy a séma-tétel a Price-egyenlet egy speciális esete, ahol a séma indikátorfüggvénye szolgál makroszkopikus mérőszámként.
Mi az a séma?
A séma egy sablon, amely a lehetséges karakterláncok (egy megadott ábécé és hossz mellett) egy részhalmazát jelöli. A sémák leírására gyakran használnak egy speciális helyőrzőt (például a '*'), amely a „bármi” karaktert jelenti egy pozícióban. Például a bináris ábécé esetén az 1*0**1 séma azokat a hosszú bit-sorozatokat fogja össze, amelyek az első pozícióban 1-et, a harmadik pozícióban 0-t, és az utolsóban 1-et tartalmaznak (a többi pozíció tetszőleges lehet).
A sémákat két fontos mennyiséggal szokás jellemezni:
- rend (order, o(H)): a sémában fixált (nem helyőrző) pozíciók száma. (Példánkban o = 3.)
- definiáló hossz (defining length, δ(H)): a legelső és legutolsó fix pozíció indexe közötti távolság. (Példánkban ez a távolság a 1. és az utolsó pozíció között mérve.)
A sémák speciális esetei a hengerhalmazoknak; topológiai értelemben így topológiai teret alkotnak, ami elméleti következtetésekhez használható.
A séma-tétel állítása és képlete (röviden)
A klasszikus séma-tétel egy felső közelítés helyett általában egy alsó becslést ad arra, hogyan változik egy séma előfordulásainak száma egy lépésben a szelekció, keresztezés és mutáció hatására. Jelölve m(H,t)-vel a H sémát hordozó egyedek számát a t-edik generációban, a tétel a következő várható értékbeli egyenlőtlenséget adja (egyszerűsített formában, egy-pontos keresztezésre és független bitmutációra):
E[m(H,t+1)] ≥ m(H,t) · (f(H)/f̄) · (1 − p_c · δ(H)/(l−1)) · (1 − p_m)^{o(H)}
Itt:
- f(H) a H sémát hordozó egyedek átlagos fitnesze,
- f̄ a teljes populáció átlagfitnesze,
- p_c a keresztezés valószínűsége,
- p_m az egybites mutáció valószínűsége,
- l a kromoszómahossz (karakterláncok hossza),
- δ(H) és o(H) a fent definiált mennyiségek.
Értelmezés: ha a H sémát tartalmazó egyedek átlagfitnesze nagyobb, mint a populáció átlaga, akkor a szelekció következtében várhatóan több H-t hordozó egyed lesz a következő generációban. Ezt azonban csökkentheti a keresztezés (különösen, ha a defináló hossz nagy) és a mutáció (különösen, ha a rend nagy) — ezért a rövid, alacsony rendű, átlagon felüli fitneszű sémák különösen „sikeresek”.
Gyakorlati szerepe a genetikus algoritmusokban
- Értelmező keret: a séma-tétel rávilágít arra, hogy a GA-k hogyan képesek összegyűjteni és kombinálni hasznos részmegoldásokat (ún. building block-ok), különösen ha a reprezentáció és a genetikai operátorok támogatják a rövid, informatív sémák megőrzését.
- Tervezési szempontok: a tételből következik, hogy érdemes olyan reprezentációt és keresztezési mechanizmust választani, amelyek nem töri szét túl gyakran a rövid, hasznos sémákat; illetve a mutációs rátát se tegyük feleslegesen magasra.
- Diagnosztika és intuíció: a tétel jó szemléltető eszköz arra, hogy miért működnek bizonyos GA-beállítások, de nem mindig ad pontos előrejelzést adott probléma és parametrizáció mellett.
Kritika és korlátok
Bár a séma-tételt gyakran „alaptételnek” nevezték, több fontos korlátozása van:
- Formális, nem prediktív: a tétel általában alsó becslést ad, és nem garantálja a gyakorlatbeli teljesítményt különböző problémákon és parametrizációkon.
- Egyszerűsítések: a klasszikus képlet feltételez bizonyos keresztezési modell(oka)t (pl. egyszerű egy-pontos keresztezés) és független genetikai hatásokat, ami nem mindig érvényes összetett reprezentációk vagy operátorok esetén.
- Price-egyenlet és tautológia: kutatók megmutatták, hogy a séma-tétel matematikailag a Price-egyenlet egy speciális esete, ami azt sugallja, hogy a tétel nem ad új csodát, inkább egy adott aggregált mérőszámra (séma-indikátorra) alkalmazott általános evolúciós identitás.
- Konekciós és epistasztikus hatások: ha a problémában erős kölcsönhatások (epiztázis) vannak a gének között, vagy a hasznos részek nem olyan rövidek és könnyen összeilleszthetők, akkor a building-block intuitív sikere csökkenhet.
Mai nézőpont
A séma-tétel fontos történeti és pedagógiai szerepet tölt be a GA-k elméletében: egyszerű, intuitív magyarázatot ad arra, hogyan lehet részmegoldásokat kombinálni. Ugyanakkor a modern kutatás sokkal kifinomultabb eszközöket használ (pl. konkrét probléma-adaptált analízisek, markov-láncok, információelméleti és kombinatorikus megközelítések), és a gyakorlati GA-tervezésnél gyakran empirikus tanulmányokra és finomhangolásra támaszkodnak. A séma-tétel ezért ma elsősorban elméleti iránytű és oktatási eszköz, nem pedig univerzális teljesítménygarancia.

