Holland sématétele, amelyet gyakran a genetikus algoritmusok (GA-k) alaptételének is neveznek, egy formális egyenlőtlenség, amely a populáció evolúciós dinamikájának durva szemcsésítéséből származik. A tétel lényege, hogy a rövid, alacsony rendű és átlagon felüli fitneszű sémák (minták) relatív gyakorisága hajlamos növekedni az egymást követő generációkban. A megfogalmazást és az első vizsgálatokat John Holland végezte az 1970-es években; eredetileg sokan úgy vélték, hogy ez magyarázatot ad a genetikai algoritmusok működésére és sikerére. Az elmúlt évtizedekben azonban a tétel értelmezését és jelentőségét számos kritika érte, és publikációk mutatták be, hogy a séma-tétel a Price-egyenlet egy speciális esete, ahol a séma indikátorfüggvénye szolgál makroszkopikus mérőszámként.

Mi az a séma?

A séma egy sablon, amely a lehetséges karakterláncok (egy megadott ábécé és hossz mellett) egy részhalmazát jelöli. A sémák leírására gyakran használnak egy speciális helyőrzőt (például a '*'), amely a „bármi” karaktert jelenti egy pozícióban. Például a bináris ábécé esetén az 1*0**1 séma azokat a hosszú bit-sorozatokat fogja össze, amelyek az első pozícióban 1-et, a harmadik pozícióban 0-t, és az utolsóban 1-et tartalmaznak (a többi pozíció tetszőleges lehet).

A sémákat két fontos mennyiséggal szokás jellemezni:

  • rend (order, o(H)): a sémában fixált (nem helyőrző) pozíciók száma. (Példánkban o = 3.)
  • definiáló hossz (defining length, δ(H)): a legelső és legutolsó fix pozíció indexe közötti távolság. (Példánkban ez a távolság a 1. és az utolsó pozíció között mérve.)

A sémák speciális esetei a hengerhalmazoknak; topológiai értelemben így topológiai teret alkotnak, ami elméleti következtetésekhez használható.

A séma-tétel állítása és képlete (röviden)

A klasszikus séma-tétel egy felső közelítés helyett általában egy alsó becslést ad arra, hogyan változik egy séma előfordulásainak száma egy lépésben a szelekció, keresztezés és mutáció hatására. Jelölve m(H,t)-vel a H sémát hordozó egyedek számát a t-edik generációban, a tétel a következő várható értékbeli egyenlőtlenséget adja (egyszerűsített formában, egy-pontos keresztezésre és független bitmutációra):

E[m(H,t+1)] ≥ m(H,t) · (f(H)/f̄) · (1 − p_c · δ(H)/(l−1)) · (1 − p_m)^{o(H)}

Itt:

  • f(H) a H sémát hordozó egyedek átlagos fitnesze,
  • f̄ a teljes populáció átlagfitnesze,
  • p_c a keresztezés valószínűsége,
  • p_m az egybites mutáció valószínűsége,
  • l a kromoszómahossz (karakterláncok hossza),
  • δ(H) és o(H) a fent definiált mennyiségek.

Értelmezés: ha a H sémát tartalmazó egyedek átlagfitnesze nagyobb, mint a populáció átlaga, akkor a szelekció következtében várhatóan több H-t hordozó egyed lesz a következő generációban. Ezt azonban csökkentheti a keresztezés (különösen, ha a defináló hossz nagy) és a mutáció (különösen, ha a rend nagy) — ezért a rövid, alacsony rendű, átlagon felüli fitneszű sémák különösen „sikeresek”.

Gyakorlati szerepe a genetikus algoritmusokban

  • Értelmező keret: a séma-tétel rávilágít arra, hogy a GA-k hogyan képesek összegyűjteni és kombinálni hasznos részmegoldásokat (ún. building block-ok), különösen ha a reprezentáció és a genetikai operátorok támogatják a rövid, informatív sémák megőrzését.
  • Tervezési szempontok: a tételből következik, hogy érdemes olyan reprezentációt és keresztezési mechanizmust választani, amelyek nem töri szét túl gyakran a rövid, hasznos sémákat; illetve a mutációs rátát se tegyük feleslegesen magasra.
  • Diagnosztika és intuíció: a tétel jó szemléltető eszköz arra, hogy miért működnek bizonyos GA-beállítások, de nem mindig ad pontos előrejelzést adott probléma és parametrizáció mellett.

Kritika és korlátok

Bár a séma-tételt gyakran „alaptételnek” nevezték, több fontos korlátozása van:

  • Formális, nem prediktív: a tétel általában alsó becslést ad, és nem garantálja a gyakorlatbeli teljesítményt különböző problémákon és parametrizációkon.
  • Egyszerűsítések: a klasszikus képlet feltételez bizonyos keresztezési modell(oka)t (pl. egyszerű egy-pontos keresztezés) és független genetikai hatásokat, ami nem mindig érvényes összetett reprezentációk vagy operátorok esetén.
  • Price-egyenlet és tautológia: kutatók megmutatták, hogy a séma-tétel matematikailag a Price-egyenlet egy speciális esete, ami azt sugallja, hogy a tétel nem ad új csodát, inkább egy adott aggregált mérőszámra (séma-indikátorra) alkalmazott általános evolúciós identitás.
  • Konekciós és epistasztikus hatások: ha a problémában erős kölcsönhatások (epiztázis) vannak a gének között, vagy a hasznos részek nem olyan rövidek és könnyen összeilleszthetők, akkor a building-block intuitív sikere csökkenhet.

Mai nézőpont

A séma-tétel fontos történeti és pedagógiai szerepet tölt be a GA-k elméletében: egyszerű, intuitív magyarázatot ad arra, hogyan lehet részmegoldásokat kombinálni. Ugyanakkor a modern kutatás sokkal kifinomultabb eszközöket használ (pl. konkrét probléma-adaptált analízisek, markov-láncok, információelméleti és kombinatorikus megközelítések), és a gyakorlati GA-tervezésnél gyakran empirikus tanulmányokra és finomhangolásra támaszkodnak. A séma-tétel ezért ma elsősorban elméleti iránytű és oktatási eszköz, nem pedig univerzális teljesítménygarancia.