A Bayes-hálózat (Bayesian network) egy irányított aciklikus gráf (Directed Acyclic Graph, DAG), amely valószínűségi modellezésre szolgál. A gráf csomópontjai véletlen változókat reprezentálnak; az élek a változók közötti feltételes függőségeket jelölik. A Bayes-hálózat lehetővé teszi egy sokváltozós eloszlás kompakt felírását azzal, hogy minden csomóponthoz megadunk egy feltételes valószínűségi eloszlást a szülei (parents) feltételezésével:

P(X1, X2, …, Xn) = Πi P(Xi | Parents(Xi))

Ez a felbontás kihasználja a feltételes függetlenségi viszonyokat, így nagy rendszerek esetén is kezelhetővé teszi a valószínűségek számítását. A hálózat lehetőséget ad rejtett (nem megfigyelt) és megfigyelt változók együttes modellezésére.

Szerkezet és elemek

  • Csomópontok: véletlen változók (diszkrét vagy folytonos).
  • Élek: irányított kapcsolatok, amelyek a feltételes (nem feltétlen ok-okozati, de gyakran így értelmezett) függőséget jelzik.
  • Feltételes valószínűségi táblák (CPT): diszkrét változók esetén minden csomóponthoz tartozik egy tábla, amely megadja P(Xi | Parents(Xi)) értékét minden lehetséges szülői konfigurációra. Folytonos változók esetén gyakori a feltételes Gauss-modell vagy más paraméteres alak.
  • D-separáció: a gráf struktúrája alapján eldönthető, mely változók függetlenek egymástól feltételesen (ez az infrastruktúra az inference hatékonyságát is meghatározza).

Következtetés (inference)

A Bayes-hálózatokban gyakori feladat: adott megfigyelések (evidence) mellett kiszámítani egy vagy több változó feltételes eloszlását (posterior). Két nagy megközelítés van:

  • Exact inference: pl. változó elimináció (variable elimination), összekapcsolt fa / junction tree algoritmusok — ezek pontos eredményt adnak, de nagy, sűrű hálózatoknál számításigényesek.
  • Approximate inference: mint a Monte Carlo módszerek (pl. Gibbs sampling, likelihood weighting), variációs approximációk és loopy belief propagation — ezek nagy hálózatoknál gyakorlatiak, de közelítő eredményt adnak.

Tanulás

Két fő feladatot különböztetünk meg:

  • Paramétertanulás: a feltételes eloszlások (CPT-k) becslése, ha a hálózat szerkezete ismert. Gyakori megközelítés a maximum likelihood (MLE) vagy Bayesi módszerek (pl. Dirichlet-priorokkal) a hiányzó adatok esetén EM-algoritmussal.
  • Szerkezettanulás: a gráf felépítésének megtanulása adatból. Lehetséges megközelítések:
    • Score-alapú módszerek (pl. BIC, BDeu) és keresés a gráfunk között (heurisztikus keresések, genetikus algoritmusok).
    • Constraint-alapú módszerek (pl. PC-algoritmus), amelyek függetlenségi tesztek alapján építik fel a szerkezetet.

Ok-okozati értelmezés

Bár egyes Bayes-hálózatokat kifejezetten ok-okozati kapcsolatok modellezésére tervezik (causal Bayesian networks), maguk az irányított élek statisztikai feltételes függőséget jeleznek, és önmagukban nem bizonyítják az okságot. Oksági következtetésekhez további feltételek és kiegészítő módszerek szükségesek (pl. kísérleti adatok vagy speciális azonosíthatósági feltételek).

Alkalmazások

A Bayes-hálózatok széles körben alkalmazhatók, különösen olyan problémákban, ahol a bizonytalanság, hiányzó adatok vagy rejtett okok kezelése fontos:

  • Orvosi diagnózis és döntéstámogatás (tünetekből megbetegedés valószínűségének becslése).
  • Kép- és beszédfelismerés, osztályozás feladatok a gépi tanulásban: jellemzők és osztályok közötti feltételes kapcsolatok modellezése.
  • Információkeresés és dokumentum-osztályozás; spam-szűrés.
  • Hibadetektálás és diagnosztika ipari rendszerekben, érzékelőfúzió robotikában.
  • Bioinformatika: génhálózatok és betegséghajlam modellezése.

Példa (egyszerű szemléltetés)

Az ismert "sprinkler" példa: a változók lehetnek Rain (eső), Sprinkler (öntöző bekapcsolva) és GrassWet (vizes fű). A gráf felírható úgy, hogy Rain befolyásolja Sprinkler-t és GrassWet-et, míg Sprinkler is hat GrassWet-re. A teljes eloszlás faktorizálható: P(Rain,Sprinkler,GrassWet)=P(Rain)·P(Sprinkler|Rain)·P(GrassWet|Rain,Sprinkler). Ebből különböző feltételes valószínűségek számíthatók (pl. mennyi a valószínűsége, hogy esett, ha a fű vizes?).

Összefoglalás

A Bayes-hálózatok hatékony eszközt adnak a komplex, többváltozós valószínűségi modellek kezelésére, különösen akkor, ha a feltételes függetlenségek kihasználhatók. Alkalmazhatók következtetésre, predikcióra és tanulásra különböző tudományos és mérnöki területeken, miközben óvatosnak kell lenni az oksági értelmezéssel kapcsolatban és a számítási komplexitás korlátai miatt gyakran közelítő algoritmusokat alkalmaznak.

Az elméleti alapot Thomas Bayes munkássága adja; részletekért lásd a Bayes-tétel rövid ismertetését.

A Bayes-hálózatok gyakorlati használata során célszerű megismerkedni néhány implementációval és algoritmussal, valamint a bizonytalanságok és hiányzó adatok kezelését célzó módszerekkel.