ENCODE projekt: Az emberi genom DNS-elemeinek enciklopédiája
ENCODE projekt: az emberi genom DNS-elemeinek enciklopédiája — részletes térkép a szabályozó elemekről, enhancer/promotorokról és a génszabályozás titkairól.
ENCODE (ENCyclopedia Of DNA Elements) az emberi DNS funkcionális elemeinek átfogó feltérképezésére indított nemzetközi kutatási program. Az ENCODE projektet 2003-ban indították azzal a céllal, hogy azonosítsák az emberi genomban található funkcionális DNS-elemeket — azokat a szakaszokat, amelyeknek biológiai szerepük van a gének szabályozásában, kifejeződésében vagy más sejtes folyamatokban. A munkában több mint 400 tudós vett részt 32 laboratóriumból az Egyesült Államokban, az Egyesült Királyságban, Spanyolországban, Szingapúrban és Japánban. Eredményeiket nyílt hozzáférésű cikkekben tették közzé, többek között a Nature, a Genome Biology és a Genome Research folyóiratokban — ez az eddigi legátfogóbb kísérleti leírása az emberi genom funkcionális térképének.
Főbb megállapítások és jelentőségük
- A génkódoló rész aránya kicsi: A teljes genomból mindössze körülbelül 1% kódol fehérjéket, ami nagyjából 20–21 ezer proteint kódoló gént jelent. Ez rávilágít, hogy a fehérjéket kódoló szakaszok kis hányada szükséges a sejtek működéséhez.
- Promotorok száma: Az ENCODE adatok szerint mintegy 70 000 szekvencia viselkedik promotorokként — ezek olyan régiók, amelyek a gének előtt helyezkednek el, és ahol fehérjék (transzkripciós faktorok és más molekulák) kötődnek a génexpresszió szabályozásához. Egy génhez több promotor is tartozhat, és a promotorok aktivitása sejttípustól függően változik.
- Enhancerek (erősítők): Összességében hozzávetőlegesen 400 000 enhancer régiót azonosítottak; ezek gyakran távolabb helyezkednek el a célzott génektől, mégis befolyásolják azok kifejeződését háromdimenziós kromatin-interakciók révén.
- Szabályozó „kapcsolók”: Több millió szabályozó elemre mutattak bizonyítékot: az ENCODE eredményei alapján körülbelül 4 millió olyan helyet azonosítottak, amelyek DNS-alapú „kapcsolóként” működnek — ezek a szakaszok be- és kikapcsolják a gének működését, gyakran messze találhatók a szabályozott géntől.
- Széles körű biokémiai aktivitás: Az ENCODE egyik gyakran idézett megállapítása, hogy a genomból mintegy 80%-on kimutatható valamilyen biokémiai jel (például transzkripció, fehérje- vagy RNS-kötődés, kromatinmódosulás, DNáz-szenzitív helyek). Ez azt jelenti, hogy a DNS nagy részén van mérhető aktivitás; fontos azonban megérteni, hogy ez a „funkció”-biokémiai értelemben értendő, és nem feltétlenül egyezik meg azzal a szigorúbb értelemmel, amely szerint egy szekvencia evolúciós szelektálás alatt áll (ld. alább a vitát).
- Evolúciós következtetések: Az ENCODE adatai alátámasztják, hogy az evolúció mind a fehérjéket kódoló szekvenciák, mind pedig a génszabályozást meghatározó DNS-szakaszok változásai révén alakítja a fajok közötti különbségeket. A szabályozó elemek változásai különösen fontos szerepet játszanak abban, hogy hasonló génekkel rendelkező fajok eltérő fenotípusokat mutathatnak.
"Az evolúcióbiológia egyik nagy kihívása annak megértése, hogy a fajok közötti DNS-szekvenciabeli különbségek hogyan határozzák meg a fajok fenotípusainak különbségeit. Az evolúciós változás a fehérjéket kódoló szekvenciák változásain és a génszabályozást megváltoztató szekvencia-változásokon keresztül egyaránt bekövetkezhet".
Mit jelent pontosan az, hogy „funkcionális”?
Az ENCODE eredményeinek egyik központi vitaforrása a „funkció” definíciója. Az ENCODE által használt mérőszámok elsősorban biokémiai aktivitást jeleznek (például RNS-transzkriptumok kimutatása, transzkripciós faktorok vagy hisztonmódosítások kötődése, DNáz-szenzitív régiók). Ezek a jelek arra utalnak, hogy az adott szakasz részt vesz valamilyen sejtes folyamatban. Ugyanakkor az evolúciós értelemben vett funkció (azaz hogy a szakasz konzervált-e, vagy a változására szelektív nyomás hat-e) gyakran szigorúbb kritérium, és nem minden biokémiai aktivitás jár feltétlenül szelekciós előnnyel.
Ennek megfelelően a kutatóközösségben folytatódott a vita: az ENCODE eredményei fontos adatokkal szolgálnak a genom működéséről, de a „funkció” fogalmát óvatosan kell kezelni, és gyakran további kísérletek szükségesek annak igazolására, hogy egy adott elem biológiailag releváns szerepet tölt-e be a szervezet szintjén.
Alkalmazott módszerek és kísérleti skála
A projekt nagyon sokféle, egymást kiegészítő kísérleti módszert használt a genom funkcióinak feltérképezésére. A legfontosabb megközelítések közé tartoznak:
- Ismertetett és izolált átírt RNS szekvenálása (különböző típusú RNS-ek — például hosszú nem-kódoló RNS-ek és messenger RNS-ek — detektálása és kvantifikálása). Ez segít feltérképezni, mely genomi régiók aktívak transzkripcionálisan.
- Mintegy 120 transzkripciós faktor kötőhelyeinek (azaz a kapcsolódó régiók) azonosítása nagy léptékben — jellemzően ChIP-seq típusú módszerekkel. (Az eredeti megfogalmazásban "120 transzkripciós termék" szerepelt; pontosítva: körülbelül 120 különböző transzkripciós faktor kötőhelyeit térképezték fel.)
- A hisztonok kémiai módosulásainak (pl. acetilációk, metilációk) mintázatának feltérképezése, amelyek a kromatin állapotáról és a génexpresszió szabályozásáról adnak információt.
- DNáz I érzékeny helyek (DNase-seq), FAIRE és más kromatin-állapotra érzékeny módszerek alkalmazása a nyitott, hozzáférhető kromatin régiók azonosítására.
- 147 sejttípuson összesen 1 648 kísérletet végeztek, így a vizsgálat nem csupán egyetlen sejttípusra korlátozódott, hanem különböző szövetek és fejlődési állapotok szerinti aktivitásokat is feltérképezett.
- További technikák: különféle RNS-készítési és protokollvariánsok (pl. CAGE, RAMPAGE), metilációs vizsgálatok és kromatin-interakciós módszerek a háromdimenziós szerkezet felmérésére.
Adatok, nyílt hozzáférés és gyakorlati hatások
Az ENCODE adatai teljesen nyilvánosak: a kísérletek nyers és feldolgozott adatai letölthetők, és számos vizualizációs eszköz (például genom-browserek) támogatják az eredmények böngészését. Az adathalmazok és analizált pályák (tracks) ma már széles körben használatosak alapkutatásokban, genomiális annotációk javításában és orvosi genomikai alkalmazásokban. Az ENCODE eredményei hozzájárultak a betegség-asszociált régiók jobb értelmezéséhez, különösen akkor, amikor a GWAS-jelöltek nem kódoló régiókban találhatók — az ilyen jelöltek gyakran szabályozó elemekhez kapcsolódnak.
Kritika és további lépések
Bár az ENCODE jelentős előrelépés a genom funkcionális térképének elkészítésében, a közösség továbbra is dolgozik a módszerek finomításán és a funkciók biológiai validálásán. A biokémiai aktivitás és az evolúciós szelekció közötti különbségtétel kulcsfontosságú a genom különböző szakaszainak értelmezéséhez. A további kutatások célja többek között a feltárt elemek célba juttatott funkcionális kísérleti tesztelése (pl. CRISPR-alapú modulációk), a nagyobb sejttípus-diverzifikáció és a fejlettebb 3D genomikai módszerek alkalmazása.
A munkával kapcsolatos hírek: az ENCODE-projekt részletes eredményeit több nyílt hozzáférésű tanulmányban, valamint a projekt adatportálján és a publikációk mellékleteiben tették közzé. Az eredmények jelentős hatással voltak a genomika fejlődésére és a génszabályozás megértésére, és ma is alapvető forrást jelentenek azoknak a kutatóknak, akik a genomiális funkciókat és a betegségek molekuláris hátterét vizsgálják.
Kérdések és válaszok
K: Mi az az ENCODE?
V: Az ENCODE a DNS-elemek enciklopédiájának rövidítése. Ezt 2003-ban indították útjára, hogy azonosítsa az emberi genomban található összes funkcionális elemet (működő bitet).
K: Ki végezte az ENCODE munkáját?
V: A munkát több mint 400 tudós végezte 32 laboratóriumban az Egyesült Államokban, az Egyesült Királyságban, Spanyolországban, Szingapúrban és Japánban.
K: Mit találtak az emberi genomról?
V: Azt találták, hogy a genomnak csupán 1%-a kódol fehérjéket, ami körülbelül 21 000 gént jelent. Emellett felfedeztek 70 000 szekvenciát, amelyek a gének előtt elhelyezkedő "promotor" területeket kódolják, ahol fehérjék kötődnek a génexpresszió szabályozásához; 400 000 "enhancer" területet, amelyek távoli géneket szabályoznak; és négymillió gén "kapcsolót", azaz olyan DNS-szekvenciákat, amelyek szabályozzák a gének be- és kikapcsolását. Megállapították továbbá, hogy a genom 80%-ának határozott biokémiai funkciója van.
K: Hogyan végezték a kutatást?
V: Az alkalmazott módszerek közé tartozott a genomból átírt RNS izolálása és szekvenálása; a transzkripciós termékek kötőhelyeinek azonosítása; a hisztonokon végzett kémiai módosítások mintázatának vizsgálata, hogy megtalálják azokat a régiókat, ahol a génexpresszió fokozódik vagy elnyomódik; és 1648 kísérlet elvégzése 147 sejttípuson.
K: Mit sugall ez a kutatás az evolúcióról?
V: Ez a kutatás azt sugallja, hogy az evolúciót mind a fehérjéket kódoló génekben, mind a szabályozó vezérlést kódoló DNS-ben bekövetkező változások okozzák. Arra is utal, hogy az evolúciós változás a génszabályozást megváltoztató szekvencia-változásokon keresztül, valamint a fehérjéket kódoló szekvenciák változásain keresztül is bekövetkezhet.
K: Hol publikálták eredményeiket?
V: Eredményeiket három folyóiratban - Nature, Genome Biology és Genome Research - 30 nyílt hozzáférésű cikkben tették közzé.
Keres