Emberi genom: áttekintés, szerkezet és a Humán Genom Projekt eredményei
Emberi genom áttekintése: szerkezet, működés és a Humán Genom Projekt áttörő eredményei — naprakész betekintés a genomkutatás gyakorlati hatásaiba és jövőjébe.
Az emberi genom 23 kromoszómapáron tárolódik a sejtmagban és a kis mitokondriális DNS-ben. Ma már nagyon sokat tudunk a kromoszómáinkon található DNS-szekvenciákról. Azt, hogy a DNS valójában mit csinál, már részben tudjuk. Ennek a tudásnak a gyakorlati alkalmazása még csak most kezdődik.
A Humán Genom Projekt (HGP) olyan referenciaszekvenciát hozott létre, amelyet világszerte használnak a biológiában és az orvostudományban. A Nature közölte a közpénzekből finanszírozott projekt jelentését, a Science pedig a Celera tanulmányát. Ezek a cikkek leírták, hogyan készült a szekvencia tervezete, és elemzést adtak a szekvenciáról. 2003-ban és 2005-ben továbbfejlesztett tervezeteket jelentettek be, amelyek a szekvencia ≈92%-át kitöltötték.
A legújabb ENCODE projekt a gének irányításának módját vizsgálja.
Szerkezet és alapvető jellemzők
Az emberi genom haploid (egyes példány) mérete körülbelül 3,1–3,2 milliárd bázispár. Diploid sejtekben — amelyekben minden kromoszóma párban van — ennek nagyjából a duplája található meg. A teljes nukleáris genom mindössze ≈1–2%-át teszi ki a protein-kódoló exonok összessége; a többi rész nagyrészt intronokból, szabályozó elemekből, ismétlődő szekvenciákból és egyéb nem-kódoló régiókból áll.
- Gének száma: a jelenlegi becslések szerint körülbelül 19–21 ezer fehérjét kódoló gént ismerünk; ehhez jönnek még a sok ezer nem-kódoló RNS-t kódoló egységek.
- Ismétlődő elemek: az emberi genom majdnem fele ismétlődő szekvenciából áll (LINE-ek, SINE-ek — például Alu —, LTR elemek, műsorszóró (satellite) DNS). Ezek nehezítik a teljes összeállítást és a funkciók értelmezését.
- Telomerek és centromerek: a kromoszóma-végeken található telomer-szakaszok (humánban a ismétlődő motívum a TTAGGG) és a centromerek speciális, ismétlődő szerkezetű régiók, amelyek kulcsfontosságúak a kromoszómaszegregációban.
- Alternatív splicing: egy gén többféle mRNS-t és így többféle fehérjét is eredményezhet, ez nagy mértékben növeli a proteom változatosságát.
Mitokondriális DNS
A mitokondriális DNS-ben található genom kicsi, körkörös molekula (emberben ≈16 569 bp), és tipikusan maternálisan öröklődik. A mitokondriális genom körülbelül 37 gént tartalmaz: 13 fehérje-kódoló gént (elsősorban a légzési lánc komponenseihez), 22 tRNS-t és 2 rRNS-t. Több példány is lehet belőle egyetlen sejtben, és mutációi különböző öröklődő vagy szövet-specifikus betegségekhez vezethetnek.
A Humán Genom Projekt és utókövetkezményei
A HGP (1990 környékén indult) célja egy jó minőségű, nyilvános humán referencia-szekvencia összeállítása volt. Az első „munkavázlat” publikálása 2001-ben nagy nemzetközi és tudományos visszhangot kapott (Nature, Science és a Celera tanulmányai). 2003–2005 körül a referencia egyre pontosabbá vált (a szekvencia nagy részét lefedve), de az ismétlődő, heterokromatin- és centromer-területek miatt még maradtak hiányok.
Az elmúlt évtizedben újabb összerakó és szekvenálási technológiák (hosszú olvasatú rendszerek, optikai térképezés, Hi-C és más módszerek) lehetővé tették a korábban kitakart régiók feltárását. A Telomere-to-Telomere (T2T) konszorcjum 2021–2022 folyamán jelentős előrelépést tett a gap-mentes összeállítások felé (például a CHM13 teljes, telomér–telomérhez illesztett emberi genom projekt), és napjainkban egyre nagyobb hangsúlyt kap a pangenom megközelítés, amely sokféle egyén genomját egyaránt figyelembe veszi, hogy a referencia reprezentatívabb legyen a földrajzi és népességbeli variabilitásra.
ENCODE és a funkcionális genomika
A ENCODE projekt célja a genom funkcionális elemeinek feltérképezése: mely régiók aktívak transzkripcióban, hol találhatók promóterek, enhancer-ek, szigetelések és egyéb szabályozó elemek, továbbá hogyan változik a kromatin állapota különböző sejttípusokban. Az ENCODE eredményei megmutatták, hogy a genom sokkal „élettelibb”, mint azt korábban gondoltuk: nagyszámú nem-kódoló RNS, széleskörű transzkripció és számos szabályozó interakció fedezhető fel, bár az, hogy minden biokémiai aktivitás valódi biológiai funkciót jelent-e, még vita tárgya.
Technológiák és módszerek
- Szintén fontos technológiák: Sanger-szekvenálás (korai időkben), rövid olvasatú NGS rendszerek (pl. Illumina), hosszú olvasatú rendszerek (PacBio, Oxford Nanopore), kromatin-konformációs módszerek (Hi-C), és optikai térképezés — mindegyik hozzájárult a genom pontosabb összeállításához és az összetett régiók feltárásához.
- Analitikai módszerek: populációgenetikai elemzések, GWAS (genome-wide association studies), funkcionális annotációk, gépi tanulás a variánsok hatásának előrejelzésére.
Orvosi alkalmazások és etikai kérdések
A genomikai ismeretek gyakorlati haszna egyre növekszik: ritka betegség-diagnosztika (exom- és genom-szekvenálás), onkológia (tumorsekvenálás a célzott terápiákhoz), farmakogenomika (gyógyszerválasz előrejelzése), valamint prediktív és preventív medicina. Ugyanakkor fontos etikai, jogi és társadalmi kérdések is felmerülnek: adatvédelem, genetikai diszkrimináció elleni védelem, informált beleegyezés, és a populációk közötti egyenlő hozzáférés biztosítása a hasznosítás során.
Záró megjegyzések
Az emberi genom feltérképezése egy mérföldkő volt a biológia és az orvostudomány történetében, de a genom működésének megértése folyamatos folyamat. A referencia-szekvenciák, az ENCODE és a pangenom-projektek, valamint az egyre fejlettebb szekvenálási módszerek együttesen teszik lehetővé, hogy egyre pontosabban megfejtsük, hogyan szabályozódnak a gének, hogyan járulnak hozzá a genomvariánsok a betegségekhez, és hogyan lehet ezeket az ismereteket felelősen alkalmazni a gyógyításban és a közegészségügyben.

Az idealizált emberi kariotípus grafikus ábrázolása, amely a genom kromoszómákba rendeződését mutatja. Ez a rajz a 23. kromoszómapár női (XX) és férfi (XY) változatát is mutatja.
DNS és fehérjék
Az emberi genom alig több mint 20 000 fehérjekódoló gént tartalmaz, ami jóval kevesebb, mint várták. Valójában a genomnak csak mintegy 1,5%-a kódol fehérjéket, a többi nem kódoló RNS-génekből, szabályozó szekvenciákból és intronokból áll.
Egyetlen gén azonban az RNS-splicing segítségével többféle fehérjét is előállíthat. Egy bizonyos Drosophila gén (DSCAM) 38 000 különböző mRNS-t képes alternatív módon splicelni. Minden egyes mRNS más-más peptidláncot kódol. Ezért a termelt fehérjék száma messze meghaladja a kódoló gének számát.
Az RNS-splicing és a RNS-transzláció utáni változásokkal együtt az egyedi emberi fehérjék száma alacsony milliós nagyságrendű lehet.
Téves az az elképzelés, hogy a DNS nagy része haszontalan "szemét". A genom legalább 80%-ának határozott funkciója van.
Az ember és a csimpánz közötti különbségek
A ma élő, az emberhez legközelebb álló állat a csimpánz. Az ember és a csimpánz DNS-ének 98,4%-a megegyezik. Ez azonban csak az egynukleotid-polimorfizmusokra vonatkozik, vagyis csak az egyes bázispárok változásaira. A teljes kép meglehetősen eltérő.
A közös csimpánz genom szekvenciájának tervezetét 2005-ben tették közzé. Ebből kiderült, hogy az emberi genom 3164,7 millió bázisából 2400 milliót, azaz a genom 75,8%-át teszik ki azok a régiók, amelyek eléggé hasonlóak ahhoz, hogy egymáshoz igazodjanak.
Az emberi genomnak ez a 75,8%-a 1,23%-ban különbözik a csimpánz genomtól az egynukleotid-polimorfizmusok (SNP-k - a genomban található egyetlen DNS-"betű" változásai) tekintetében. Egy másik típusú különbség, az úgynevezett "indelek" (beillesztések/eltávolítások) további ~3%-os különbséget jelentenek az összehangolható szekvenciák között. Ezenkívül a hasonló DNS-szekvencia nagy (> 20 kb) szakaszainak kópiaszámában bekövetkező eltérések további 2,7%-os különbséget jelentenek a két faj között. Így a genomok teljes hasonlósága akár 70% körüli is lehet.
Kapcsolódó oldalak
Kérdések és válaszok
K: Hol tárolják az emberi genomot?
V: Az emberi genom 23 kromoszómapáron tárolódik a sejtmagban és a kis mitokondriális DNS-ben.
K: Mit tudunk ma már a kromoszómáinkon lévő DNS-szekvenciákról?
V: Ma már nagyon sokat tudunk a kromoszómáinkon lévő DNS-szekvenciákról.
K: Mi az a humán genomprojekt?
V: A Human Genome Project (HGP) egy olyan projekt, amely létrehozta az emberi genom referenciaszekvenciáját.
K: A szekvencia hány százalékát töltötték ki a javított vázlatok szerint?
V: A 2003-ban és 2005-ben bejelentett javított tervezetek a szekvencia ≈92%-át töltötték ki.
K: Melyik a legújabb projekt, amely a gének irányításának módját vizsgálja?
V: A legújabb projekt, az ENCODE a gének irányításának módját tanulmányozza.
K: Bár az emberi genom szekvenciáját teljesen meghatározták, vajon teljesen megértették-e?
V: Nem, az emberi genom szekvenciája még nem teljesen ismert.
K: Mi a feladata a nem kódoló DNS-nek a genomban?
V: A genomon belüli nem kódoló DNS olyan fontos dolgokat tesz, mint a génexpresszió szabályozása, a kromoszómák szerveződése és az epigenetikus öröklődést irányító jelek.
Keres