absztrakt
Összefoglalás: nemrégiben javasolták és sikeresen alkalmazták az eukarióták genomjegyzeteiben a KA/Ks Arány tesztet, amely a genomi régiók fehérjekódoló potenciálját értékeli azok nem szinonim és szinonim divergencia arányai alapján. Szisztematikusan elvégeztük a Ka / Ks Arány tesztet 925 átirattal megerősített alternatív módon illesztett exonokon az emberi genomban, amelyet ebben a kéziratban írunk le. Megállapítottuk, hogy az evolúciósan konzervált alternatív módon összekapcsolt exonok 22,3% – a nem tudja teljesíteni a Ka/Ks Arány tesztet, szemben a konstitutív exonok 9,8% – ával. A hamis negatív arány a legmagasabb (85,7%) volt az alacsony transzkriptum-frekvenciájú exonok esetében. Az alternatív módon splicelt exonok teljes hosszúságú mRNS-szekvenciákkal támogatott elemzése hasonló eredményeket hozott, és az ősi alternatív splicing eseményekben részt vevő exonok közel fele nem tudta teljesíteni ezt a tesztet. Elemzésünk egy jövőbeli irányt javasol az összehasonlító genomikai alapú alternatív splicing előrejelzések beépítésére a KA / Ks Arány teszttel magasabb eukariótákban, kiterjedt RNS alternatív splicingtel.
Contact:[email protected]
1 Bevezetés
az összehasonlító genomika hatékony eszközöket biztosított az eukarióta genomok megjegyzéséhez (Kellis et al., 2003). Egy úttörő tanulmányban Nekrutenko et al. (2002) javasolta a ‘Ka/Ks Arány tesztet’ az előre jelzett exonok fehérjét kódoló potenciáljának értékelésére. Ez a teszt azon a feltételezésen alapul, hogy az emberi genomban a fehérjét kódoló régiók többsége erős tisztító szelekció alatt áll az evolúció során. Ennek eredményeként a szinonim divergencia (Ks) aránya jelentősen meghaladja a nem szinonim divergencia (Ka) arányát, így az ember-egér ortológ szekvencia–összehasonlításban a Ka/Ks arány sokkal kevesebb, mint egy. Egy 1244 exonból álló mintán 153 fehérjét kódoló génből a Ka / Ks Arány teszt 8% – os hamis negatív arányt és <5% – os hamis pozitív arányt adott a belső exonokra, olyan pontossággal, amely jobb volt, mint a legtöbb gén-előrejelző eszköz (Nekrutenko et al., 2002). Bevezetése óta a Ka/Ks Arány tesztet széles körben és sikeresen alkalmazzák az emberi és más emlős genomok megjegyzésének javítására (Miller et al., 2004; Nekrutenko, 2004; Nekrutenko et al., 2003b; Zhang and Gerstein, 2004).
a Ka / Ks Arány teszt egyik felmerülő kérdése az eukarióta genomok alternatív módon összekapcsolt exonjaira vonatkozik. Az expresszált szekvenciák és mikroarray adatok legújabb tanulmányai kimutatták, hogy az alternatív splicing a génszabályozás széles körben elterjedt mechanizmusa a magasabb eukariótákban (Lareau et al., 2004; Modrek és Lee, 2002). Az emberi kódoló gének legfeljebb háromnegyede alternatív splicingen megy keresztül (Johnson et al., 2003). Bőséges bizonyíték van arra, hogy az alternatív splicing az evolúció során a szelekciós nyomás ellazulásával jár (Boue et al., 2003). Például az alternatív splicing összefüggésbe hozható az exon létrehozásának és elvesztésének felgyorsult sebességével (Modrek and Lee, 2003), az Alu elemekből származó új exon eredetekkel (Sorek et al., 2002), a korai terminációs kodonok toleranciája (Lewis et al., 2003; Xing és Lee, 2004) stb. Iida és Akashi (2000) 110 humán és Drosophila proteint kódoló gén szekvencia divergenciáját vizsgálták, és azt találták, hogy ezeknek a géneknek az alternatív spliced régiói magasabb Ka/Ks értékekkel rendelkeznek, mint a konstitutív régiók. Más példákról is beszámoltak az emelkedett Ka/Ks-ről az alternatív módon összekapcsolt exonokban (Filip and Mundy, 2004; Hurst and Pal, 2001). Ezek a megfigyelések felvetik a KA/Ks Arány teszttől való eltérést az alternatív módon összekapcsolt exonok között.
2 módszerek
alternatív módon összekapcsolt exonokat azonosítottunk az emberi expresszált szekvenciák emberi genomhoz való igazításával (Modrek et al., 2001). Az alternatív splicing mértékének számszerűsítése az egyes alternatív splicing exonokhoz, az alternatív splicing standard metrikáját használtuk-az exon befogadási szintjét, az exont tartalmazó est-k száma osztva az ezt az exont tartalmazó vagy kihagyott est-ek teljes számával. Az alternatív módon összekapcsolt exonokat három osztályba osztottuk a befogadási szintjük alapján: major-forma (>2/3), közepes forma (1/3 és 2/3 között) és minor-forma (<1/3).
az egér ortholog genomiális szekvenciájában azonosítottuk az egyes emberi exonok ortológ exonszekvenciáját, amint azt korábban leírtuk (Modrek and Lee, 2003). Minden ember-egér ortológ exon szekvencia pár esetében elvégeztük a Ka/Ks Arány tesztet Nekrutenko protokollját követve et al. (2003a). Röviden, ember és egér ortológ exon szekvenciáit lefordítottuk, majd igazítottuk CLUSTALW Thompson et al., 1994 Az alapértelmezett paraméterek alatt. Ezt a fehérje-összehangolást használták a megfelelő nukleotidszekvenciák összehangolására, és az összehangolás hiányosságait levágták. A szinonim és nem szinonim szubsztitúciók/helyek számát A PAML csomag yn00 programjának yang-Nielsen becslései alapján becsültük meg (PAML 3.14) (Yang, 1997). A megváltozott és változatlan szinonim/nem szinonim helyek számát felhasználva elkészítettünk egy 2 6db kontingenciatáblát, és a Fisher-féle egzakt teszt segítségével megvizsgáltuk, hogy a Ka/Ks Arány szignifikánsan <1 volt-e. Az exont úgy határoztuk meg, hogy megfelel a Ka/Ks Arány tesztnek, ha Ka/Ks szignifikánsan <1 volt a P < 0,05 szinten.
3 eredmények és vita
összeállítottunk egy listát a 925 humán alternatív spliced exonok, amelyek konzervált között humán és egér genomok elemzése alapján az emberi expresszált szekvenciák (Modrek et al., 2001). Összeállítottunk egy listát 10 996 emberi konstitutív exonról kontrollként. Mindezek az exonok belső exonok voltak, amelyeket mindkét végén intronok szegélyeztek. Elvégeztük a Ka / Ks Arány tesztek ezeken az exonokon a (Nekrutenko et al., 2003a) (lásd a módszerek részt). A konstitutív exonok 9.8% – uk nem teljesítette a Ka / Ks Arány tesztet, ez az arány hasonló ahhoz, amit a kezdeti vizsgálat jelentett (8%) (Nekrutenko et al., 2002) (1.táblázat). Ezzel szemben a vizsgált alternatív módon összekapcsolt exonok 22,3%-a nem tudta teljesíteni a Ka/Ks Arány tesztet, ami több mint 2-szeres növekedést jelent a konstitutív exonokhoz képest. Mivel az alternatív módon összekapcsolt exonok különböző exon befogadási szintekkel (lásd a definíciókat a módszerek részben) az evolúciós divergencia különböző mintáit mutatták (Modrek and Lee, 2003; Pan et al., 2004, a 925 alternatív módon összekapcsolt exonokat három osztályba osztottuk exon-befogadási szintjeik alapján (lásd módszerek szakasz). A teszten megbukott exonok aránya a fő formájú exonok esetében 16,0% volt, a kisebb formájú alternatív exonok esetében pedig 85,7%-ra nőtt (az átiratokban <1/3 volt). Mivel az alternatív módon összekapcsolt exonok átlagosan rövidebbek voltak, az exonokat méretük alapján is felosztottuk (ábra. 1). Mind a konstitutív, mind az alternatív módon összekapcsolt exonokban, a tesztet elmulasztó frakciók magasabbak voltak a rövidebb exonoknál, összhangban az eredeti vizsgálattal Nekrutenko et al., 2002. A frakció azonban következetesen magasabb volt az alternatív módon splicelt exonoknál az exonméretek kontrollálása után (pl. 5,4% a konstitutív exonoknál és 16,6% az alternatív módon splicelt exonoknál 101 és 150 nt között; ábra. 1). Az egérrel alternatív módon összekapcsolt exonok elemzése egér-ember összehasonlításban hasonló eredményeket hozott (az adatok nem szerepelnek).
eredményeink azt mutatják, hogy az alternatív módon összekapcsolt exonok szignifikánsan nagyobb hányada az emberi genomban nem képes átadni a Ka/Ks Arány tesztet. Ez azonban nem jelenti azonnal a KA/Ks Arány teszt megnövekedett hamis negatív arányát alternatív módon összekapcsolt exonokban, mivel más értelmezések is lehetségesek. Ezek az adatok valóban azt sugallják, hogy az emberi EST szekvenciákban megfigyelt alternatív módon spliced exonok jelentős része nem valós exonokat képvisel, hanem valóban az EST adatok leleteiből származnak (pl. ritka spliceosomális hibák) (Modrek and Lee, 2002; Sorek and Safer, 2003)? Ez a magyarázat különösen valószínűnek tűnik a kisebb formájú exonok esetében (amelyek az EST szekvenciák kis részében figyelhetők meg). Ennek a lehetőségnek a tesztelésére, elemeztük az alternatív módon összekapcsolt exonok egy részét, amelyeket teljes hosszúságú mRNS szekvenciák támogattak. Az alternatív módon összekapcsolt exonok hasonló frakcióit figyeltük meg, amelyek nem teljesítették a Ka / Ks Arány tesztet (2.táblázat). Ezért az EST műtárgyakból származó hamis exonok nem magyarázhatják adatainkat. Alternatív megoldásként a KA/Ks Arány teszt hiányában az illesztett exonok nagyrészt nem funkcionális illesztési formákat képviselnek? A kérdés megválaszolásához az elemzésünket 120 exon készletre korlátoztuk, amelyeket alternatív módon összekapcsoltak mind az emberi, mind az egér transzkriptomokban. Az ősi alternatív splicing ilyen mintáját széles körben elfogadták a funkcionális alternatív splicing események kritériumaként (Resch et al., 2004; Sorek et al., 2004a). Ezekben az exonokban még magasabb 49,2% (szemben az összes alternatív módon összekapcsolt exon 22,3% – ával) nem tudta teljesíteni a Ka/Ks Arány tesztet (1.táblázat), összhangban az ilyen exonokkal kapcsolatos újabb tanulmányokkal (Ohler et al., 2005). Ezért a nem funkcionális toldási formák hipotézise sem magyarázza adatainkat. Végül, hogy kizárjuk a CpG-szigetek lehetséges hatását, kiszámítottuk a CpG gyakoriságát a GpC felett minden exonban, és elemzésünket az alternatív módon splicelt exonok egy részhalmazára korlátoztuk, amelyek CpG/GpC aránya <0,8 volt (Iida and Akashi, 2000). Ezen exonok 20,8% – a nem tudta teljesíteni ezt a tesztet, hasonlóan az alternatív módon összekapcsolt exonok teljes készletének százalékához (1.táblázat). Bár elvileg a megnövekedett Ka / Ks Arány különböző mögöttes mechanizmusokat tükrözhet , ami nem a kézirat középpontjában áll, kontroll elemzéseink azt mutatják, hogy az emberi genomban a funkcionális alternatív exonok nagy része nem felel meg a Ka/Ks Arány tesztnek.
a konstitutív exonok száma meghaladja az alternatív módon összekapcsolt exonokat a legtöbb fehérjét kódoló génben. Mivel sok organizmusban az átirat szekvencia lefedettsége (pl. est) még mindig meglehetősen alacsony, a Ka/Ks Arány teszt hatékony eszköz a számítási génszerkezet-előrejelzések finomítására. Azonban az emlősök fehérjét kódoló génjeinek többsége alternatív módon spliced, és néhány alternatív spliced exonnak mélyreható funkcionális és szabályozási hatása lehet, amint azt a közelmúltban a Piccolo C2A doménjének alternatív splicingje szemlélteti (Garcia et al. 2004) és még sokan mások. Elemzésünk azt sugallja, hogy kiterjedt alternatív splicing-kel rendelkező organizmusokban (pl. Emlősök) előnyösebb kombinálni a Ka/Ks Arány tesztet más mutatókkal, amelyek jelzik az alternatív splicing valószínűségét. Szerencsére az evolúciós genomika rávilágított a funkcionális alternatív módon összekapcsolt exonok tipikus tulajdonságaira is , amelyeket sikeresen alkalmaztak az előrejelzésekben (Philipps et al., 2004; Sorek et al., 2004b; Yeo et al., 2005). Az ilyen információk integrálhatók a Ka/Ks Arány teszttel a genomi régiók fehérjekódoló potenciáljának pontosabb értékelése érdekében.
a KA / Ks arányvizsgálat különböző méretű konstitutív és alternatív módon összeillesztett exonokon. (A) konstitutív exonok és (B) alternatív módon összekapcsolt exonok.
a KA / Ks arányvizsgálat különböző méretű konstitutív és alternatív módon összeillesztett exonokon. (A) konstitutív exonok és (B) alternatív módon összekapcsolt exonok.
exonok, amelyek megfelelnek vagy nem teljesítik a Ka / Ks aránypróbát
az exonok típusai . | összesen #. | átlagos hossz (bp) . | # sikertelen . | # passz . | % sikertelen . | átlag (medián) Ka/Ks . |
---|---|---|---|---|---|---|
konstitutív | 10 996 | 136 | 1077 | 9919 | 9.8 | 0.146 (0.070) |
alternatív | 925 | 122 | 206 | 719 | 22.3 | 0.199 (0.094) |
Alt (fő forma) | 630 | 121 | 101 | 529 | 16.0 | 0.162 (0.086) |
Alt (Medium-form) | 253 | 129 | 69 | 184 | 27.3 | 0.235 (0.113) |
Alt (Minor-form) | 42 | 81 | 36 | 6 | 85.7 | 0.649 (0.410) |
Ancestral Alt | 120 | 102 | 59 | 61 | 49.2 | 0.412 (0.182) |
Alt (CpG/GpC < 0.8) | 793 | 124 | 165 | 628 | 20.8 | 0.192 (0.097) |
az exonok típusai . | összesen #. | átlagos hossz (bp) . | # sikertelen . | # passz . | % sikertelen . | átlag (medián) Ka/Ks . |
---|---|---|---|---|---|---|
konstitutív | 10 996 | 136 | 1077 | 9919 | 9.8 | 0.146 (0.070) |
alternatív | 925 | 122 | 206 | 719 | 22.3 | 0.199 (0.094) |
Alt (fő forma) | 630 | 121 | 101 | 529 | 16.0 | 0.162 (0.086) |
Alt (közepes forma) | 253 | 129 | 69 | 184 | 27.3 | 0.235 (0.113) |
Alt (kisebb forma) | 42 | 81 | 36 | 6 | 85.7 | 0.649 (0.410) |
ősi Alt | 120 | 102 | 59 | 61 | 49.2 | 0.412 (0.182) |
Alt (CpG / GpC < 0.8) | 793 | 124 | 165 | 628 | 20.8 | 0.192 (0.097) |
exonok, amelyek megfelelnek vagy nem teljesítik a Ka / Ks aránypróbát
az exonok típusai . | összesen #. | átlagos hossz (bp) . | # sikertelen . | # passz . | % sikertelen . | átlag (medián) Ka/Ks . |
---|---|---|---|---|---|---|
konstitutív | 10 996 | 136 | 1077 | 9919 | 9.8 | 0.146 (0.070) |
alternatív | 925 | 122 | 206 | 719 | 22.3 | 0.199 (0.094) |
Alt (fő forma) | 630 | 121 | 101 | 529 | 16.0 | 0.162 (0.086) |
Alt (Medium-form) | 253 | 129 | 69 | 184 | 27.3 | 0.235 (0.113) |
Alt (Minor-form) | 42 | 81 | 36 | 6 | 85.7 | 0.649 (0.410) |
Ancestral Alt | 120 | 102 | 59 | 61 | 49.2 | 0.412 (0.182) |
Alt (CpG/GpC < 0.8) | 793 | 124 | 165 | 628 | 20.8 | 0.192 (0.097) |
az exonok típusai . | összesen #. | átlagos hossz (bp) . | # sikertelen . | # passz . | % sikertelen . | átlag (medián) Ka/Ks . |
---|---|---|---|---|---|---|
konstitutív | 10 996 | 136 | 1077 | 9919 | 9.8 | 0.146 (0.070) |
alternatív | 925 | 122 | 206 | 719 | 22.3 | 0.199 (0.094) |
Alt (fő forma) | 630 | 121 | 101 | 529 | 16.0 | 0.162 (0.086) |
Alt (közepes forma) | 253 | 129 | 69 | 184 | 27.3 | 0.235 (0.113) |
Alt (kisebb forma) | 42 | 81 | 36 | 6 | 85.7 | 0.649 (0.410) |
ősi Alt | 120 | 102 | 59 | 61 | 49.2 | 0.412 (0.182) |
Alt (CpG / GpC < 0.8) | 793 | 124 | 165 | 628 | 20.8 | 0.192 (0.097) |
emberi mRNS-ek által támogatott exonok, amelyek megfelelnek vagy nem felelnek meg a Ka / Ks Arány tesztnek
az exonok típusai . | összesen #. | # sikertelen . | # passz . | % sikertelen . |
---|---|---|---|---|
konstitutív | 10 524 | 1017 | 9507 | 9.7 |
alternatív | 811 | 158 | 653 | 19.5 |
Alt (fő forma) | 618 | 99 | 519 | 16.0 |
Alt (közepes forma) | 170 | 39 | 131 | 22.9 |
Alt (kisebb forma) | 23 | 20 | 3 | 87.0 |
az exonok típusai . | összesen #. | # sikertelen . | # passz . | % sikertelen . |
---|---|---|---|---|
Konstitutív | 10 524 | 1017 | 9507 | 9.7 |
Alternatív | 811 | 158 | 653 | 19.5 |
Alt (fő forma) | 618 | 99 | 519 | 16.0 |
Alt (közepes forma) | 170 | 39 | 131 | 22.9 |
Alt (kisebb forma) | 23 | 20 | 3 | 87.0 |
emberi mRNS-ek által támogatott exonok, amelyek megfelelnek vagy nem felelnek meg a Ka / Ks Arány tesztnek
az exonok típusai . | összesen #. | # sikertelen . | # passz . | % sikertelen . |
---|---|---|---|---|
konstitutív | 10 524 | 1017 | 9507 | 9.7 |
alternatív | 811 | 158 | 653 | 19.5 |
Alt (fő forma) | 618 | 99 | 519 | 16.0 |
Alt (közepes forma) | 170 | 39 | 131 | 22.9 |
Alt (kisebb forma) | 23 | 20 | 3 | 87.0 |
az exonok típusai . | összesen #. | # sikertelen . | # passz . | % sikertelen . |
---|---|---|---|---|
Konstitutív | 10 524 | 1017 | 9507 | 9.7 |
Alternatív | 811 | 158 | 653 | 19.5 |
Alt (fő forma) | 618 | 99 | 519 | 16.0 |
Alt (közepes forma) | 170 | 39 | 131 | 22.9 |
Alt (kisebb forma) | 23 | 20 | 3 | 87.0 |
a szerzők köszönetet mondanak Anton Nekrutenkónak a kéziratunk elolvasásáért és a hasznos megjegyzésekért. Ezt a munkát támogatta NIH Grant U54-RR021813, tanár-tudós díj C. J. L. a Dreyfus Alapítványtól egy DOE grant DE-FC02-02ER63421. YX támogatja a Ph.D. disszertáció ösztöndíj UCLA.
összeférhetetlenség: nincs bejelentve.
Boue, S. és mtsai.
alternatív splicing és evolúció.
-1034
Filip, L. C. és Mundy, N. I.
gyors evolúció pozitív darwini szelekcióval a főemlősökben a bőséges limfocita fehérje CD45 extracelluláris doménjében.
-1511
Garcia, J., et al.
konformációs kapcsoló a Piccolo C2A tartományban, amelyet alternatív illesztés szabályoz.
-53
Hurst, L. D. és Pal, C.
bizonyíték a szelekció tisztítására a BRCA1 csendes helyein.
-65
Iida, K. és Akasi, H.
a transzlációs szelekció tesztje az emberi genom csendes helyein: bázisösszetétel-összehasonlítások alternatív módon összekapcsolt génekben.
-105
Johnson, J. M., et al.
az emberi alternatív pre-mRNS splicing Genom-szintű felmérése exon junction mikroarray-kkel.
-2144
Kellis, M., et al.
az élesztőfajok szekvenálása és összehasonlítása a gének és szabályozó elemek azonosítására.
-254
Lareau, L. F., et al.
az alternatív splicing változó szerepei.
-282
Lewis, B. P., et al.
bizonyíték az alternatív splicing és a nonszensz által közvetített mRNS bomlás széles körű összekapcsolására az emberekben.
-192
Miller, W. és mtsai.
összehasonlító genomika.
-56
Modrek, B. és Lee, C.
az alternatív splicing genomikai nézete.
-19
Modrek, B. és Lee, C.
az alternatív splicing az emberi, egér és patkány genomokban az exon létrehozásának/elvesztésének megnövekedett arányával jár.
-180
Modrek, B. és mtsai.
az alternatív splicing Genomszintű elemzése humán expresszált szekvencia adatok felhasználásával.
-2859
Nyekrutenko, A.
a számok összeegyeztetése: est-k a fehérjét kódoló génekkel szemben.
-1282
Nekrutenko, A., et al.
a K(A)/K (S) arány teszt a genomi régiók fehérjekódoló potenciáljának felmérésére: empirikus és szimulációs vizsgálat.
-202
Nekrutenko, A., et al.
ETOPE: a megjósolt exonok evolúciós tesztje.
-3567
Nekrutenko, A., et al.
az evolúciós megközelítés feltárja az emberi genom magas fehérjekódoló képességét.
-310
Ohler, U., et al.
ismeretlen konzervált, alternatív módon összekapcsolt exonok felismerése.
Pan, Q. és mtsai.
az emlősök alternatív illesztésének globális szabályozási jellemzőinek feltárása kvantitatív mikroarray platform segítségével.
-941
Philipps, D. L., et al.
számítási és kísérleti megközelítés az alternatív módon összekapcsolt exonok a priori azonosításához.
-1844
Resch, A., et al.
bizonyíték a konzervált alternatív splicing események szubpopulációjára szelekciós nyomás alatt a fehérje leolvasási keret megőrzése érdekében.
-1269
Sorek, R. és Ast, G.
az alternatív módon összekapcsolt exonokat kísérő Intronikus szekvenciák konzerválódnak az ember és az egér között.
-1637
Sorek, R. és Safer, H. M.
új algoritmus a szennyezett EST könyvtárak számítógépes azonosítására.
-1074
Sorek, R., et al.
az Alu-tartalmú exonokat alternatív módon összeillesztjük.
-1067
Sorek, R., et al.
mennyire elterjedt a funkcionális alternatív splicing az emberi genomban?
-71
Sorek, R., et al.
nem EST-alapú módszer az exon-kihagyás előrejelzéséhez.
-1623
Thompson, J. D., et al.
CLUSTAL W: a progresszív többszörös szekvencia-igazítás érzékenységének javítása szekvencia súlyozással, pozícióspecifikus résbüntetésekkel és súlymátrix-választással.
-4680
Xing, Y. és Lee, C.
a korai fehérje csonkolással szembeni negatív szelekciós nyomást mind az alternatív splicing, mind a diploidia csökkenti.
-475
Yang, Z.
PAML: programcsomag a filogenetikai elemzéshez a maximális valószínűség szerint.
-556
Yeo, G. W., et al.
emberen és egéren konzervált alternatív splicing események azonosítása és elemzése.
-2855
Zhang, Z. és Gerstein, M.
a pszeudogének nagyszabású elemzése az emberi genomban.
–335