a Ka/Ks Arány teszt alkalmazásának értékelése alternatív módon splicelt exonokra

absztrakt

Összefoglalás: nemrégiben javasolták és sikeresen alkalmazták az eukarióták genomjegyzeteiben a KA/Ks Arány tesztet, amely a genomi régiók fehérjekódoló potenciálját értékeli azok nem szinonim és szinonim divergencia arányai alapján. Szisztematikusan elvégeztük a Ka / Ks Arány tesztet 925 átirattal megerősített alternatív módon illesztett exonokon az emberi genomban, amelyet ebben a kéziratban írunk le. Megállapítottuk, hogy az evolúciósan konzervált alternatív módon összekapcsolt exonok 22,3% – a nem tudja teljesíteni a Ka/Ks Arány tesztet, szemben a konstitutív exonok 9,8% – ával. A hamis negatív arány a legmagasabb (85,7%) volt az alacsony transzkriptum-frekvenciájú exonok esetében. Az alternatív módon splicelt exonok teljes hosszúságú mRNS-szekvenciákkal támogatott elemzése hasonló eredményeket hozott, és az ősi alternatív splicing eseményekben részt vevő exonok közel fele nem tudta teljesíteni ezt a tesztet. Elemzésünk egy jövőbeli irányt javasol az összehasonlító genomikai alapú alternatív splicing előrejelzések beépítésére a KA / Ks Arány teszttel magasabb eukariótákban, kiterjedt RNS alternatív splicingtel.

Contact:[email protected]

1 Bevezetés

az összehasonlító genomika hatékony eszközöket biztosított az eukarióta genomok megjegyzéséhez (Kellis et al., 2003). Egy úttörő tanulmányban Nekrutenko et al. (2002) javasolta a ‘Ka/Ks Arány tesztet’ az előre jelzett exonok fehérjét kódoló potenciáljának értékelésére. Ez a teszt azon a feltételezésen alapul, hogy az emberi genomban a fehérjét kódoló régiók többsége erős tisztító szelekció alatt áll az evolúció során. Ennek eredményeként a szinonim divergencia (Ks) aránya jelentősen meghaladja a nem szinonim divergencia (Ka) arányát, így az ember-egér ortológ szekvencia–összehasonlításban a Ka/Ks arány sokkal kevesebb, mint egy. Egy 1244 exonból álló mintán 153 fehérjét kódoló génből a Ka / Ks Arány teszt 8% – os hamis negatív arányt és <5% – os hamis pozitív arányt adott a belső exonokra, olyan pontossággal, amely jobb volt, mint a legtöbb gén-előrejelző eszköz (Nekrutenko et al., 2002). Bevezetése óta a Ka/Ks Arány tesztet széles körben és sikeresen alkalmazzák az emberi és más emlős genomok megjegyzésének javítására (Miller et al., 2004; Nekrutenko, 2004; Nekrutenko et al., 2003b; Zhang and Gerstein, 2004).

a Ka / Ks Arány teszt egyik felmerülő kérdése az eukarióta genomok alternatív módon összekapcsolt exonjaira vonatkozik. Az expresszált szekvenciák és mikroarray adatok legújabb tanulmányai kimutatták, hogy az alternatív splicing a génszabályozás széles körben elterjedt mechanizmusa a magasabb eukariótákban (Lareau et al., 2004; Modrek és Lee, 2002). Az emberi kódoló gének legfeljebb háromnegyede alternatív splicingen megy keresztül (Johnson et al., 2003). Bőséges bizonyíték van arra, hogy az alternatív splicing az evolúció során a szelekciós nyomás ellazulásával jár (Boue et al., 2003). Például az alternatív splicing összefüggésbe hozható az exon létrehozásának és elvesztésének felgyorsult sebességével (Modrek and Lee, 2003), az Alu elemekből származó új exon eredetekkel (Sorek et al., 2002), a korai terminációs kodonok toleranciája (Lewis et al., 2003; Xing és Lee, 2004) stb. Iida és Akashi (2000) 110 humán és Drosophila proteint kódoló gén szekvencia divergenciáját vizsgálták, és azt találták, hogy ezeknek a géneknek az alternatív spliced régiói magasabb Ka/Ks értékekkel rendelkeznek, mint a konstitutív régiók. Más példákról is beszámoltak az emelkedett Ka/Ks-ről az alternatív módon összekapcsolt exonokban (Filip and Mundy, 2004; Hurst and Pal, 2001). Ezek a megfigyelések felvetik a KA/Ks Arány teszttől való eltérést az alternatív módon összekapcsolt exonok között.

2 módszerek

alternatív módon összekapcsolt exonokat azonosítottunk az emberi expresszált szekvenciák emberi genomhoz való igazításával (Modrek et al., 2001). Az alternatív splicing mértékének számszerűsítése az egyes alternatív splicing exonokhoz, az alternatív splicing standard metrikáját használtuk-az exon befogadási szintjét, az exont tartalmazó est-k száma osztva az ezt az exont tartalmazó vagy kihagyott est-ek teljes számával. Az alternatív módon összekapcsolt exonokat három osztályba osztottuk a befogadási szintjük alapján: major-forma (>2/3), közepes forma (1/3 és 2/3 között) és minor-forma (<1/3).

az egér ortholog genomiális szekvenciájában azonosítottuk az egyes emberi exonok ortológ exonszekvenciáját, amint azt korábban leírtuk (Modrek and Lee, 2003). Minden ember-egér ortológ exon szekvencia pár esetében elvégeztük a Ka/Ks Arány tesztet Nekrutenko protokollját követve et al. (2003a). Röviden, ember és egér ortológ exon szekvenciáit lefordítottuk, majd igazítottuk CLUSTALW Thompson et al., 1994 Az alapértelmezett paraméterek alatt. Ezt a fehérje-összehangolást használták a megfelelő nukleotidszekvenciák összehangolására, és az összehangolás hiányosságait levágták. A szinonim és nem szinonim szubsztitúciók/helyek számát A PAML csomag yn00 programjának yang-Nielsen becslései alapján becsültük meg (PAML 3.14) (Yang, 1997). A megváltozott és változatlan szinonim/nem szinonim helyek számát felhasználva elkészítettünk egy 2 6db kontingenciatáblát, és a Fisher-féle egzakt teszt segítségével megvizsgáltuk, hogy a Ka/Ks Arány szignifikánsan <1 volt-e. Az exont úgy határoztuk meg, hogy megfelel a Ka/Ks Arány tesztnek, ha Ka/Ks szignifikánsan <1 volt a P < 0,05 szinten.

3 eredmények és vita

összeállítottunk egy listát a 925 humán alternatív spliced exonok, amelyek konzervált között humán és egér genomok elemzése alapján az emberi expresszált szekvenciák (Modrek et al., 2001). Összeállítottunk egy listát 10 996 emberi konstitutív exonról kontrollként. Mindezek az exonok belső exonok voltak, amelyeket mindkét végén intronok szegélyeztek. Elvégeztük a Ka / Ks Arány tesztek ezeken az exonokon a (Nekrutenko et al., 2003a) (lásd a módszerek részt). A konstitutív exonok 9.8% – uk nem teljesítette a Ka / Ks Arány tesztet, ez az arány hasonló ahhoz, amit a kezdeti vizsgálat jelentett (8%) (Nekrutenko et al., 2002) (1.táblázat). Ezzel szemben a vizsgált alternatív módon összekapcsolt exonok 22,3%-a nem tudta teljesíteni a Ka/Ks Arány tesztet, ami több mint 2-szeres növekedést jelent a konstitutív exonokhoz képest. Mivel az alternatív módon összekapcsolt exonok különböző exon befogadási szintekkel (lásd a definíciókat a módszerek részben) az evolúciós divergencia különböző mintáit mutatták (Modrek and Lee, 2003; Pan et al., 2004, a 925 alternatív módon összekapcsolt exonokat három osztályba osztottuk exon-befogadási szintjeik alapján (lásd módszerek szakasz). A teszten megbukott exonok aránya a fő formájú exonok esetében 16,0% volt, a kisebb formájú alternatív exonok esetében pedig 85,7%-ra nőtt (az átiratokban <1/3 volt). Mivel az alternatív módon összekapcsolt exonok átlagosan rövidebbek voltak, az exonokat méretük alapján is felosztottuk (ábra. 1). Mind a konstitutív, mind az alternatív módon összekapcsolt exonokban, a tesztet elmulasztó frakciók magasabbak voltak a rövidebb exonoknál, összhangban az eredeti vizsgálattal Nekrutenko et al., 2002. A frakció azonban következetesen magasabb volt az alternatív módon splicelt exonoknál az exonméretek kontrollálása után (pl. 5,4% a konstitutív exonoknál és 16,6% az alternatív módon splicelt exonoknál 101 és 150 nt között; ábra. 1). Az egérrel alternatív módon összekapcsolt exonok elemzése egér-ember összehasonlításban hasonló eredményeket hozott (az adatok nem szerepelnek).

eredményeink azt mutatják, hogy az alternatív módon összekapcsolt exonok szignifikánsan nagyobb hányada az emberi genomban nem képes átadni a Ka/Ks Arány tesztet. Ez azonban nem jelenti azonnal a KA/Ks Arány teszt megnövekedett hamis negatív arányát alternatív módon összekapcsolt exonokban, mivel más értelmezések is lehetségesek. Ezek az adatok valóban azt sugallják, hogy az emberi EST szekvenciákban megfigyelt alternatív módon spliced exonok jelentős része nem valós exonokat képvisel, hanem valóban az EST adatok leleteiből származnak (pl. ritka spliceosomális hibák) (Modrek and Lee, 2002; Sorek and Safer, 2003)? Ez a magyarázat különösen valószínűnek tűnik a kisebb formájú exonok esetében (amelyek az EST szekvenciák kis részében figyelhetők meg). Ennek a lehetőségnek a tesztelésére, elemeztük az alternatív módon összekapcsolt exonok egy részét, amelyeket teljes hosszúságú mRNS szekvenciák támogattak. Az alternatív módon összekapcsolt exonok hasonló frakcióit figyeltük meg, amelyek nem teljesítették a Ka / Ks Arány tesztet (2.táblázat). Ezért az EST műtárgyakból származó hamis exonok nem magyarázhatják adatainkat. Alternatív megoldásként a KA/Ks Arány teszt hiányában az illesztett exonok nagyrészt nem funkcionális illesztési formákat képviselnek? A kérdés megválaszolásához az elemzésünket 120 exon készletre korlátoztuk, amelyeket alternatív módon összekapcsoltak mind az emberi, mind az egér transzkriptomokban. Az ősi alternatív splicing ilyen mintáját széles körben elfogadták a funkcionális alternatív splicing események kritériumaként (Resch et al., 2004; Sorek et al., 2004a). Ezekben az exonokban még magasabb 49,2% (szemben az összes alternatív módon összekapcsolt exon 22,3% – ával) nem tudta teljesíteni a Ka/Ks Arány tesztet (1.táblázat), összhangban az ilyen exonokkal kapcsolatos újabb tanulmányokkal (Ohler et al., 2005). Ezért a nem funkcionális toldási formák hipotézise sem magyarázza adatainkat. Végül, hogy kizárjuk a CpG-szigetek lehetséges hatását, kiszámítottuk a CpG gyakoriságát a GpC felett minden exonban, és elemzésünket az alternatív módon splicelt exonok egy részhalmazára korlátoztuk, amelyek CpG/GpC aránya <0,8 volt (Iida and Akashi, 2000). Ezen exonok 20,8% – a nem tudta teljesíteni ezt a tesztet, hasonlóan az alternatív módon összekapcsolt exonok teljes készletének százalékához (1.táblázat). Bár elvileg a megnövekedett Ka / Ks Arány különböző mögöttes mechanizmusokat tükrözhet , ami nem a kézirat középpontjában áll, kontroll elemzéseink azt mutatják, hogy az emberi genomban a funkcionális alternatív exonok nagy része nem felel meg a Ka/Ks Arány tesztnek.

a konstitutív exonok száma meghaladja az alternatív módon összekapcsolt exonokat a legtöbb fehérjét kódoló génben. Mivel sok organizmusban az átirat szekvencia lefedettsége (pl. est) még mindig meglehetősen alacsony, a Ka/Ks Arány teszt hatékony eszköz a számítási génszerkezet-előrejelzések finomítására. Azonban az emlősök fehérjét kódoló génjeinek többsége alternatív módon spliced, és néhány alternatív spliced exonnak mélyreható funkcionális és szabályozási hatása lehet, amint azt a közelmúltban a Piccolo C2A doménjének alternatív splicingje szemlélteti (Garcia et al. 2004) és még sokan mások. Elemzésünk azt sugallja, hogy kiterjedt alternatív splicing-kel rendelkező organizmusokban (pl. Emlősök) előnyösebb kombinálni a Ka/Ks Arány tesztet más mutatókkal, amelyek jelzik az alternatív splicing valószínűségét. Szerencsére az evolúciós genomika rávilágított a funkcionális alternatív módon összekapcsolt exonok tipikus tulajdonságaira is , amelyeket sikeresen alkalmaztak az előrejelzésekben (Philipps et al., 2004; Sorek et al., 2004b; Yeo et al., 2005). Az ilyen információk integrálhatók a Ka/Ks Arány teszttel a genomi régiók fehérjekódoló potenciáljának pontosabb értékelése érdekében.

ábra. 1

a KA / Ks arányvizsgálat különböző méretű konstitutív és alternatív módon összeillesztett exonokon. (A) konstitutív exonok és (B) alternatív módon összekapcsolt exonok.

Fig. 1

a KA / Ks arányvizsgálat különböző méretű konstitutív és alternatív módon összeillesztett exonokon. (A) konstitutív exonok és (B) alternatív módon összekapcsolt exonok.

1. táblázat

exonok, amelyek megfelelnek vagy nem teljesítik a Ka / Ks aránypróbát

az exonok típusai . összesen #. átlagos hossz (bp) . # sikertelen . # passz . % sikertelen . átlag (medián) Ka/Ks .
konstitutív 10 996 136 1077 9919 9.8 0.146 (0.070)
alternatív 925 122 206 719 22.3 0.199 (0.094)
Alt (fő forma) 630 121 101 529 16.0 0.162 (0.086)
Alt (Medium-form) 253 129 69 184 27.3 0.235 (0.113)
Alt (Minor-form) 42 81 36 6 85.7 0.649 (0.410)
Ancestral Alt 120 102 59 61 49.2 0.412 (0.182)
Alt (CpG/GpC < 0.8) 793 124 165 628 20.8 0.192 (0.097)
az exonok típusai . összesen #. átlagos hossz (bp) . # sikertelen . # passz . % sikertelen . átlag (medián) Ka/Ks .
konstitutív 10 996 136 1077 9919 9.8 0.146 (0.070)
alternatív 925 122 206 719 22.3 0.199 (0.094)
Alt (fő forma) 630 121 101 529 16.0 0.162 (0.086)
Alt (közepes forma) 253 129 69 184 27.3 0.235 (0.113)
Alt (kisebb forma) 42 81 36 6 85.7 0.649 (0.410)
ősi Alt 120 102 59 61 49.2 0.412 (0.182)
Alt (CpG / GpC < 0.8) 793 124 165 628 20.8 0.192 (0.097)

1. táblázat

exonok, amelyek megfelelnek vagy nem teljesítik a Ka / Ks aránypróbát

az exonok típusai . összesen #. átlagos hossz (bp) . # sikertelen . # passz . % sikertelen . átlag (medián) Ka/Ks .
konstitutív 10 996 136 1077 9919 9.8 0.146 (0.070)
alternatív 925 122 206 719 22.3 0.199 (0.094)
Alt (fő forma) 630 121 101 529 16.0 0.162 (0.086)
Alt (Medium-form) 253 129 69 184 27.3 0.235 (0.113)
Alt (Minor-form) 42 81 36 6 85.7 0.649 (0.410)
Ancestral Alt 120 102 59 61 49.2 0.412 (0.182)
Alt (CpG/GpC < 0.8) 793 124 165 628 20.8 0.192 (0.097)
az exonok típusai . összesen #. átlagos hossz (bp) . # sikertelen . # passz . % sikertelen . átlag (medián) Ka/Ks .
konstitutív 10 996 136 1077 9919 9.8 0.146 (0.070)
alternatív 925 122 206 719 22.3 0.199 (0.094)
Alt (fő forma) 630 121 101 529 16.0 0.162 (0.086)
Alt (közepes forma) 253 129 69 184 27.3 0.235 (0.113)
Alt (kisebb forma) 42 81 36 6 85.7 0.649 (0.410)
ősi Alt 120 102 59 61 49.2 0.412 (0.182)
Alt (CpG / GpC < 0.8) 793 124 165 628 20.8 0.192 (0.097)
2. táblázat

emberi mRNS-ek által támogatott exonok, amelyek megfelelnek vagy nem felelnek meg a Ka / Ks Arány tesztnek

az exonok típusai . összesen #. # sikertelen . # passz . % sikertelen .
konstitutív 10 524 1017 9507 9.7
alternatív 811 158 653 19.5
Alt (fő forma) 618 99 519 16.0
Alt (közepes forma) 170 39 131 22.9
Alt (kisebb forma) 23 20 3 87.0
az exonok típusai . összesen #. # sikertelen . # passz . % sikertelen .
Konstitutív 10 524 1017 9507 9.7
Alternatív 811 158 653 19.5
Alt (fő forma) 618 99 519 16.0
Alt (közepes forma) 170 39 131 22.9
Alt (kisebb forma) 23 20 3 87.0
2. táblázat

emberi mRNS-ek által támogatott exonok, amelyek megfelelnek vagy nem felelnek meg a Ka / Ks Arány tesztnek

az exonok típusai . összesen #. # sikertelen . # passz . % sikertelen .
konstitutív 10 524 1017 9507 9.7
alternatív 811 158 653 19.5
Alt (fő forma) 618 99 519 16.0
Alt (közepes forma) 170 39 131 22.9
Alt (kisebb forma) 23 20 3 87.0
az exonok típusai . összesen #. # sikertelen . # passz . % sikertelen .
Konstitutív 10 524 1017 9507 9.7
Alternatív 811 158 653 19.5
Alt (fő forma) 618 99 519 16.0
Alt (közepes forma) 170 39 131 22.9
Alt (kisebb forma) 23 20 3 87.0

a szerzők köszönetet mondanak Anton Nekrutenkónak a kéziratunk elolvasásáért és a hasznos megjegyzésekért. Ezt a munkát támogatta NIH Grant U54-RR021813, tanár-tudós díj C. J. L. a Dreyfus Alapítványtól egy DOE grant DE-FC02-02ER63421. YX támogatja a Ph.D. disszertáció ösztöndíj UCLA.

összeférhetetlenség: nincs bejelentve.

Boue, S. és mtsai.

2003

alternatív splicing és evolúció.

Bioesszayek
25
1031

-1034

Filip, L. C. és Mundy, N. I.

2004

gyors evolúció pozitív darwini szelekcióval a főemlősökben a bőséges limfocita fehérje CD45 extracelluláris doménjében.

Mol. Biol. Evol.
21
1504

-1511

Garcia, J., et al.

2004

konformációs kapcsoló a Piccolo C2A tartományban, amelyet alternatív illesztés szabályoz.

Nat. Struct. Mol. Biol.
11
45

-53

Hurst, L. D. és Pal, C.

2001

bizonyíték a szelekció tisztítására a BRCA1 csendes helyein.

Trends Genet.
17
62

-65

Iida, K. és Akasi, H.

2000

a transzlációs szelekció tesztje az emberi genom csendes helyein: bázisösszetétel-összehasonlítások alternatív módon összekapcsolt génekben.

gén
261
93

-105

Johnson, J. M., et al.

2003

az emberi alternatív pre-mRNS splicing Genom-szintű felmérése exon junction mikroarray-kkel.

tudomány
302
2141

-2144

Kellis, M., et al.

2003

az élesztőfajok szekvenálása és összehasonlítása a gének és szabályozó elemek azonosítására.

Természet
423
241

-254

Lareau, L. F., et al.

2004

az alternatív splicing változó szerepei.

kurr. Opin. Struct. Biol.
14
273

-282

Lewis, B. P., et al.

2003

bizonyíték az alternatív splicing és a nonszensz által közvetített mRNS bomlás széles körű összekapcsolására az emberekben.

Proc. Natl Acad. Sci. USA
100
189

-192

Miller, W. és mtsai.

2004

összehasonlító genomika.

év. Rev. Genomics Hum. Genet.
5
15

-56

Modrek, B. és Lee, C.

2002

az alternatív splicing genomikai nézete.

Nat. Genet.
30
13

-19

Modrek, B. és Lee, C.

2003

az alternatív splicing az emberi, egér és patkány genomokban az exon létrehozásának/elvesztésének megnövekedett arányával jár.

Nat. Genet.
34
177

-180

Modrek, B. és mtsai.

2001

az alternatív splicing Genomszintű elemzése humán expresszált szekvencia adatok felhasználásával.

nukleinsavak res.
29
2850

-2859

Nyekrutenko, A.

2004

a számok összeegyeztetése: est-k a fehérjét kódoló génekkel szemben.

Mol. Biol. Evol.
21
1278

-1282

Nekrutenko, A., et al.

2002

a K(A)/K (S) arány teszt a genomi régiók fehérjekódoló potenciáljának felmérésére: empirikus és szimulációs vizsgálat.

Genome res.
12
198

-202

Nekrutenko, A., et al.

2003

ETOPE: a megjósolt exonok evolúciós tesztje.

Nukleinsavak Res.
31
3564

-3567

Nekrutenko, A., et al.

2003

az evolúciós megközelítés feltárja az emberi genom magas fehérjekódoló képességét.

Trends Genet.
19
306

-310

Ohler, U., et al.

2005

ismeretlen konzervált, alternatív módon összekapcsolt exonok felismerése.

PLoS Comp. Biol.
1
e15

Pan, Q. és mtsai.

2004

az emlősök alternatív illesztésének globális szabályozási jellemzőinek feltárása kvantitatív mikroarray platform segítségével.

Mol. Cella.
16
929

-941

Philipps, D. L., et al.

2004

számítási és kísérleti megközelítés az alternatív módon összekapcsolt exonok a priori azonosításához.

RNS
10
1838

-1844

Resch, A., et al.

2004

bizonyíték a konzervált alternatív splicing események szubpopulációjára szelekciós nyomás alatt a fehérje leolvasási keret megőrzése érdekében.

nukleinsavak res.
32
1261

-1269

Sorek, R. és Ast, G.

2003

az alternatív módon összekapcsolt exonokat kísérő Intronikus szekvenciák konzerválódnak az ember és az egér között.

Genome res.
13
1631

-1637

Sorek, R. és Safer, H. M.

2003

új algoritmus a szennyezett EST könyvtárak számítógépes azonosítására.

nukleinsavak res.
31
1067

-1074

Sorek, R., et al.

2002

az Alu-tartalmú exonokat alternatív módon összeillesztjük.

Genome res.
12
1060

-1067

Sorek, R., et al.

2004

mennyire elterjedt a funkcionális alternatív splicing az emberi genomban?

Trends Genet
20
68

-71

Sorek, R., et al.

2004

nem EST-alapú módszer az exon-kihagyás előrejelzéséhez.

Genome res.
14
1617

-1623

Thompson, J. D., et al.

1994

CLUSTAL W: a progresszív többszörös szekvencia-igazítás érzékenységének javítása szekvencia súlyozással, pozícióspecifikus résbüntetésekkel és súlymátrix-választással.

Nukleinsavak Res.
22
4673

-4680

Xing, Y. és Lee, C.

2004

a korai fehérje csonkolással szembeni negatív szelekciós nyomást mind az alternatív splicing, mind a diploidia csökkenti.

Trends Genet.
20
472

-475

Yang, Z.

1997

PAML: programcsomag a filogenetikai elemzéshez a maximális valószínűség szerint.

Comput. Appl. Biosci.
13
555

-556

Yeo, G. W., et al.

2005

emberen és egéren konzervált alternatív splicing események azonosítása és elemzése.

Proc. Natl Acad. Sci. USA
102
2850

-2855

Zhang, Z. és Gerstein, M.

2004

a pszeudogének nagyszabású elemzése az emberi genomban.

kurr. Opin. Genet. Dev.
14
328

–335

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.