Abstract
Oppsummering: Nylig, Ka / Ks ratio test, som vurderer protein-koding potensialer av genomiske regioner basert på deres ikke-synonymt til synonymt divergens priser, har blitt foreslått og hell brukes i genom merknader av eukaryoter. Vi systematisk utført Ka / Ks ratio test på 925 transkripsjon-bekreftet alternativt skjøtes eksoner i det menneskelige genom, som vi beskriver i dette manuskriptet. Vi fant at 22,3% av evolusjonært konserverte alternativt spleisede eksoner ikke kan bestå Ka / Ks-ratio testen, sammenlignet med 9,8% for konstitutive eksoner. Den falske negative frekvensen var den høyeste (85,7%) for eksoner med lave frekvenser av transkriptinkludering. Analyser av alternativt spleiset eksoner støttet av full lengde mRNA sekvenser ga lignende resultater, og nesten halvparten av eksoner involvert i forfedrenes alternative spleising hendelser kunne ikke bestå denne testen. Vår analyse antyder en fremtidig retning for å innlemme komparative genomics-baserte alternative spleising spådommer Med Ka / Ks ratio test i høyere eukaryoter med omfattende rna alternativ spleising.
Contact:[email protected]
1 INTRODUKSJON
Komparativ genomikk har gitt kraftige verktøy for merknader av eukaryote genomer (Kellis et al., 2003). I en banebrytende studie, Nekrutenko et al. (2002) foreslått ‘Ka / Ks ratio test’ for å vurdere protein-kodende potensialer av spådde eksoner. Denne testen er basert på antagelsen om at flertallet av proteinkodende regioner i det menneskelige genom er under sterkt rensende utvalg under evolusjonen. Som et resultat overstiger deres priser for synonymt divergens (Ks) i stor grad satsene for ikke-synonymt divergens (Ka), noe Som gir Ka/Ks–forhold på mye mindre enn en i menneske-mus orthologe sekvenssammenligninger. På en prøve av 1244 eksoner fra 153 proteinkodende gener ga Ka/Ks-ratio testen en 8% falsk negativ rate og en < 5% falsk positiv rate for interne eksoner, en nøyaktighet som var bedre enn de fleste av genprognoseverktøyene (Nekrutenko et al ., 2002). Siden introduksjonen Har Ka / Ks-ratio testen blitt mye og vellykket brukt til å forbedre merknader av menneskelige og andre pattedyrgenomer (Miller et al., 2004; Nekrutenko, 2004; Nekrutenko et al.(2003b; Zhang Og Gerstein, 2004).
et fremvoksende spørsmål Om Ka / Ks-ratio-testen gjelder alternativt spleisede eksoner i eukaryotiske genomer. Nylige studier av uttrykte sekvenser og mikroarray data har vist at alternativ spleising er en utbredt mekanisme for genregulering i høyere eukaryoter (Lareau et al.(2004; Modrek Og Lee, 2002). Opptil tre fjerdedeler av humane kodende gener gjennomgår alternativ spleising (Johnson et al., 2003). Det er rikelig bevis for at alternativ spleising er forbundet med relaxations av seleksjonstrykk under evolusjonen (Boue et al., 2003). For eksempel er alternativ spleising observert å være assosiert med en akselerert hastighet på ekson skapelse og tap (Modrek Og Lee, 2003), nye ekson opprinnelse Fra Alu elementer (Sorek et al., 2002), toleranse for tidlig termineringskodoner (Lewis et al.( 2003; Xing Og Lee, 2004), og så videre. Iida og Akashi (2000) undersøkte sekvensdivergensmønstrene av 110 alternativt spleiset proteinkodende gener fra human og Drosophila, og fant at alternativt spleiset regioner av disse genene hadde høyere Ka / Ks-verdier sammenlignet med konstitutive regioner. Andre eksempler på forhøyet Ka / Ks i alternativt spleisede eksoner har også blitt rapportert (Filip og Mundy, 2004; Hurst og Pal, 2001). Disse observasjonene reiser et spørsmål om divergensen Fra Ka / Ks-ratio testen blant alternativt spleisede eksoner.
2 METODER
vi identifiserte alternativt spleisede eksoner ved å samkjøre humane uttrykte sekvenser til det menneskelige genom (Modrek et al., 2001). For å kvantifisere graden av alternativ spleising for hver alternativt spleiset ekson, brukte vi en standard metrisk alternativ spleising—ekson inklusjonsnivået, definert som antall Est som inkluderte en ekson dividert med det totale antall Est som enten inkluderte eller hoppet over denne ekson. Vi delte alternativt opp eksoner i tre klasser basert på deres inklusjonsnivåer: major-form (> 2/3), medium-form (mellom 1/3 og 2/3) og minor-form (<1/3).
vi identifiserte den ortologe eksonsekvensen for hver menneskelig ekson i den genomiske sekvensen av musens ortholog, som tidligere beskrevet (Modrek and Lee, 2003). For hvert menneske-mus orthologe exon sekvens par, vi utførte Ka / Ks ratio test etter protokollen Fra Nekrutenko et al. (2003a). Kort, orthologe exon sekvenser fra menneske og mus ble oversatt og deretter justert VED HJELP CLUSTALW Thompson et al., 1994 under standardparametere. Denne proteinjusteringen ble brukt til å frø en justering av tilsvarende nukleotidsekvenser, og hull i justeringen ble trimmet. Vi estimerte antall synonyme og ikke-synonyme substitusjoner / nettsteder ved Hjelp Av Yang–Nielsen-estimatene fra yn00-programmet I PAML-pakken (PAML 3.14) (Yang, 1997). Vi bygget en 2 × 2 beredskapstabell ved hjelp av antall endrede og uendrede synonyme / ikke-synonyme nettsteder, og testet om Ka / Ks-forholdet var signifikant <1 ved Hjelp Av Fisher ‘ s exact test. Vi definerte en exon som å passere Ka / Ks ratio test hvis Ka / Ks var signifikant < 1 på P < 0.05 nivå.
3 RESULTATER og DISKUSJON
Vi samlet en liste over 925 menneskelige alternativt spleisede eksoner som ble konservert mellom menneskelige og musgenomer, basert på analyser av humane uttrykte sekvenser (Modrek et al., 2001). Vi har også samlet en liste over 10 996 menneskelige konstitutive exons som en kontroll. Alle disse eksonene var interne eksoner flankert av introner i begge ender. Vi utførte Ka / Ks ratio tester på disse exons følge protokollen (Nekrutenko et al., 2003a) (Se Metode seksjon). Av de konstitutive exons 9.8% klarte Ikke å bestå Ka / Ks ratio test, et forhold som ligner på det som ble rapportert av den første studien (8%) (Nekrutenko et al., 2002) (Tabell 1). I motsetning til dette kunne 22,3% av alternativt spleisede eksoner som ble testet ikke bestå Ka / Ks-ratio testen, en mer enn 2 ganger økning sammenlignet med konstitutive eksoner. Fordi alternativt spleiset eksoner med forskjellige inklusjonsnivåer (se definisjoner i Metodeseksjonen) viste forskjellige mønstre av evolusjonær divergens (Modrek Og Lee, 2003; Pan et al., 2004, vi delt 925 alternativt skjøtes exons inn i tre klasser basert på deres exon inklusjon nivåer (se Metoder avsnitt). Fraksjonen av eksoner som ikke klarte testen var 16,0% for major-form eksoner, og økte til 85,7% for mindre form alternative eksoner (inkludert < 1/3 i transkripsjonene). Siden alternativt spleiset eksoner var kortere i gjennomsnitt, delte vi også eksoner basert på deres størrelser(Fig. 1). I både konstitutive og alternativt skjøtes eksoner, fraksjonene sviktende testen var høyere for kortere eksoner, i samsvar med den opprinnelige studien Nekrutenko et al., 2002. Fraksjonen var imidlertid konsekvent høyere i alternativt skjøtede eksoner etter kontroll for eksonstørrelser (f.eks. 5,4% for konstitutive eksoner og 16,6% for alternativt skjøtede eksoner mellom 101 og 150 nt; Fig. 1). Analyser av mus alternativt spleiset eksoner i en mus–menneskelig sammenligning ga lignende resultater (data ikke vist).
vårt resultat indikerer at en signifikant høyere brøkdel av alternativt spleiset eksoner i det menneskelige genomet ikke kan bestå Ka/Ks-ratio testen. Dette betyr imidlertid ikke umiddelbart oversette til en økt falsk negativ rate Av Ka / Ks ratio test i alternativt spleiset exons, siden andre tolkninger er mulig. Betyr disse dataene faktisk at et betydelig antall alternativt spleisede eksoner observert i de menneskelige EST-sekvensene ikke representerer ekte eksoner, men faktisk kommer fra artefakter I EST-dataene (f. eks. sjeldne spliceosomale feil) (Modrek and Lee, 2002; Sorek and Safer, 2003)? Denne forklaringen virker spesielt plausibel for mindre eksoner (som observeres i en liten brøkdel AV EST-sekvenser). For å teste denne muligheten analyserte vi en delmengde av alternativt spleisede eksoner som ble støttet av mrna-sekvenser i full lengde. Vi observerte lignende fraksjoner av alternativt spleisede eksoner som ikke klarte Ka / Ks ratio test (Tabell 2). Derfor, falske eksoner stammer FRA EST gjenstander kan ikke forklare våre data. Har alternativt spleisede eksoner som feiler Ka/Ks-ratio-testen i stor grad ikke-funksjonelle spleiseformer? For å svare på dette spørsmålet, begrenset vi vår analyse til et sett med 120 eksoner som alternativt ble spleiset i både menneskelige og musetranskriptomer. Et slikt mønster av ‘forfedre alternativ spleising’ ble allment vedtatt som et kriterium for funksjonelle alternative spleising hendelser (Resch et al., 2004; Sorek et al.( 2004a). I disse eksonene kunne en enda høyere 49,2% (mot 22,3% av alle alternativt spleisede eksoner) ikke bestå Ka / Ks-ratio-testen (Tabell 1), i samsvar med en annen nylig studie på slike eksoner (Ohler et al., 2005). Derfor hypotesen for ikke-funksjonelle skjøte former kan ikke forklare våre data enten. Til slutt, for å utelukke den potensielle innflytelsen Fra CpG-øyene, beregnet vi frekvensen Av CpG over GpC i hver ekson, og begrenset vår analyse til en delmengde av alternativt spleisede eksoner hvis CpG/GpC-forhold var <0.8 (Iida og Akashi, 2000). Av disse eksonene kunne 20,8% ikke bestå denne testen, tilsvarende prosentandelen for det totale settet av alternativt spleisede eksoner (Tabell 1). Selv om et økt Ka/Ks-forhold i prinsippet kan gjenspeile ulike underliggende mekanismer, som ikke er fokus for dette manuskriptet, indikerer våre kontrollanalyser at en stor del av funksjonelle alternative eksoner i det menneskelige genomet feiler Ka / Ks-ratio testen.
Konstitutive eksoner overstiger alternativt spleiset eksoner i de fleste proteinkodende gener. ESTs) fortsatt er ganske lav, Er Ka / Ks-ratio testen et kraftig verktøy for raffinering av beregningsgenstrukturprognoser. Imidlertid er flertallet av pattedyrsproteinkodende gener alternativt spleiset, og et lite antall alternativt spleisede eksoner kan ha dype funksjonelle og regulatoriske virkninger, som nylig illustrert ved den alternative spleising AV C2A-domenet Til Piccolo (Garcia et al.(2004) og mange andre. Vår analyse antyder at i organismer med omfattende alternativ spleising (f. eks. pattedyr) er Det å foretrekke å kombinere Ka/Ks-ratio-testen med andre beregninger som indikerer sannsynligheten for alternativ spleising. Heldigvis evolusjonær genomikk har også kaste lys over de typiske trekk ved funksjonelle alternativt skjøtes eksoner, som har blitt brukt i spådommer (Philipps et al ., 2004; Sorek et al., 2004b; Yeo et al., 2005). Slik informasjon kan integreres Med Ka / Ks ratio test for en mer nøyaktig vurdering av protein-kodende potensialer av genomiske regioner.
Ka / Ks ratio test på konstitutive og alternativt skjøtes eksoner med forskjellige størrelser. (A) Konstitutive eksoner og (B) alternativt spleiset eksoner.
Ka / Ks ratio test på konstitutive og alternativt skjøtes eksoner med forskjellige størrelser. (A) Konstitutive eksoner og (B) alternativt spleiset eksoner.
Eksoner som består Eller ikke består Ka / Ks-ratio-testen
typer av exons . | Totalt # . | Gjennomsnittlig lengde (bp). | # Mislykkes . | # Pass . | % Mislykkes . | Gjennomsnitt (median) Ka / Ks . |
---|---|---|---|---|---|---|
Konstitutive | 10 996 | 136 | 1077 | 9919 | 9.8 | 0.146 (0.070) |
Alternativ | 925 | 122 | 206 | 719 | 22.3 | 0.199 (0.094) |
Alt (Major-form)) | 630 | 121 | 101 | 529 | 16.0 | 0.162 (0.086) |
Alt (Medium-form) | 253 | 129 | 69 | 184 | 27.3 | 0.235 (0.113) |
Alt (Minor-form) | 42 | 81 | 36 | 6 | 85.7 | 0.649 (0.410) |
Ancestral Alt | 120 | 102 | 59 | 61 | 49.2 | 0.412 (0.182) |
Alt (CpG/GpC < 0.8) | 793 | 124 | 165 | 628 | 20.8 | 0.192 (0.097) |
typer av exons . | Totalt # . | Gjennomsnittlig lengde (bp). | # Mislykkes . | # Pass . | % Mislykkes . | Gjennomsnitt (median) Ka / Ks . |
---|---|---|---|---|---|---|
Konstitutive | 10 996 | 136 | 1077 | 9919 | 9.8 | 0.146 (0.070) |
Alternativ | 925 | 122 | 206 | 719 | 22.3 | 0.199 (0.094) |
Alt (Major-form)) | 630 | 121 | 101 | 529 | 16.0 | 0.162 (0.086) |
Alt (Medium-form) | 253 | 129 | 69 | 184 | 27.3 | 0.235 (0.113) |
Alt (Mindre-skjema) | 42 | 81 | 36 | 6 | 85.7 | 0.649 (0.410) |
Ancestral Alt | 120 | 102 | 59 | 61 | 49.2 | 0.412 (0.182) |
Alt (CpG/GpC)< 0.8) | 793 | 124 | 165 | 628 | 20.8 | 0.192 (0.097) |
Eksoner som består Eller ikke består Ka / Ks-ratio-testen
typer av exons . | Totalt # . | Gjennomsnittlig lengde (bp). | # Mislykkes . | # Pass . | % Mislykkes . | Gjennomsnitt (median) Ka / Ks . |
---|---|---|---|---|---|---|
Konstitutive | 10 996 | 136 | 1077 | 9919 | 9.8 | 0.146 (0.070) |
Alternativ | 925 | 122 | 206 | 719 | 22.3 | 0.199 (0.094) |
Alt (Major-form)) | 630 | 121 | 101 | 529 | 16.0 | 0.162 (0.086) |
Alt (Medium-form) | 253 | 129 | 69 | 184 | 27.3 | 0.235 (0.113) |
Alt (Minor-form) | 42 | 81 | 36 | 6 | 85.7 | 0.649 (0.410) |
Ancestral Alt | 120 | 102 | 59 | 61 | 49.2 | 0.412 (0.182) |
Alt (CpG/GpC < 0.8) | 793 | 124 | 165 | 628 | 20.8 | 0.192 (0.097) |
typer av exons . | Totalt # . | Gjennomsnittlig lengde (bp). | # Mislykkes . | # Pass . | % Mislykkes . | Gjennomsnitt (median) Ka / Ks . |
---|---|---|---|---|---|---|
Konstitutive | 10 996 | 136 | 1077 | 9919 | 9.8 | 0.146 (0.070) |
Alternativ | 925 | 122 | 206 | 719 | 22.3 | 0.199 (0.094) |
Alt (Major-form)) | 630 | 121 | 101 | 529 | 16.0 | 0.162 (0.086) |
Alt (Medium-form) | 253 | 129 | 69 | 184 | 27.3 | 0.235 (0.113) |
Alt (Mindre-skjema) | 42 | 81 | 36 | 6 | 85.7 | 0.649 (0.410) |
Ancestral Alt | 120 | 102 | 59 | 61 | 49.2 | 0.412 (0.182) |
Alt (CpG/GpC)< 0.8) | 793 | 124 | 165 | 628 | 20.8 | 0.192 (0.097) |
Eksoner støttet av menneskelige mrna som består Eller ikke består Ka / Ks ratio test
typer av exons . | Totalt # . | # Mislykkes . | # Pass . | % Mislykkes . |
---|---|---|---|---|
Konstitutive | 10 524 | 1017 | 9507 | 9.7 |
Alternativ | 811 | 158 | 653 | 19.5 |
Alt (Major-form)) | 618 | 99 | 519 | 16.0 |
Alt (Medium-form) | 170 | 39 | 131 | 22.9 |
Alt (Mindre-skjema) | 23 | 20 | 3 | 87.0 |
typer av exons . | Totalt # . | # Mislykkes . | # Pass . | % Mislykkes . |
---|---|---|---|---|
Konstitutive | 10 524 | 1017 | 9507 | 9.7 |
Alternativ | 811 | 158 | 653 | 19.5 |
Alt (Major-form)) | 618 | 99 | 519 | 16.0 |
Alt (Medium-form) | 170 | 39 | 131 | 22.9 |
Alt (Mindre-skjema) | 23 | 20 | 3 | 87.0 |
Eksoner støttet av menneskelige mrna som består Eller ikke består Ka / Ks ratio test
typer av exons . | Totalt # . | # Mislykkes . | # Pass . | % Mislykkes . |
---|---|---|---|---|
Konstitutive | 10 524 | 1017 | 9507 | 9.7 |
Alternativ | 811 | 158 | 653 | 19.5 |
Alt (Major-form)) | 618 | 99 | 519 | 16.0 |
Alt (Medium-form) | 170 | 39 | 131 | 22.9 |
Alt (Mindre-skjema) | 23 | 20 | 3 | 87.0 |
typer av exons . | Totalt # . | # Mislykkes . | # Pass . | % Mislykkes . |
---|---|---|---|---|
Konstitutive | 10 524 | 1017 | 9507 | 9.7 |
Alternativ | 811 | 158 | 653 | 19.5 |
Alt (Major-form)) | 618 | 99 | 519 | 16.0 |
Alt (Medium-form) | 170 | 39 | 131 | 22.9 |
Alt (Mindre-skjema) | 23 | 20 | 3 | 87.0 |
forfatterne takker Anton Nekrutenko for å ha lest manuskriptet vårt og for de nyttige kommentarene. DETTE arbeidet ble støttet AV NIH Grant U54-RR021813, En Lærer-Scholar award Til C. J. L. Fra Dreyfus Foundation, EN DOE grant DE-FC02-02ER63421. Yx støttes av En Ph. D. dissertation fellowship fra UCLA.
Interessekonflikt: ingen erklært.
Boue, S., et al.
Alternativ spleising og evolusjon.
-1034
Filip, L. C. Og Mundy, N. I.
Rask utvikling ved positiv Darwinistisk seleksjon i det ekstracellulære domenet til det rike lymfocyttproteinet CD45 i primater.
-1511
Garcia, J., et al.
en konformasjonsbryter i Piccolo C2A-domenet reguleres av alternativ spleising.
-53
Hurst, L. D. Og Pal, C.
Bevis for rensende utvalg som virker pa stille steder I BRCA1.
-65
Iida, K. Og Akashi, H.
en test av translasjonell seleksjon på ‘stille’ steder i det menneskelige genom: basesammensetningssammenligninger i alternativt spleise gener.
-105
Johnson, J. M., et al.
Genom-bred undersøkelse av menneskelig alternativ pre-mRNA spleising med exon junction microarrays.
-2144
Trueblood, M., et al.
Sekvensering og sammenligning av gjærarter for å identifisere gener og regulatoriske elementer.
-254
Lareau, L. F., et al.
de utviklende rollene til alternativ spleising.
-282
Lewis, B. P., et al.
Bevis for den utbredte koblingen av alternativ spleising og tull-mediert mRNA forfall hos mennesker.
-192
Miller, W., et al.
Sammenlignende genomikk.
-56
Modrek, B. Og Lee, C.
et genomisk syn på alternativ spleising.
-19
Modrek, B. Og Lee, C.
Alternativ spleising i menneske -, mus-og rottegenomene er forbundet med en økt grad av eksonskapelse/tap.
-180
Jenssen, B., et al.
Genom-bred analyse av alternativ spleising ved hjelp av humane uttrykte sekvensdata.
-2859
Neida, A.
Avstemme tallene: ESTs versus proteinkodende gener.
-1282
Jørgensen, A., et al.
K(A)/K (S) ratio test for å vurdere proteinkodingspotensialet i genomiske regioner: en empirisk og simuleringsstudie.
-202
Jørgensen, A., et al.
etope: evolusjonær test av spådde eksoner.
-3567
Jørgensen, A., et al.
en evolusjonær tilnærming avslører en høy proteinkodende kapasitet av det menneskelige genom.
-310
Jenssen, N., et al.
Anerkjennelse av ukjent konservert alternativt spleiset eksoner.
Trueblood, J., et al.
Avslørende globale regulatoriske trekk ved pattedyr alternativ spleising ved hjelp av en kvantitativ microarray plattform.
-941
Philipps, D. L., et al.
en beregningsorientert og eksperimentell tilnærming mot a priori identifisering av alternativt skjøtes eksoner.
-1844
Jenssen, A., et al.
Bevis for en subpopulation av konserverte alternative spleising hendelser under seleksjon press for protein lesing ramme bevaring.
-1269
Sorek, R. Og Ast, G.
Introniske sekvenser flankerer alternativt spleiset eksoner er konservert mellom menneske og mus.
-1637
Sorek, R. Og Safer, H. M.
en roman algoritme for beregningsorientert identifikasjon av forurenset EST biblioteker.
-1074
Sorek, R., et al.
Alu-holdige eksoner er alternativt spleiset.
-1067
Sorek, R., et al.
Hvor utbredt er funksjonell alternativ spleising i det menneskelige genom?
-71
Sorek, R., et al.
en ikke-EST-basert metode for exon-hoppe prediksjon.
-1623
Thompson, J. D., et al.
CLUSTAL W: forbedre følsomheten av progressiv multiple sekvens justering gjennom sekvens vekting, posisjonsspesifikke gap straffer og vekt matrix valg.
-4680
Xing, Y. Og Lee, C.
Negativt seleksjonstrykk mot prematur protein avkorting reduseres ved både alternativ spleising og diploidi.
-475
Yang, Z.
PAML: en programpakke for fylogenetisk analyse med maksimal sannsynlighet.
-556
Yeo, G. W., et al.
Identifisering og analyse av alternative spleising hendelser bevart i menneske og mus.
-2855
Zhang, Z. Og Gerstein, M.
Storskala analyse av pseudogener i det menneskelige genom.
–335