Vurdere anvendelsen Av Ka / Ks ratio test til alternativt skjøtes eksoner

Abstract

Oppsummering: Nylig, Ka / Ks ratio test, som vurderer protein-koding potensialer av genomiske regioner basert på deres ikke-synonymt til synonymt divergens priser, har blitt foreslått og hell brukes i genom merknader av eukaryoter. Vi systematisk utført Ka / Ks ratio test på 925 transkripsjon-bekreftet alternativt skjøtes eksoner i det menneskelige genom, som vi beskriver i dette manuskriptet. Vi fant at 22,3% av evolusjonært konserverte alternativt spleisede eksoner ikke kan bestå Ka / Ks-ratio testen, sammenlignet med 9,8% for konstitutive eksoner. Den falske negative frekvensen var den høyeste (85,7%) for eksoner med lave frekvenser av transkriptinkludering. Analyser av alternativt spleiset eksoner støttet av full lengde mRNA sekvenser ga lignende resultater, og nesten halvparten av eksoner involvert i forfedrenes alternative spleising hendelser kunne ikke bestå denne testen. Vår analyse antyder en fremtidig retning for å innlemme komparative genomics-baserte alternative spleising spådommer Med Ka / Ks ratio test i høyere eukaryoter med omfattende rna alternativ spleising.

Contact:[email protected]

1 INTRODUKSJON

Komparativ genomikk har gitt kraftige verktøy for merknader av eukaryote genomer (Kellis et al., 2003). I en banebrytende studie, Nekrutenko et al. (2002) foreslått ‘Ka / Ks ratio test’ for å vurdere protein-kodende potensialer av spådde eksoner. Denne testen er basert på antagelsen om at flertallet av proteinkodende regioner i det menneskelige genom er under sterkt rensende utvalg under evolusjonen. Som et resultat overstiger deres priser for synonymt divergens (Ks) i stor grad satsene for ikke-synonymt divergens (Ka), noe Som gir Ka/Ks–forhold på mye mindre enn en i menneske-mus orthologe sekvenssammenligninger. På en prøve av 1244 eksoner fra 153 proteinkodende gener ga Ka/Ks-ratio testen en 8% falsk negativ rate og en < 5% falsk positiv rate for interne eksoner, en nøyaktighet som var bedre enn de fleste av genprognoseverktøyene (Nekrutenko et al ., 2002). Siden introduksjonen Har Ka / Ks-ratio testen blitt mye og vellykket brukt til å forbedre merknader av menneskelige og andre pattedyrgenomer (Miller et al., 2004; Nekrutenko, 2004; Nekrutenko et al.(2003b; Zhang Og Gerstein, 2004).

et fremvoksende spørsmål Om Ka / Ks-ratio-testen gjelder alternativt spleisede eksoner i eukaryotiske genomer. Nylige studier av uttrykte sekvenser og mikroarray data har vist at alternativ spleising er en utbredt mekanisme for genregulering i høyere eukaryoter (Lareau et al.(2004; Modrek Og Lee, 2002). Opptil tre fjerdedeler av humane kodende gener gjennomgår alternativ spleising (Johnson et al., 2003). Det er rikelig bevis for at alternativ spleising er forbundet med relaxations av seleksjonstrykk under evolusjonen (Boue et al., 2003). For eksempel er alternativ spleising observert å være assosiert med en akselerert hastighet på ekson skapelse og tap (Modrek Og Lee, 2003), nye ekson opprinnelse Fra Alu elementer (Sorek et al., 2002), toleranse for tidlig termineringskodoner (Lewis et al.( 2003; Xing Og Lee, 2004), og så videre. Iida og Akashi (2000) undersøkte sekvensdivergensmønstrene av 110 alternativt spleiset proteinkodende gener fra human og Drosophila, og fant at alternativt spleiset regioner av disse genene hadde høyere Ka / Ks-verdier sammenlignet med konstitutive regioner. Andre eksempler på forhøyet Ka / Ks i alternativt spleisede eksoner har også blitt rapportert (Filip og Mundy, 2004; Hurst og Pal, 2001). Disse observasjonene reiser et spørsmål om divergensen Fra Ka / Ks-ratio testen blant alternativt spleisede eksoner.

2 METODER

vi identifiserte alternativt spleisede eksoner ved å samkjøre humane uttrykte sekvenser til det menneskelige genom (Modrek et al., 2001). For å kvantifisere graden av alternativ spleising for hver alternativt spleiset ekson, brukte vi en standard metrisk alternativ spleising—ekson inklusjonsnivået, definert som antall Est som inkluderte en ekson dividert med det totale antall Est som enten inkluderte eller hoppet over denne ekson. Vi delte alternativt opp eksoner i tre klasser basert på deres inklusjonsnivåer: major-form (> 2/3), medium-form (mellom 1/3 og 2/3) og minor-form (<1/3).

vi identifiserte den ortologe eksonsekvensen for hver menneskelig ekson i den genomiske sekvensen av musens ortholog, som tidligere beskrevet (Modrek and Lee, 2003). For hvert menneske-mus orthologe exon sekvens par, vi utførte Ka / Ks ratio test etter protokollen Fra Nekrutenko et al. (2003a). Kort, orthologe exon sekvenser fra menneske og mus ble oversatt og deretter justert VED HJELP CLUSTALW Thompson et al., 1994 under standardparametere. Denne proteinjusteringen ble brukt til å frø en justering av tilsvarende nukleotidsekvenser, og hull i justeringen ble trimmet. Vi estimerte antall synonyme og ikke-synonyme substitusjoner / nettsteder ved Hjelp Av Yang–Nielsen-estimatene fra yn00-programmet I PAML-pakken (PAML 3.14) (Yang, 1997). Vi bygget en 2 × 2 beredskapstabell ved hjelp av antall endrede og uendrede synonyme / ikke-synonyme nettsteder, og testet om Ka / Ks-forholdet var signifikant <1 ved Hjelp Av Fisher ‘ s exact test. Vi definerte en exon som å passere Ka / Ks ratio test hvis Ka / Ks var signifikant < 1 på P < 0.05 nivå.

3 RESULTATER og DISKUSJON

Vi samlet en liste over 925 menneskelige alternativt spleisede eksoner som ble konservert mellom menneskelige og musgenomer, basert på analyser av humane uttrykte sekvenser (Modrek et al., 2001). Vi har også samlet en liste over 10 996 menneskelige konstitutive exons som en kontroll. Alle disse eksonene var interne eksoner flankert av introner i begge ender. Vi utførte Ka / Ks ratio tester på disse exons følge protokollen (Nekrutenko et al., 2003a) (Se Metode seksjon). Av de konstitutive exons 9.8% klarte Ikke å bestå Ka / Ks ratio test, et forhold som ligner på det som ble rapportert av den første studien (8%) (Nekrutenko et al., 2002) (Tabell 1). I motsetning til dette kunne 22,3% av alternativt spleisede eksoner som ble testet ikke bestå Ka / Ks-ratio testen, en mer enn 2 ganger økning sammenlignet med konstitutive eksoner. Fordi alternativt spleiset eksoner med forskjellige inklusjonsnivåer (se definisjoner i Metodeseksjonen) viste forskjellige mønstre av evolusjonær divergens (Modrek Og Lee, 2003; Pan et al., 2004, vi delt 925 alternativt skjøtes exons inn i tre klasser basert på deres exon inklusjon nivåer (se Metoder avsnitt). Fraksjonen av eksoner som ikke klarte testen var 16,0% for major-form eksoner, og økte til 85,7% for mindre form alternative eksoner (inkludert < 1/3 i transkripsjonene). Siden alternativt spleiset eksoner var kortere i gjennomsnitt, delte vi også eksoner basert på deres størrelser(Fig. 1). I både konstitutive og alternativt skjøtes eksoner, fraksjonene sviktende testen var høyere for kortere eksoner, i samsvar med den opprinnelige studien Nekrutenko et al., 2002. Fraksjonen var imidlertid konsekvent høyere i alternativt skjøtede eksoner etter kontroll for eksonstørrelser (f.eks. 5,4% for konstitutive eksoner og 16,6% for alternativt skjøtede eksoner mellom 101 og 150 nt; Fig. 1). Analyser av mus alternativt spleiset eksoner i en mus–menneskelig sammenligning ga lignende resultater (data ikke vist).

vårt resultat indikerer at en signifikant høyere brøkdel av alternativt spleiset eksoner i det menneskelige genomet ikke kan bestå Ka/Ks-ratio testen. Dette betyr imidlertid ikke umiddelbart oversette til en økt falsk negativ rate Av Ka / Ks ratio test i alternativt spleiset exons, siden andre tolkninger er mulig. Betyr disse dataene faktisk at et betydelig antall alternativt spleisede eksoner observert i de menneskelige EST-sekvensene ikke representerer ekte eksoner, men faktisk kommer fra artefakter I EST-dataene (f. eks. sjeldne spliceosomale feil) (Modrek and Lee, 2002; Sorek and Safer, 2003)? Denne forklaringen virker spesielt plausibel for mindre eksoner (som observeres i en liten brøkdel AV EST-sekvenser). For å teste denne muligheten analyserte vi en delmengde av alternativt spleisede eksoner som ble støttet av mrna-sekvenser i full lengde. Vi observerte lignende fraksjoner av alternativt spleisede eksoner som ikke klarte Ka / Ks ratio test (Tabell 2). Derfor, falske eksoner stammer FRA EST gjenstander kan ikke forklare våre data. Har alternativt spleisede eksoner som feiler Ka/Ks-ratio-testen i stor grad ikke-funksjonelle spleiseformer? For å svare på dette spørsmålet, begrenset vi vår analyse til et sett med 120 eksoner som alternativt ble spleiset i både menneskelige og musetranskriptomer. Et slikt mønster av ‘forfedre alternativ spleising’ ble allment vedtatt som et kriterium for funksjonelle alternative spleising hendelser (Resch et al., 2004; Sorek et al.( 2004a). I disse eksonene kunne en enda høyere 49,2% (mot 22,3% av alle alternativt spleisede eksoner) ikke bestå Ka / Ks-ratio-testen (Tabell 1), i samsvar med en annen nylig studie på slike eksoner (Ohler et al., 2005). Derfor hypotesen for ikke-funksjonelle skjøte former kan ikke forklare våre data enten. Til slutt, for å utelukke den potensielle innflytelsen Fra CpG-øyene, beregnet vi frekvensen Av CpG over GpC i hver ekson, og begrenset vår analyse til en delmengde av alternativt spleisede eksoner hvis CpG/GpC-forhold var <0.8 (Iida og Akashi, 2000). Av disse eksonene kunne 20,8% ikke bestå denne testen, tilsvarende prosentandelen for det totale settet av alternativt spleisede eksoner (Tabell 1). Selv om et økt Ka/Ks-forhold i prinsippet kan gjenspeile ulike underliggende mekanismer, som ikke er fokus for dette manuskriptet, indikerer våre kontrollanalyser at en stor del av funksjonelle alternative eksoner i det menneskelige genomet feiler Ka / Ks-ratio testen.

Konstitutive eksoner overstiger alternativt spleiset eksoner i de fleste proteinkodende gener. ESTs) fortsatt er ganske lav, Er Ka / Ks-ratio testen et kraftig verktøy for raffinering av beregningsgenstrukturprognoser. Imidlertid er flertallet av pattedyrsproteinkodende gener alternativt spleiset, og et lite antall alternativt spleisede eksoner kan ha dype funksjonelle og regulatoriske virkninger, som nylig illustrert ved den alternative spleising AV C2A-domenet Til Piccolo (Garcia et al.(2004) og mange andre. Vår analyse antyder at i organismer med omfattende alternativ spleising (f. eks. pattedyr) er Det å foretrekke å kombinere Ka/Ks-ratio-testen med andre beregninger som indikerer sannsynligheten for alternativ spleising. Heldigvis evolusjonær genomikk har også kaste lys over de typiske trekk ved funksjonelle alternativt skjøtes eksoner, som har blitt brukt i spådommer (Philipps et al ., 2004; Sorek et al., 2004b; Yeo et al., 2005). Slik informasjon kan integreres Med Ka / Ks ratio test for en mer nøyaktig vurdering av protein-kodende potensialer av genomiske regioner.

Fig. 1

Ka / Ks ratio test på konstitutive og alternativt skjøtes eksoner med forskjellige størrelser. (A) Konstitutive eksoner og (B) alternativt spleiset eksoner.

Fig. 1

Ka / Ks ratio test på konstitutive og alternativt skjøtes eksoner med forskjellige størrelser. (A) Konstitutive eksoner og (B) alternativt spleiset eksoner.

Tabell 1

Eksoner som består Eller ikke består Ka / Ks-ratio-testen

typer av exons . Totalt # . Gjennomsnittlig lengde (bp). # Mislykkes . # Pass . % Mislykkes . Gjennomsnitt (median) Ka / Ks .
Konstitutive 10 996 136 1077 9919 9.8 0.146 (0.070)
Alternativ 925 122 206 719 22.3 0.199 (0.094)
Alt (Major-form)) 630 121 101 529 16.0 0.162 (0.086)
Alt (Medium-form) 253 129 69 184 27.3 0.235 (0.113)
Alt (Minor-form) 42 81 36 6 85.7 0.649 (0.410)
Ancestral Alt 120 102 59 61 49.2 0.412 (0.182)
Alt (CpG/GpC < 0.8) 793 124 165 628 20.8 0.192 (0.097)
typer av exons . Totalt # . Gjennomsnittlig lengde (bp). # Mislykkes . # Pass . % Mislykkes . Gjennomsnitt (median) Ka / Ks .
Konstitutive 10 996 136 1077 9919 9.8 0.146 (0.070)
Alternativ 925 122 206 719 22.3 0.199 (0.094)
Alt (Major-form)) 630 121 101 529 16.0 0.162 (0.086)
Alt (Medium-form) 253 129 69 184 27.3 0.235 (0.113)
Alt (Mindre-skjema) 42 81 36 6 85.7 0.649 (0.410)
Ancestral Alt 120 102 59 61 49.2 0.412 (0.182)
Alt (CpG/GpC)< 0.8) 793 124 165 628 20.8 0.192 (0.097)
Tabell 1

Eksoner som består Eller ikke består Ka / Ks-ratio-testen

typer av exons . Totalt # . Gjennomsnittlig lengde (bp). # Mislykkes . # Pass . % Mislykkes . Gjennomsnitt (median) Ka / Ks .
Konstitutive 10 996 136 1077 9919 9.8 0.146 (0.070)
Alternativ 925 122 206 719 22.3 0.199 (0.094)
Alt (Major-form)) 630 121 101 529 16.0 0.162 (0.086)
Alt (Medium-form) 253 129 69 184 27.3 0.235 (0.113)
Alt (Minor-form) 42 81 36 6 85.7 0.649 (0.410)
Ancestral Alt 120 102 59 61 49.2 0.412 (0.182)
Alt (CpG/GpC < 0.8) 793 124 165 628 20.8 0.192 (0.097)
typer av exons . Totalt # . Gjennomsnittlig lengde (bp). # Mislykkes . # Pass . % Mislykkes . Gjennomsnitt (median) Ka / Ks .
Konstitutive 10 996 136 1077 9919 9.8 0.146 (0.070)
Alternativ 925 122 206 719 22.3 0.199 (0.094)
Alt (Major-form)) 630 121 101 529 16.0 0.162 (0.086)
Alt (Medium-form) 253 129 69 184 27.3 0.235 (0.113)
Alt (Mindre-skjema) 42 81 36 6 85.7 0.649 (0.410)
Ancestral Alt 120 102 59 61 49.2 0.412 (0.182)
Alt (CpG/GpC)< 0.8) 793 124 165 628 20.8 0.192 (0.097)

Tabell 2

Eksoner støttet av menneskelige mrna som består Eller ikke består Ka / Ks ratio test

typer av exons . Totalt # . # Mislykkes . # Pass . % Mislykkes .
Konstitutive 10 524 1017 9507 9.7
Alternativ 811 158 653 19.5
Alt (Major-form)) 618 99 519 16.0
Alt (Medium-form) 170 39 131 22.9
Alt (Mindre-skjema) 23 20 3 87.0
typer av exons . Totalt # . # Mislykkes . # Pass . % Mislykkes .
Konstitutive 10 524 1017 9507 9.7
Alternativ 811 158 653 19.5
Alt (Major-form)) 618 99 519 16.0
Alt (Medium-form) 170 39 131 22.9
Alt (Mindre-skjema) 23 20 3 87.0
Tabell 2

Eksoner støttet av menneskelige mrna som består Eller ikke består Ka / Ks ratio test

typer av exons . Totalt # . # Mislykkes . # Pass . % Mislykkes .
Konstitutive 10 524 1017 9507 9.7
Alternativ 811 158 653 19.5
Alt (Major-form)) 618 99 519 16.0
Alt (Medium-form) 170 39 131 22.9
Alt (Mindre-skjema) 23 20 3 87.0
typer av exons . Totalt # . # Mislykkes . # Pass . % Mislykkes .
Konstitutive 10 524 1017 9507 9.7
Alternativ 811 158 653 19.5
Alt (Major-form)) 618 99 519 16.0
Alt (Medium-form) 170 39 131 22.9
Alt (Mindre-skjema) 23 20 3 87.0

forfatterne takker Anton Nekrutenko for å ha lest manuskriptet vårt og for de nyttige kommentarene. DETTE arbeidet ble støttet AV NIH Grant U54-RR021813, En Lærer-Scholar award Til C. J. L. Fra Dreyfus Foundation, EN DOE grant DE-FC02-02ER63421. Yx støttes av En Ph. D. dissertation fellowship fra UCLA.

Interessekonflikt: ingen erklært.

Boue, S., et al.

2003

Alternativ spleising og evolusjon.

Bioessays
25
1031

-1034

Filip, L. C. Og Mundy, N. I.

2004

Rask utvikling ved positiv Darwinistisk seleksjon i det ekstracellulære domenet til det rike lymfocyttproteinet CD45 i primater.

Mol. Biol. Evol.
21
1504

-1511

Garcia, J., et al.

2004

en konformasjonsbryter i Piccolo C2A-domenet reguleres av alternativ spleising.

Nat. Struct. Mol. Biol.
11
45

-53

Hurst, L. D. Og Pal, C.

2001

Bevis for rensende utvalg som virker pa stille steder I BRCA1.

Trender Genet.
17
62

-65

Iida, K. Og Akashi, H.

2000

en test av translasjonell seleksjon på ‘stille’ steder i det menneskelige genom: basesammensetningssammenligninger i alternativt spleise gener.

Gen
261
93

-105

Johnson, J. M., et al.

2003

Genom-bred undersøkelse av menneskelig alternativ pre-mRNA spleising med exon junction microarrays.

Vitenskap
302
2141

-2144

Trueblood, M., et al.

2003

Sekvensering og sammenligning av gjærarter for å identifisere gener og regulatoriske elementer.

Natur
423
241

-254

Lareau, L. F., et al.

2004

de utviklende rollene til alternativ spleising.

Curr. Opin. Struct. Biol.
14
273

-282

Lewis, B. P., et al.

2003

Bevis for den utbredte koblingen av alternativ spleising og tull-mediert mRNA forfall hos mennesker.

Proc. Natl Acad. Sci. USA
100
189

-192

Miller, W., et al.

2004

Sammenlignende genomikk.

År. Rev. Genomics Hum. Genet.
5
15

-56

Modrek, B. Og Lee, C.

2002

et genomisk syn på alternativ spleising.

Nat. Genet.
30
13

-19

Modrek, B. Og Lee, C.

2003

Alternativ spleising i menneske -, mus-og rottegenomene er forbundet med en økt grad av eksonskapelse/tap.

Nat. Genet.
34
177

-180

Jenssen, B., et al.

2001

Genom-bred analyse av alternativ spleising ved hjelp av humane uttrykte sekvensdata.

Nukleinsyrer Res.
29
2850

-2859

Neida, A.

2004

Avstemme tallene: ESTs versus proteinkodende gener.

Mol. Biol. Evol.
21
1278

-1282

Jørgensen, A., et al.

2002

K(A)/K (S) ratio test for å vurdere proteinkodingspotensialet i genomiske regioner: en empirisk og simuleringsstudie.

Genom Res.
12
198

-202

Jørgensen, A., et al.

2003

etope: evolusjonær test av spådde eksoner.

Nukleinsyrer Res.
31
3564

-3567

Jørgensen, A., et al.

2003

en evolusjonær tilnærming avslører en høy proteinkodende kapasitet av det menneskelige genom.

Trender Genet.
19
306

-310

Jenssen, N., et al.

2005

Anerkjennelse av ukjent konservert alternativt spleiset eksoner.

PLoS Comp. Biol.
1
e15

Trueblood, J., et al.

2004

Avslørende globale regulatoriske trekk ved pattedyr alternativ spleising ved hjelp av en kvantitativ microarray plattform.

Mol. Celle.
16
929

-941

Philipps, D. L., et al.

2004

en beregningsorientert og eksperimentell tilnærming mot a priori identifisering av alternativt skjøtes eksoner.

RNA
10
1838

-1844

Jenssen, A., et al.

2004

Bevis for en subpopulation av konserverte alternative spleising hendelser under seleksjon press for protein lesing ramme bevaring.

Nukleinsyrer Res.
32
1261

-1269

Sorek, R. Og Ast, G.

2003

Introniske sekvenser flankerer alternativt spleiset eksoner er konservert mellom menneske og mus.

Genom Res.
13
1631

-1637

Sorek, R. Og Safer, H. M.

2003

en roman algoritme for beregningsorientert identifikasjon av forurenset EST biblioteker.

Nukleinsyrer Res.
31
1067

-1074

Sorek, R., et al.

2002

Alu-holdige eksoner er alternativt spleiset.

Genom Res.
12
1060

-1067

Sorek, R., et al.

2004

Hvor utbredt er funksjonell alternativ spleising i det menneskelige genom?

Trender Genet
20
68

-71

Sorek, R., et al.

2004

en ikke-EST-basert metode for exon-hoppe prediksjon.

Genom Res.
14
1617

-1623

Thompson, J. D., et al.

1994

CLUSTAL W: forbedre følsomheten av progressiv multiple sekvens justering gjennom sekvens vekting, posisjonsspesifikke gap straffer og vekt matrix valg.

Nukleinsyrer Res.
22
4673

-4680

Xing, Y. Og Lee, C.

2004

Negativt seleksjonstrykk mot prematur protein avkorting reduseres ved både alternativ spleising og diploidi.

Trender Genet.
20
472

-475

Yang, Z.

1997

PAML: en programpakke for fylogenetisk analyse med maksimal sannsynlighet.

Comput. Appl. Biosci.
13
555

-556

Yeo, G. W., et al.

2005

Identifisering og analyse av alternative spleising hendelser bevart i menneske og mus.

Proc. Natl Acad. Sci. USA
102
2850

-2855

Zhang, Z. Og Gerstein, M.

2004

Storskala analyse av pseudogener i det menneskelige genom.

Curr. Opin. Genet. Dev.
14
328

–335

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.