Molecular phylogeny of the kelch-repeat superfamily reveals an expansion of BTB/kelch proteins in animals

Identification and characterisation of kelch-repeat proteins encoded in the human genome

to identify the kelch-repeat proteins encoded in the human genome, BLAST and psi-BLAST searches z ludzkiej genomu przewidywane białka bazy danych przeprowadzono z Kelch-motif konsensusu (CDD543, pfam01344, Smart 00612) jako sekwencji zapytań. W wyniku tych poszukiwań zidentyfikowano 57 białek powtarzających się kelch i białka hipotetyczne. Zauważyliśmy, że kilka znanych ludzkich białek powtórzeń kelcha nie zostało zidentyfikowanych tą metodą, prawdopodobnie dlatego, że w każdym z motywów kelcha jest stosunkowo niewiele reszt konsensusowych, z których żadna nie jest całkowicie niezmienna we wszystkich przykładach motywu, a także ze względu na różnice w długości pętli między łańcuchami β . W związku z tym przeprowadzono dalsze poszukiwania z powtórzeniami kelcha wszystkich 28 znanych członków nadrodziny, jak opisano w metodach. Badania te zidentyfikowały 18 dodatkowych białek kelch-repeat zakodowanych w ludzkim genomie. Krzyżując wszystkie 75 wpisów przeciwko GenBank zidentyfikowano 9 wpisów jako częściowe sekwencje i / lub zduplikowane wpisy dla tego samego białka lub hipotetycznego ORF, a dwa z wpisów jako białka niezawierające kelcha. Porównaliśmy również wyniki wyszukiwania z wpisami domeny dla kelch w bazach Pfam i SMART domain. Wiele wpisów było wymienionych zarówno w SMART, jak i Pfam, jednak wiele zidentyfikowanych przez nas białek nie było wymienionych w tych bazach danych (wskazanych w tabeli 1), mimo że podczas wyszukiwania tych polipeptydów przeciwko SMART lub Pfam motywy kelcha zostały wyraźnie zidentyfikowane. Ponadto liczba białek powtórzeń kelcha przypisanych do H. sapiens w drzewie gatunku lub wiązaniach łamania taksonów Pfam i SMART została zawyżona z powodu włączenia niekompletnych ORFs i wielokrotnych wpisów dla tego samego polipeptydu. Przeprowadziliśmy również dodatkowe poszukiwania Genbanku z pojedynczymi motywami kelcha z 28 znanych białek powtórzeń kelcha, które były wyraźnie dłuższe niż konsensus CDD z motywem kelcha, w celu szerszego poszukiwania białek zawierających bardziej rozbieżne powtórzenia. Na podstawie tych wielokrotnych ocen i z wyłączeniem sekwencji częściowych (opisanych w metodach) zidentyfikowaliśmy co najmniej 71 białek kodowanych w genomie ludzkim (Tabela 1).

Tabela 1 Kelch-powtarzające się białka H. sapiens

aby określić liczbę powtarzających się motywów kelcha w każdym białku lub hipotetycznym białku, przeprowadzono przeszukiwania BLASTP dla każdej sekwencji w stosunku do bazy danych o zachowanej domenie (CDD) i Pfam, wraz z ręczną identyfikacją motywów kelcha. Liczba zidentyfikowanych motywów kelcha wahała się od dwóch do siedmiu. Cztery łopatki to liczba minimalna, która została udokumentowana na podstawie struktur krystalicznych domen β-śmigłowych . W związku z tym wydaje się mało prawdopodobne, aby wpisy kodujące dwa lub trzy motywy kelcha odpowiadały kompletnym ORFS i zostały one wyłączone z dalszej analizy (wpisy NP-689579, XP_209285, XP_058629). Na tej podstawie przewidywano, że 12,7 % (9/71) sekwencji zawierało pięcioramienne śmigła β, 84,5 % (60/71) sześcioramienne, a 2,8 % (2/71) siedmioramienne śmigła β (Tabela 1). Według naszej wiedzy, wcześniej zidentyfikowano tylko jedno siedmioramienne białko powtórzeń kelcha, grzybową oksydazę galaktozową .

w oksydazie galaktozowej, białku z pojedynczym powtórzeniem kelcha, dla którego istnieje informacja o strukturze krystalicznej, śmigło jest krążone przez utworzenie złożonego siódmego ostrza, z łańcuchami β-jeden do β-trzech dostarczonymi z najbardziej C-końcowego powtórzenia sekwencji i łańcuchem β-cztery dostarczonymi przez sekwencję amino-końcowego do pierwszego pełnego powtórzenia sekwencji, mechanizm zwany „zamknięciem N-końcowego łańcucha β” (Fig. 1C). Zbadaliśmy ludzkie białka powtórzeń kelcha poprzez przewidywanie struktury wtórnej arkuszy β i ręczną analizę powtórzeń sekwencji i odkryliśmy, że dla 77,5 % (55/71) białek przewidywano, że struktura śmigła β będzie zamknięta przez c-końcową nitkę β. Dla pięciu sekwencji nie można było jednoznacznie przewidzieć (Tabela 1).

lokalizacja chromosomowa ludzkich białek Kelch-repeat

sekwencje kodujące dla ludzkich białek Kelch-repeat są rozproszone w całym genomie i znajdują się na wszystkich chromosomach z wyjątkiem chromosomu 21 i chromosomu Y (Tabela 1). Zauważono kilka przypadków genów w fizycznej bliskości, na przykład NP_006460 i NP_067646 w 1q31.3 oraz NP_569713 i NP_060114 w 3q27.3 (Tabela 1). Jednak w większości przypadków nie odpowiadały one najbliżej spokrewnionym sekwencjom białek, jak można by się spodziewać w przypadku niedawno zduplikowanych genów. Wyjątkiem były NP_055130 i NP-751943, które znajdowały się na 14q21.3 i które były ze sobą najbliżej spokrewnione (46% tożsamości). Ogólnie rzecz biorąc, nie było dowodów na fizyczne grupowanie sekwencji kodujących białko kelcha w ludzkim genomie. W przeciwieństwie do tego, geny kodujące liczne białka F-box/kelch A. thaliana są zgrupowane w taki sposób, że niektóre z najbardziej powiązanych sekwencji są kodowane z fizycznie bliskich lokalizacji genomowych .

Architektura domeny ludzkich białek powtórzeń Kelcha

dwadzieścia osiem białek powtórzeń kelcha z różnych organizmów zostało wcześniej zgrupowanych w 5 kategoriach strukturalnych zgodnie z pozycjonowaniem powtórzeń kelcha w sekwencji polipeptydowej i obecnością innych konserwowanych domen strukturalnych . Aby ocenić złożoność architektur domen w obrębie jednego organizmu, każdą sekwencję ludzkiego białka kelch-repeat poddano ponownej analizie przez wyszukiwanie w CDD, SMART i Pfam, a następnie podgrupowano zgodnie z architekturą domenową.

uderzająco, 72% (51/71) ludzkich białek powtórzeń kelcha zawierało domenę BTB/POZ. We wszystkich białkach oprócz jednego, domena BTB była aminoelastyczna do domeny kelcha (Tabela 1). To hipotetyczne białko, LZTR-1, zawierało dwie tandemowe domeny BTB. Cztery (5,6%) białka powtórzeń kelcha zawierały jedną dodatkową zachowaną domenę. Muskelin był jedynym białkiem powtórzeń kelcha zidentyfikowanym w ludzkim genomie zawierającym domenę dyskoidynową (CDD 7753, Pfam 00231, SMART 00231, znaną również jako domena F5 / F8 typu C) (Prag, Collett i Adams, w przygotowaniu). Domena dyskoidynowa działa jako domena interakcji białko-białko w wielu białkach zewnątrzkomórkowych i wewnątrzkomórkowych, a w czynnikach krzepnięcia V i VIII pośredniczy w wiązaniu fosfolipidów . Inne białko kelcha, xp_048774, zawierało domenę F-box (CDD9197, Pfam 00646). F-box jest domeną około czterdziestu reszt, po raz pierwszy zidentyfikowanych w cyklinie A, które oddziałują z Skp1, aby zakotwiczyć białka w zespole ubikwityny-ligazy w celu ubikwitynacji i ukierunkowania na degradację zależną od proteosomów . Połączenie domen F-box i Kelch-repeat zostało wcześniej opisane w A. thaliana, gdzie co najmniej 67 białek F-box/kelch i hipotetycznych białek jest kodowanych w genomie . Kilka z nich działa w zależnej od światła regulacji zegara okołodobowego, ale funkcja wielu innych jest niejasna . Według naszej wiedzy jest to pierwsze rozpoznanie białka F-box/kelch w genomie zwierzęcym. Jedno przewidywane białko powtórzeń kelcha, NP_055608, zawierało domenę leucyno-karboksylo-metylotansferazy (LCM) (CDD9631, Pfam 04072) o 34% identyczności z domeną LCM fosfatazy białkowej 2-leucyno-karboksylo-metylotransferazy. Gen aktywujący rekombinację-2 (RAG-2) zawiera domenę palca homeodomeny roślinnej (Pfam00628) na końcu karboksylowym .

sześć białek powtórzeń kelcha (11 %) było bardzo dużymi białkami wielodomenowymi (Tabela 1). Atraktina / mahoń (które są wariantami splicingu z pojedynczego genu; 27-29) i MEGF8 mają długość ponad 1000 aminokwasów i zawierają domenę CUB, powtórzenia kelcha, domenę lektynową Typu C i domeny podobne do EGF. Różnym funkcjom przypisywano atraktynę i mahoń, które obejmują rolę w interakcjach komórek T (atraktina, wydzielany wariant splotu) i regulację otyłości u myszy (mahoń, wariant splotu przezbłonowego) . Czynnik komórek gospodarza-1 i -2 (HCF-1 i HCF-2) są również dużymi białkami, które zawierają aminokwasowe powtórzenia kelcha, dwie domeny fibronektyny typu III oraz, w przypadku HCF-1, serię unikalnych powtórzeń HCF. Białka te funkcjonują jako transkrypcyjne koaktywatory wirusa opryszczki natychmiastowej wczesnej ekspresji genów .

zidentyfikowaliśmy trzy hipotetyczne białka powtórzeń kelcha jako zawierające niespokrewnione unikalne sekwencje, które nie odpowiadały rozpoznanym domenom strukturalnym, umieszczonym albo aminowo -, albo karboksy-końcowym do powtórzeń kelcha (Tabela 1).

efektor Rab9 p40 i sześć innych białek powtórzeń kelcha były krótkimi polipeptydami o długości 350-442 aminokwasów, które składały się prawie w całości z powtórzeń kelcha(Tabela 1). Pięć z tych białek lub hipotetycznych białek, w tym p40, zawierało sześć powtórzeń sekwencji, a zatem przewiduje się, że utworzą sześcioramienne śmigła β. Dwa hipotetyczne białka, NP_060673 i XP_114323, składały się z domniemanych siedmioramiennych śmigieł β. Razem te strukturalne rozróżnienia stanowią podstawę nowej kategoryzacji ludzkich białek kelch-repeat, którą przedstawiono tutaj (Tabela 1).

zależności strukturalne ludzkich białek BTB/kelcha

nieoczekiwanie duża liczba białek BTB/kelcha zakodowanych w ludzkim genomie skłoniła nas do bardziej szczegółowego zbadania tej grupy, w celu identyfikacji podgrup strukturalnych, które mogą również reprezentować podgrupy funkcjonalne. 38 sekwencji pełnej długości, które zawierały pojedyncze domeny BTB i przewidywane sześcioramienne śmigła β, zostało wyrównanych zgodnie z podobieństwem sekwencji w CLUSTALW i postrzeganych jako drzewa łączące sąsiedztwo. Wyrównanie sekwencji pełnej długości ujawniło trzy podgrupy o w przybliżeniu jednakowej wielkości, które nazwaliśmy podgrupami od 1 do 3 (rys. 2A). Gdy tę samą analizę przeprowadzono z domenami kelcha, ta sama grupa była widoczna dla podgrupy 1 i znacznej części podgrupy 2, nazywanej podgrupą 2A (Fig. 2b). W wyrównaniu tylko domen BTB, podgrupy 1 i 2 były utrzymywane dla większości sekwencji (Fig. 2C). Niekorzenione drzewa wytworzone oddzielną metodą wyrównania opartą na analizie maksymalnej parsimonii sekwencji, PROTPARS, nie wspierały podgrupy 3, ale konsekwentnie wykazywały zależność sekwencji w podgrupach 1 i 2A (Dane Nie pokazane). Skupiliśmy się na tych silnie powiązanych sekwencjach powtórzeń kelcha w podgrupach 1 i 2A, aby dokładniej przeanalizować domeny powtórzeń kelcha.

Rysunek 2
figurka2

zależności pomiędzy białkami BTB/kelcha. Sekwencje aminokwasowe 38 pełnowymiarowych ludzkich białek BTB / kelcha, przewidywanych, że zawierają sześcioramienne śmigła β, zostały wyrównane w CLUSTALW i przedstawione są w Drawgramie Phylip dla a) sekwencji pełnej długości; B) tylko domeny powtórzeniowe kelcha; c) tylko domeny BTB, z kodami odcieni dla trzech zidentyfikowanych podgrup, jak wskazano. Gwiazdka w panelu a wskazuje znane białka BTB/kelch wiążące aktynę. Panel B pokazuje solidne grupowanie zbioru sekwencji z podgrupy 2, nazywanej podgrupą 2A.

CLUSTALW multiple sequence alignment of the kelch-repeat domains from each of subgroups 1 and 2A demonstrated distinctive features in terms of repeat organization. W obu podgrupach (rys. 3 i Rys. 4), pętla wewnątrzbladowa między β-pasmami 2 i 3 (pętla 2-3, rys. 5A) i pętla interblade 4-1 były głównymi źródłami różnic w powtórzeniach pod względem ich długości i pierwotnej struktury. W kontekście nienaruszonej domeny śmigła β, 1-2 I 3-4 pętle wystają ponad jedną powierzchnię arkuszy β, a pętla 2-3 wystaje z przeciwnej powierzchni (rys. 5A). Pętla 4-1 leży albo na tej samej powierzchni co pętla 2-3, albo może być umiejscowiona bliżej rdzenia śruby napędowej (rys. 5). W podgrupie 1 najdłuższe 2-3 pętle znaleziono w powtórzeniach 1, 5 i 6, z krótszymi pętlami w łopatkach 2, 3 i 4. Najdłuższe 4-1 pętli były między powtórzeniami 5 i 6 (rys. 3). W kontekście śmigła β sugeruje to, że strona śmigła utworzona przez powtórzenia 5, 6 i 1 może być szczególnie zaangażowana w interakcje z białkami (patrz Rys. 1C). W podgrupie 2A najdłuższe 2-3 pętle to te w powtórzeniach 1 i 2, powtórzenia 4 i 5 miały pośrednie 2-3 pętle, a powtórzenia 3 i 6 zawierały najkrótsze 2-3 pętle. Najdłuższymi 4-1 pętlami były te między powtórzeniami 1 i 2, a powtórzeniami 3 i 4 (ryc. 4). Sugeruje to, że w podgrupie 2A β-śmigieł istnieje inna organizacja miejsc wiązania, z prawdopodobnie dwoma powierzchniami wiązania utworzonymi przez powtórzenia 1 i 2 oraz powtórzenia 4 i 5. Na poziomie poszczególnych sekwencji istniały również konkretne przykłady różnic w stosunku do Standardowej organizacji powtórzeń, które mogły mieć znaczenie funkcjonalne dla poszczególnych białek. Na przykład, NP_695002 w podgrupie 2A ma niezwykle długą i bardzo naładowaną pętlę 3-4 w powtórzeniu 1, A XP_ 040383 ma długą pętlę 3-4 w powtórzeniu 4 (rys. 4).

Rysunek 3
figurka3

wielokrotne wyrównanie sekwencji podgrupy 1 ludzkich białek BTB / kelcha. Domeny powtórzeń kelcha z podgrupy 15 1 białka BTB / kelch zostały wyrównane w CLUSTALW w celu wygenerowania sekwencji konsensusu poziomu 50% tożsamości. Wyrównania są prezentowane dla każdego powtórzenia, przy czym jednostka powtórzeń jest przypisana zgodnie ze strukturą 1GOF. Cztery nici β w każdym powtórzeniu są oznaczone kolorami, jak na Fig. 1a. wyrównania są prezentowane w Boxshade: Czarne cieniowanie oznacza identyczne aminokwasy, szare cieniowanie oznacza podobne aminokwasy, a białe tło oznacza niepowiązane aminokwasy.

Rysunek 4
figurka4

wielokrotne wyrównanie sekwencji podgrupy 2A ludzkich białek BTB / kelcha. Domeny powtórzeń kelcha z podgrupy 10 2A białka BTB / kelcha wyrównano w CLUSTALW, aby wygenerować sekwencję konsensusu poziomu 50% tożsamości. Wyrównania są prezentowane dla każdego powtórzenia, przy czym jednostka powtórzeń jest przypisana zgodnie ze strukturą 1GOF. Cztery nici β w każdym powtórzeniu są oznaczone kolorami, jak na Fig. 1a. wyrównania są przedstawione w Boxshade: Czarne cieniowanie oznacza identyczne aminokwasy, szare cieniowanie oznacza podobne aminokwasy, a białe tło oznacza niepowiązane aminokwasy.

Rysunek 5
figurka5

związki konsensu motywów kelcha z konstrukcją łopatek śmigła. A, Widok Z Boku konstrukcji pojedynczego śmigła z oksydazy galaktozowej (1gof). β-nici są oznaczone kolorami, jak na Fig. 1A oraz podano nazewnictwo pętli wewnątrz-i między-łopatkowych. B, wyrównanie konsensusowych motywów kelcha pochodzących z podgrup BTB / kelch 1 i 2A do struktury ostrza, wykazując różnice w wielkości pętli 2-3 i rozkładzie ładunku. Pozycja każdej nici β jest wskazana.

odkryliśmy również, że sekwencje konsensusu dla fałdu były charakterystyczne dla obu podgrup. Sekwencja konsensusu 50 % tożsamości z każdej podgrupy została zrównana z jednostką powtórzenia kelcha, aby uzyskać średnią sekwencję konsensusu 50% tożsamości dla podgrupy 1 i podgrupy 2A. motywy te zostały odwzorowane na znanej strukturze ostrza oksydazy galaktozowej (Fig. 5). Motywy konsensualne obejmowały zarówno aminokwasy ważne dla fałdu (znajdujące się w pasmach β), jak i pewne aminokwasy w pętlach, które, jak się przewiduje, przyczyniają się do interakcji wiązania. Warto zauważyć, że średnia długość motywu była krótsza w podgrupie 1 niż podgrupie 2A. Przewiduje się, że podgrupa 2A zawiera dłuższą pętlę 2-3. Motywy konsensusu były różne w pozycjonowaniu wysoce konserwowanych naładowanych pozostałości w regionach pętli (Fig. 5). Zachowanie tych naładowanych reszt było najbardziej widoczne w podgrupie 1, gdzie pozycje te zostały zachowane w motywie do poziomu progu tożsamości 70% (dane nie pokazano). Te różnice w charakterystyce pętli sugerują również różne sposoby interakcji białko-białko dla β-śmigieł podgrup 1 i 2A. W odniesieniu do wcześniej scharakteryzowanych właściwości wiązania białek, zaobserwowaliśmy, że białka BTB / kelch, które wiążą się z aktyną, zostały podzielone między podgrupy 1 i 3; dlatego ta funkcja nie ma prostego związku ze strukturą pierwotną (Fig. 2A).

białka powtórzeniowe Kelcha kodowane w genomach bezkręgowców

chcieliśmy porównać ewolucyjny rozwój białek powtórzeniowych kelcha między ludźmi a współczesnymi bezkręgowcami, dlatego powtórzyliśmy analizę białek powtórzeniowych kelcha i ich podgrup strukturalnych kodowanych w genomach D. melanogaster, A. gambiae i C. elegans . Zidentyfikowaliśmy 18 białek kodowanych w genomach Drosophila i Anopheles (Tabela 2). Siedemnaście z nich było ortologami zachowanymi między dwoma gatunkami (średnia tożsamość między ortologicznymi genami D. melanogaster i A. gambiae wynosi 56 %), a jeden był unikalny dla każdego gatunku. Tak więc, Homologu Aktynfiliny zidentyfikowano w A. gambiae, ale nie w D. melanogaster, a Genom D. melanogaster zawierał homologu np_116164, który nie był obecny w A. gambiae (Tabela 2). Wcześniej scharakteryzowano tylko trzy białka Kelch-repeat w D. melanogaster, a mianowicie Kelch, Muskelin i Drosophila czynnik komórkowy gospodarza . Dwa inne, diablo i scruin – podobne do linii środkowej (SLIM-1), zostały uznane za białka Kelch-repeat.

Tabela 2 białka Kelch-repeat D. melanogaster i A. gambiae

w grupie 19 białek i białek hipotetycznych 95% zawierało sześć powtórzeń kelcha. Tylko jedno białko z pięcioma powtórzeniami kelcha zostało zidentyfikowane w D. melanogaster lub A. gambiae, co odpowiadało ortologowi ludzkiego białka F-box/kelch, XP_048774 (Tabela 2). 56 % białek powtórzeniowych kelcha D. melanogaster i A. gambiae stanowiły białka BTB / kelch. Zarówno D. melanogaster, jak i A. gambiae zawierały jedno białko discoidin/kelch ortologiczne do muskeliny, jedno białko F-box/kelch, trzy białka kelch i multidomain, jedno białko kelch i unikalne oraz dwa białka śmigłowe. Tak więc, wszystkie z 19 zidentyfikowanych białek powtórzeń kelcha miały homologi w ludzkim genomie, a architektura domeny BTB / kelch była najbardziej rozpowszechniona (Tabela 2).

zidentyfikowaliśmy 16 powtórzeń kelcha kodowanych w genomie C. elegans(Tabela 3). Spośród tych białek jedynie kel-1, spe-26 i CeHCF zostały funkcjonalnie scharakteryzowane. Kel – 1 jest wewnątrzkomórkowym białkiem biorącym udział w regulacji zachowań żywieniowych podczas rozwoju larw . Spe-26 przyczynia się do komórkowej organizacji spermatocytów, a mutacje związane są z bezpłodnością . CeHCF może być zaangażowany w regulację proliferacji komórek . 43.7% (7/16) białek miało architekturę domeny BTB / kelch, dwa były homologami HCF i atraktinu o podobnej architekturze wielodomenowej, dwa zawierały unikalne sekwencje poza powtórzeniami kelcha, a dwa były białkami napędowymi, z których oba miały tworzyć sześcioramienne śmigła β. Zidentyfikowano pojedyncze białko F-box/kelch, ale nie znaleziono białka podobnego do muskeliny (Tabela 3). Zamiast tego zidentyfikowano dwa hipotetyczne białka o charakterystycznych architekturach domen : NP_506605, który zawierał również domenę cyklinowo-karboksylową (CDD 7965, Pfam 02984, SMART 00385) i NP_506602, która zawierała domenę pierścieniową (CDD 8941, Pfam 00097, SMART 00184). Domena cyklinowo-karboksy-końcowa tworzy fałd α-spiralny, który może stanowić miejsce interakcji białek . Domena pierścieniowa to fałd cynkowo-palcowy, który pośredniczy w interakcjach białko-białko .

Tabela 3 białka Kelch-repeat C. elegans

białka powtórzeniowe Kelcha kodowane w genomach drożdży

kilka białek powtórzeniowych kelcha badano funkcjonalnie w drożdżach pączkujących i rozszczepiających, ale żadne z nich nie odpowiada białkom BTB / kelcha . Zbadaliśmy, czy rozpowszechnienie architektury domeny BTB / kelch, którą zidentyfikowaliśmy u zwierząt wielokomórkowych, rozszerzyło się na drożdże, analizując dopełniacz białek powtórzeniowych kelcha kodowanych w genomach S. pombe i S. cerevisiae . Odkryliśmy, że każdy Genom koduje niewielką liczbę białek kelch-repeat (pięć w S. pombe, osiem w S. pombe). cerevisiae), z których żadna nie odpowiadała białku BTB / kelch (Tabela 4). Białka i hipotetyczne białka składające się z amino-końcowego β-śmigła kelcha i rozszerzonego regionu zwojowego oraz białka odpowiadającego domniemanej metylotransferazie karboksylowej leucyny były wspólne dla S. pombe i S. cerevisiae. Inne kodowane białka powtórzeń kelcha nie były homologiczne(Tabela 4). Białko podobne do muskeliny 1 i Ral-2P zidentyfikowano u S. pombe, ale nie U S. cerevisiae . Dwa białka o odległych powtórzeniach kelcha, Gpb1 / Krh1 i Gpb2 / Krh2, zostały scharakteryzowane funkcjonalnie jako białka wiążące receptory sprzężone z białkiem G W S. cerevisiae . Homologiczne białka nie zostały zidentyfikowane u S. pombe w kontekście naszych badań. Tak więc Architektura domeny BTB / kelch nie została zidentyfikowana w tych drożdżach.

Tabela 4 białka powtórzeniowe Kelcha S. cerevisiae i S. pombe

ograniczenie białek BTB/kelcha do zwierząt metazoańskich i ospwirusów

ponieważ architektura domeny BTB/kelcha była rozpowszechniona u zwierząt, ale nie została zidentyfikowana u drożdży, byliśmy zainteresowani rozważeniem, czy jakiekolwiek inne organizmy mogą zawierać białka powtórzeniowe kelcha z tą architekturą domeny. Wiele białek BTB / kelch zostało zgłoszonych jako hipotetyczne otwarte ramki odczytu (ORFs) w rodzinie wirusów zwierzęcych poxvirus . Baza danych Conserved Domain Architecture Retrieval Tool (CDART) w NCBI wymienia 333 wpisy dla białek BTB/kelch, z których wszystkie pochodzą od kręgowców, owadów, C. elegans lub ospwirusów. Do tej pory domena BTB została zidentyfikowana tylko w eucaryotes (Pfam 00651 species tree). Oprócz przeglądu drzew gatunków SMART i Pfam pod kątem kategoryzacji architektury domen BTB / kelch, przeprowadziliśmy własne poszukiwania BLASTP i TBLASTX A. thaliana genome database with the CDD kelch motif consensus (this search tool identified 44 BTB / kelch proteins from the human genome and whereas is very effective in uncovering these proteins) and identified 72 protein sequences, the most of which were F-box/kelch proteins, some of which were serine-treonine phosphatase/kelch proteins, and no of which were BTB/kelch proteins. Poszukiwania z domenami BTB kilku ludzkich lub bezkręgowych białek Kelch-repeat również nie zidentyfikowały białek BTB / kelch u A. thaliana. BLAST genomes przeszukuje bazy danych kompletnych lub częściowo zsekwencjonowanych eukariotycznych genomów zwierzęcych i roślinnych w NCBI (Entrez/genome_tree,), które zawierały w pełni zsekwencjonowane genomy Apicomplexium Plasmodium falciparum, Microsporidium Encephalitozoon cuniculi, roślina Oryza sativa (rice;) i grzyb Neurospora crassa zidentyfikowali wiele przewidywanych białek zawierających powtórzenia kelcha, ale nie ma ORF, które miały architekturę domeny BTB / kelch. Wyniki dla wybranych architektur domen u pięciu organizmów eukariotycznych przedstawiono na Fig. 6. W apicomplexia species odnotowaliśmy jednak dwa białka o architekturze domeny K Tetra / kelch (NP_705330 i EAA22466). Domena K tetra (Pfam 02214) jest odległym strukturalnym krewnym domeny BTB/POZ . Ogólnie rzecz biorąc, wyniki te stanowią istotną wskazówkę, że sekwencje kodujące białka dla architektury domeny BTB / kelch zostały rozszerzone podczas ewolucji zwierząt wielokomórkowych, w porównaniu z Apikompleksją, grzybami, roślinami i innymi eukariontami.

Rysunek 6
figurka6

występowanie wybranych architektur domen białka kelch-repeat w eukariontach. Wykresy słupkowe reprezentują liczbę powtórzeń kelcha białek o wskazanej architekturze domeny zakodowanych w proteomach H. sapiens (Hs), D. melanogaster (Dm), C. elegans (Ce), S. pombe (Sp) i A. thaliana (At).

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.