Molekulare Phylogenie der Kelch-Repeat-Superfamilie zeigt eine Erweiterung von BTB / Kelch-Proteinen in Tieren | BMC Bioinformatics

Identifizierung und Charakterisierung von im menschlichen Genom kodierten Kelch-Repeat-Proteinen
Chromosomale Lokalisierung humaner Kelch-Repeat-Proteine
Domänenarchitektur menschlicher Kelch-Repeat-Proteine
Strukturelle Beziehungen menschlicher BTB / Kelch-Proteine
Kelch-Repeat-Proteine kodiert in wirbellosen Genomen
Kelch-Repeat-Proteine, die in Hefegenomen kodiert sind
Beschränkung von BTB / Kelch-Proteinen auf Metazoen und Pockenviren

Identifizierung und Charakterisierung von im menschlichen Genom kodierten Kelch-Repeat-Proteinen

Zur Identifizierung der im menschlichen Genom kodierten Kelch-Repeat-Proteine wurden BLAST- und PSI-BLAST- Humangenom- und Proteinanalysen wurden mit dem Kelch-Motiv-Konsens (CDD543, Pfam01344, SMART 00612) als Abfragesequenz durchgeführt. Diese Suche identifizierte 57 Kelch-Repeat-Proteine und hypothetische Proteine. Wir stellten fest, dass mehrere der bekannten humanen Kelch-Repeat-Proteine mit dieser Methode nicht identifiziert wurden, wahrscheinlich weil es in jedem Kelch-Motiv relativ wenige Konsensus-Reste gibt, von denen keines über alle Beispiele des Motivs hinweg vollständig invariant ist, und auch wegen Variation in den Längen der Schleifen zwischen den β-Strängen . Daher wurden weitere Suchen mit den Kelch-Wiederholungen aller 28 bekannten Superfamilienmitglieder durchgeführt, wie in den Methoden beschrieben. Diese Durchsuchungen identifizierten 18 zusätzliche Kelch-Repeat-Proteine, die im menschlichen Genom kodiert sind. Querverweise auf alle 75 Einträge gegen GenBank identifizierten 9 der Einträge als Teilsequenzen und / oder doppelte Einträge für dasselbe Protein oder hypothetischen ORF und zwei der Einträge als Nicht-Kelch-haltige Proteine. Wir haben die Suchergebnisse auch mit den Domain-Einträgen für kelch in den Pfam- und SMART-Domain-Datenbanken verglichen. Viele Einträge waren sowohl in SMART als auch in Pfam aufgeführt, jedoch waren einige der von uns identifizierten Proteine nicht in diesen Datenbanken aufgeführt (in Tabelle 1 angegeben), obwohl bei der Suche nach diesen Polypeptiden gegen SMART oder Pfam Kelchmotive eindeutig identifiziert wurden. Darüber hinaus wurde die Anzahl der Kelch-Repeat-Proteine, die H. sapiens in den Artenbaum- oder taxonomischen Verbindungen von Pfam und SMART zugeordnet sind, aufgrund der Einbeziehung unvollständiger ORFs und mehrerer Einträge für dasselbe Polypeptid überschätzt. Wir führten auch zusätzliche Suchen von GenBank mit einzelnen Kelch-Motiven aus den 28 bekannten Kelch-Repeat-Proteinen durch, die deutlich länger waren als der CDD-Kelch-Motif-Konsens, um umfassender nach Proteinen zu suchen, die mehr divergente Wiederholungen enthalten. Aus diesen Mehrfachbewertungen und unter Ausschluss von Teilsequenzen (wie in den Methoden beschrieben) identifizierten wir mindestens 71 im menschlichen Genom kodierte Kelch-Repeat-Proteine (Tabelle 1).

Tabelle 1: Kelch-Repeat-Proteine von H. sapiens

Um die Anzahl der wiederholten Kelchmotive in jedem Protein oder hypothetischen Protein zu bestimmen, wurden BLASTP-Suchen mit jeder Sequenz gegen die Conserved Domain Database (CDD) und Pfam zusammen mit der manuellen Identifizierung von Kelchmotiven durchgeführt. Die Anzahl der identifizierten Kelchmotive variierte von zwei bis sieben. Vier Schaufeln ist die Mindestzahl, die aus Kristallstrukturen von β-Propellerdomänen dokumentiert wurde . Daher erschien es unwahrscheinlich, dass Einträge, die zwei oder drei Kelch-Motive kodierten, vollständigen ORFs entsprachen, und diese wurden von der weiteren Analyse ausgeschlossen (Einträge NP-689579, XP_209285, XP_058629). Auf dieser Grundlage wurden 12,7% (9/71) der Sequenzen mit fünfflügeligen β-Propellern, 84,5% (60/71) mit sechsflügeligen und 2,8% (2/71) mit siebenflügeligen β-Propellern vorhergesagt (Tabelle 1). Nach unserem Wissen wurde bisher nur ein siebenblättriges Kelch-Repeat-Protein identifiziert, die Pilzgalaktoseoxidase .

In der Galactose-Oxidase, dem einzelnen Kelch-Repeat-Protein, für das Kristallstrukturinformationen vorliegen, wird der Propeller durch Bildung einer zusammengesetzten siebten Klinge zirkularisiert, wobei die β-ein- bis β-Drei-Stränge von der C-terminalsten Sequenzwiederholung und der β-Vier-Strang von der Sequenz bereitgestellt werden aminoterminal zur ersten vollständigen Sequenzwiederholung, ein Mechanismus, der als „N-terminaler β-Strangverschluss“ bezeichnet wird (Abb. 1C). Wir untersuchten die menschlichen Kelch-Repeat-Proteine durch Sekundärstrukturvorhersage von β-Blättern und durch manuelle Analyse der Sequenzwiederholungen und fanden heraus, dass für 77,5% (55/71) der Proteine vorhergesagt wurde, dass die β-Propeller-Struktur durch einen C-terminalen β-Strang geschlossen ist. Für fünf Sequenzen konnte keine eindeutige Vorhersage getroffen werden (Tabelle 1).

Chromosomale Lokalisierung humaner Kelch-Repeat-Proteine

Die kodierenden Sequenzen für humane Kelch-Repeat-Proteine sind im gesamten Genom verteilt und befinden sich auf allen Chromosomen außer Chromosom 21 und dem Y-Chromosom (Tabelle 1). Es wurden mehrere Fälle von Genen in physischer Nähe festgestellt, beispielsweise NP_006460 und NP_067646 bei 1q31.3 und NP_569713 und NP_060114 bei 3q27.3 (Tabelle 1). In den meisten Fällen entsprachen diese jedoch nicht den am engsten verwandten Proteinsequenzen, wie dies für kürzlich duplizierte Gene zu erwarten wäre. Eine Ausnahme bildeten NP_055130 und NP-751943, die sich bei 14q21.3 befanden und am engsten miteinander verwandt waren (46% Identität). Insgesamt gab es keine Hinweise auf eine physikalische Gruppierung von Kelch-Protein-kodierenden Sequenzen innerhalb des menschlichen Genoms. Im Gegensatz dazu sind Gene, die für die zahlreichen F-Box / Kelch-Proteine von A. thaliana kodieren, so gruppiert, dass einige der am stärksten verwandten Sequenzen von physikalisch nahen genomischen Orten kodiert werden .

Domänenarchitektur menschlicher Kelch-Repeat-Proteine

Achtundzwanzig Kelch-Repeat-Proteine aus verschiedenen Organismen wurden zuvor in 5 strukturelle Kategorien eingeteilt, je nach der Positionierung der Kelch-Repeats innerhalb der Polypeptidsequenz und dem Vorhandensein anderer konservierter struktureller Domänen . Um die Komplexität von Domänenarchitekturen innerhalb eines einzelnen Organismus zu bewerten, wurde jede menschliche Kelch-Repeat-Proteinsequenz erneut analysiert, indem nach CDD, SMART und Pfam gesucht und dann nach Domänenarchitektur untergruppiert wurde.

Auffallend war, dass 72 % (51/71) der humanen Kelch-Repeat-Proteine eine BTB/POZ-Domäne enthielten. In allen Proteinen bis auf eines war die BTB-Domäne aminoterminal zur Kelch-Domäne (Tabelle 1). Dieses hypothetische Protein, LZTR-1, enthielt zwei Tandem-BTB-Domänen. Vier (5,6%) Kelch-Repeat-Proteine enthielten eine einzige zusätzliche konservierte Domäne. Muskelin war das einzige im menschlichen Genom identifizierte Kelch-Repeat-Protein, das eine Discoidin-Domäne enthielt (CDD 7753, Pfam 00231, SMART 00231, auch bekannt als F5 / F8 Typ C-Domäne) (Prag, Collett und Adams, in Vorbereitung). Die Discoidin-Domäne wirkt als Protein-Protein-Interaktionsdomäne in einer Reihe von extrazellulären und intrazellulären Proteinen und vermittelt in den Gerinnungsfaktoren V und VIII die Phospholipidbindung . Ein weiteres Kelch-Protein, XP_048774, enthielt eine F-Box-Domäne (CDD9197, Pfam 00646). Die F-Box ist eine Domäne von etwa vierzig Resten, die zuerst in Cyclin A identifiziert wurde und mit Skp1 interagiert, um Proteine an der Ubiquitin-Ligase-Assemblierung für die Ubiquitinierung zu verankern und auf den proteosomenvermittelten Abbau abzuzielen . Die Kombination von F-Box- und Kelch-Repeat-Domänen wurde zuvor in A. thaliana beschrieben, wo mindestens 67 F-Box / Kelch-Proteine und hypothetische Proteine im Genom kodiert sind . Einige von ihnen funktionieren bei der lichtabhängigen Regulierung der zirkadianen Uhr, aber die Funktion vieler anderer ist unklar . Unseres Wissens ist dies die erste Erkennung eines F-Box / Kelch-Proteins in einem tierischen Genom. Ein vorhergesagtes Kelch-Repeat-Protein, NP_055608, enthielt eine Leucin-Carboxylmethyltransferase (LCM)-Domäne (CDD9631, Pfam 04072) mit 34% Identität zur LCM-Domäne der Proteinphosphatase 2 Leucin-Carboxylmethyltransferase . Rekombinationsaktivierendes Gen-2 (RAG-2) enthält am Carboxy-Terminus eine PHD-Fingerdomäne (Pfam00628).

Sechs Kelch-Repeat-Proteine (11 %) waren sehr große Multidomain-Proteine (Tabelle 1). Attractin / Dna (das sind Spleißvarianten aus einem einzigen Gen; 27-29) und MEGF8 sind jeweils über 1000 Aminosäuren lang und enthielten eine CUB-Domäne, Kelch-Wiederholungen, eine C-Typ-Lektin-Domäne und EGF-ähnliche Domänen. Attractin und Mahagoni wurden verschiedene Funktionen zugeschrieben, darunter eine Rolle bei T-Zell-Interaktionen (Attractin, die sekretierte Spleißvariante) und Adipositas-Regulation bei Mäusen (Mahagoni, die Transmembran-Spleißvariante) . Wirtszell-Faktor-1 und -2 (HCF-1 und HCF-2) sind ebenfalls große Proteine, die aminoterminale Kelch-Wiederholungen, zwei Fibronektin-Typ-III-Domänen und im Fall von HCF-1 eine Reihe einzigartiger HCF-Wiederholungen enthalten. Diese Proteine fungieren als transkriptionelle Coaktivatoren des Herpes-simplex-Virus für die frühe Genexpression .

Wir identifizierten drei hypothetische Kelch-Repeat-Proteine, die nicht verwandte eindeutige Sequenzen enthielten, die nicht anerkannten Strukturdomänen entsprachen und entweder amino- oder carboxyterminal zu den Kelch-Repeats positioniert waren (Tabelle 1).

Rab9-Effektor p40 und sechs weitere Kelch-Repeat-Proteine waren kurze Polypeptide von 350-442 Aminosäuren Länge, die fast ausschließlich aus Kelch-Repeats bestanden (Tabelle 1). Fünf dieser Proteine oder hypothetischen Proteine, einschließlich p40, enthielten sechs Sequenzwiederholungen und es wird daher vorhergesagt, dass sie sechsflügelige β-Propeller bilden. Zwei hypothetische Proteine, NP_060673 und XP_114323, bestanden aus mutmaßlichen siebenblättrigen β-Propellern. Zusammen bilden diese strukturellen Unterschiede die Grundlage für die hier vorgestellte neue Kategorisierung humaner Kelch-Repeat-Proteine (Tabelle 1).

Strukturelle Beziehungen menschlicher BTB / Kelch-Proteine

Die unerwartet große Anzahl von BTB / Kelch-Proteinen, die im menschlichen Genom kodiert sind, veranlasste uns, diese Gruppe genauer zu untersuchen, um strukturelle Untergruppen zu identifizieren, die auch funktionelle Teilmengen darstellen könnten. Die 38 Sequenzen in voller Länge, die einzelne BTB-Domänen und vorhergesagte sechsflügelige β-Propeller enthielten, wurden gemäß der Sequenzähnlichkeit in CLUSTALW ausgerichtet und als Nachbarschaftsbäume betrachtet. Die Ausrichtung der Sequenzen in voller Länge ergab drei ungefähr gleich große Untergruppen, die wir als Untergruppen 1 bis 3 bezeichneten (Abb. 2A). Wenn die gleiche Analyse mit den Kelchdomänen allein durchgeführt wurde, war die gleiche Gruppierung für die Untergruppe 1 und einen wesentlichen Anteil der Untergruppe 2, die als Untergruppe 2A bezeichnet wird, offensichtlich (Fig. 2B). Bei einer Ausrichtung nur der BTB-Domänen wurden die Untergruppen 1 und 2 für die Mehrzahl der Sequenzen beibehalten (Fig. 2C). Unbewurzelte Bäume, die durch eine separate Methode zur Ausrichtung basierend auf der maximalen Sparsamkeitsanalyse von Sequenzen, PROTPARS, hergestellt wurden, unterstützten die Untergruppe 3 nicht, zeigten jedoch konsistent die Beziehung der Sequenzen in den Untergruppen 1 und 2A (Daten nicht gezeigt). Wir konzentrierten uns auf diese robust verwandten Kelch-Repeat-Sequenzen in den Untergruppen 1 und 2A, für eine genauere Analyse der Kelch-Repeat-Domänen.

CLUSTALW Multiple Sequenzausrichtung der Kelch-Repeat-Domänen aus jeder der Untergruppen 1 und 2A zeigten Unterscheidungsmerkmale in Bezug auf die Wiederholungsorganisation. In beiden Untergruppen (Abb. 3 und Fig. 4), die Intrablade-Schleife zwischen β-Strängen 2 und 3 (die 2-3-Schleife, Fig. 5A) und die Interblade 4-1-Schleife waren wichtige Variationsquellen innerhalb der Wiederholungen in Bezug auf ihre Länge und Primärstruktur. Im Zusammenhang mit einer intakten β-Propellerdomäne ragen die 1-2- und 3-4-Schleifen über eine Fläche der β-Blätter und die 2-3-Schleife über die gegenüberliegende Fläche hinaus (Abb. 5A). Die 4-1-Schlaufe liegt entweder auf der gleichen Fläche wie die 2-3-Schlaufe oder kann näher am β-Blattkern des Propellers positioniert werden (Abb. 5). In der Untergruppe 1 wurden die längsten 2-3 Schleifen in den Wiederholungen 1, 5 und 6 gefunden, mit kürzeren Schleifen in den Wiederholungen 2, 3 und 4. Die längste 4-1-Schleife war die zwischen den Wiederholungen 5 und 6 (Abb. 3). Im Zusammenhang mit einem β-Propeller deutet dies darauf hin, dass die durch die Wiederholungen 5, 6 und 1 gebildete Seite des Propellers besonders an Proteinwechselwirkungen beteiligt sein kann (siehe Fig. 1C). In der Untergruppe 2A waren die längsten 2-3 Schleifen die in den Wiederholungen 1 und 2, die Wiederholungen 4 und 5 hatten 2-3 Zwischenschleifen und die Wiederholungen 3 und 6 enthielten die kürzesten 2-3 Schleifen. Die längsten 4-1 Schleifen waren die zwischen den Wiederholungen 1 und 2 und den Wiederholungen 3 und 4 (Abb. 4). Dies deutet darauf hin, dass es eine unterschiedliche Organisation von Bindungsstellen in β-Propellern der Untergruppe 2A gibt, mit vielleicht zwei Bindungsflächen, die durch Wiederholungen 1 und 2 und Wiederholungen 4 und 5 gebildet werden. Auf der Ebene der einzelnen Sequenzen gab es auch spezifische Beispiele für Abweichungen von der Standardwiederholungsorganisation, die für einzelne Proteine von funktioneller Bedeutung sein könnten. Zum Beispiel hat NP_695002 in der Untergruppe 2A eine ungewöhnlich lange und hochgeladene 3-4-Schleife in Wiederholung 1 und XP_ 040383 hat eine lange 3-4-Schleife in Wiederholung 4 (Abb. 4).

Wir fanden auch heraus, dass die Konsensussequenzen für die Falte zwischen den beiden Untergruppen unterscheidbar waren. Die 50 % -Identitäts-Konsensussequenz aus jeder Untergruppe wurde gegen die Kelch-Repeat-Einheit neu ausgerichtet, um mittlere 50 % -Identitäts-Konsensussequenzen für Untergruppe 1 und Untergruppe 2A abzuleiten. 5). Die Konsensusmotive umfassten sowohl Aminosäuren von Bedeutung für die Falte (innerhalb der β-Stränge) als auch bestimmte Aminosäuren innerhalb von Schleifen, von denen vorhergesagt wurde, dass sie zu Bindungsinteraktionen beitragen. Bemerkenswert ist, dass die durchschnittliche Länge des Motivs in der Untergruppe 1 kürzer war als in der Untergruppe 2A. Der Konsens der Untergruppe 2A wird voraussichtlich eine längere 2-3-Schleife enthalten. Die Konsensusmotive unterschieden sich in der Positionierung hochkonservierter geladener Reste innerhalb der Schleifenregionen (Abb. 5). Die Konservierung dieser geladenen Reste war in der Untergruppe 1 am ausgeprägtesten, wo diese Positionen im Motiv bis zum 70% igen Identitätsschwellenwertniveau konserviert wurden (Daten nicht gezeigt). Diese Unterschiede in den Schleifeneigenschaften deuten auch auf unterschiedliche Modalitäten der Protein-Protein-Wechselwirkungen für die β-Propeller der Untergruppen 1 und 2A hin. In Bezug auf die zuvor charakterisierten Proteinbindungseigenschaften beobachteten wir, dass die BTB / Kelch-Proteine, die an Aktin binden, zwischen den Untergruppen 1 und 3 aufgeteilt wurden; daher hat diese Funktion keine einfache Beziehung zur Primärstruktur (Abb. 2A).

Kelch-Repeat-Proteine kodiert in wirbellosen Genomen

Wir wollten die evolutionäre Entwicklung von Kelch-Repeat-Proteinen zwischen Menschen und modernen Wirbellosen vergleichen und wiederholten daher die Analyse von Kelch-Repeat-Proteinen und ihren strukturellen Untergruppen, die in den Genomen von D. melanogaster, A. gambiae und C. elegans . Wir identifizierten 18 Kelch-Repeat-Proteine, die in den Genomen von Drosophila und Anopheles kodiert sind (Tabelle 2). Siebzehn davon waren Orthologe, die zwischen den beiden Arten konserviert wurden (die durchschnittliche Identität zwischen orthologen Genen von D. melanogaster und A. gambiae beträgt 56%), und eine war für jede Art einzigartig. So wurde in A. gambiae ein Actinfilin-Homolog, jedoch nicht in D. melanogaster identifiziert und das D. melanogaster-Genom enthielt ein Homolog von NP_116164, das in A. gambiae nicht vorhanden war (Tabelle 2). Bisher wurden nur drei Kelch-Repeat-Proteine in D charakterisiert. melanogaster, nämlich Kelch , Muskelin und Drosophila Wirtszellenfaktor . Zwei andere, Diablo und Scruin-like an der Mittellinie (SLIM-1), wurden als Kelch-Repeat-Proteine erkannt .

Tabelle 2: Kelch-Repeat-Proteine von D. melanogaster und A. gambiae

Innerhalb der Gruppe von 19 Proteinen und hypothetischen Proteinen enthielten 95 % sechs Kelch-Wiederholungen. Nur ein Protein mit fünf Kelch-Repeats wurde entweder in D. melanogaster oder A. gambiae identifiziert, was einem Orthologen des humanen F-box/Kelch-Proteins XP_048774 entsprach (Tabelle 2). 56 % der Kelch-Repeat-Proteine von D. melanogaster und A. gambiae waren BTB/Kelch-Proteine. Sowohl D. melanogaster als auch A. gambiae enthielten ein zu Muskelin orthologes Discoidin / Kelch-Protein, ein F-Box / Kelch-Protein, drei Kelch- und Multidomain-Proteine, ein Kelch- und Unique-Protein sowie zwei Propeller-Only-Proteine. Somit wiesen alle identifizierten 19 Kelch-Repeat-Proteine homologe im menschlichen Genom auf und die BTB / Kelch-Domänenarchitektur war am weitesten verbreitet (Tabelle 2).

Wir identifizierten 16 Kelch-Repeat-Proteine, die innerhalb des C. elegans-Genoms kodiert sind (Tabelle 3). Von diesen Proteinen wurden nur kel-1, spe-26 und CeHCF funktionell charakterisiert. Kel-1 ist ein intrazelluläres Protein, das an der Regulierung des Fressverhaltens während der Larvenentwicklung beteiligt ist . Spe-26 trägt zur zellulären Organisation von Spermatozyten bei und Mutationen sind mit Sterilität verbunden . CeHCF könnte an der Regulation der Zellproliferation beteiligt sein . 43.7% (7/16) der Proteine hatten die BTB / Kelch-Domänenarchitektur, zwei waren Homologe von HCF und Attractin mit ähnlichen Mehrdomänenarchitekturen, zwei enthielten einzigartige Sequenzen außerhalb der Kelch-Wiederholungen und zwei waren nur Propellerproteine, von denen beide vorhergesagt wurden, sechsflügelige β-Propeller zu bilden. Ein einzelnes F-Box / Kelch-Protein wurde identifiziert, Es wurde jedoch kein Muskelin-ähnliches Protein gefunden (Tabelle 3), . Stattdessen wurden zwei hypothetische Proteine mit unterschiedlichen Domänenarchitekturen identifiziert : NP_506605, das ebenfalls eine Cyclin-carboxyterminale Domäne enthielt (CDD 7965, Pfam 02984, SMART 00385) und NP_506602, das eine Ringdomäne enthielt (CDD 8941, Pfam 00097, SMART 00184). Die Cyclin-carboxyterminale Domäne bildet eine α-helikale Falte, die eine Proteininteraktionsstelle darstellen kann . Die Ringdomäne ist eine Zinkfingerfalte, die Protein-Protein-Wechselwirkungen vermittelt .

Tabelle 3: Kelch-Repeat-Proteine von C. elegans

Kelch-Repeat-Proteine, die in Hefegenomen kodiert sind

Mehrere Kelch-Repeat-Proteine wurden funktionell in Knospungs- und Spalthefe untersucht, aber keines davon entspricht BTB / Kelch-Proteinen . Wir untersuchten, ob sich die Vorherrschaft der BTB / Kelch-Domänenarchitektur, die wir bei mehrzelligen Tieren identifiziert hatten, auf Hefe erstreckte, indem wir das Komplement von Kelch-Repeat-Proteinen analysierten, die in den Genomen von S. pombe und S. cerevisiae kodiert waren . Wir fanden heraus, dass jedes Genom eine kleine Anzahl von Kelch-Repeat-Proteinen kodierte (fünf in S. pombe, acht in S. cerevisiae), von denen keines einem BTB/Kelch-Protein entsprach (Tabelle 4). Proteine und hypothetische Proteine, bestehend aus einem aminoterminalen Kelch β-Propeller und einer verlängerten Coiled-Coil-Region und einem Protein, das einer mutmaßlichen Leucin-Carboxylmethyltransferase entspricht, waren S. pombe und S. cerevisiae gemeinsam. Die anderen kodierten Kelch-Repeat-Proteine waren nicht homolog (Tabelle 4). Muskelin-ähnliches 1-Protein und Ral-2p wurden in S. pombe, aber nicht in S. cerevisiae identifiziert. Zwei Proteine mit entfernt verwandten Kelch-Wiederholungen, Gpb1/Krh1 und Gpb2/Krh2, wurden funktionell als G-Protein-gekoppelte rezeptor-bindende Proteine in S. cerevisiae charakterisiert . Homologe Proteine wurden in S. pombe im Rahmen unserer Studie nicht identifiziert. Somit wurde die BTB / Kelch-Domänenarchitektur in diesen Hefen nicht identifiziert.

Tabelle 4: Kelch-Repeat-Proteine von S. cerevisiae und S. pombe

Beschränkung von BTB / Kelch-Proteinen auf Metazoen und Pockenviren

Da die BTB / Kelch-Domänenarchitektur bei Tieren weit verbreitet zu sein schien, in Hefe jedoch nicht identifiziert wurde, wollten wir prüfen, ob andere Organismen Kelch-Repeat-Proteine mit dieser Domänenarchitektur enthalten könnten. Eine Reihe von BTB / Kelch-Proteinen wurde als hypothetische offene Leserahmen (ORFs) in der Pockenvirus-Familie von Tierviren berichtet . Die CDART-Datenbank (Conserved Domain Architecture Retrieval Tool) am NCBI listet 333 Einträge für BTB / Kelch-Proteine auf, die alle von Wirbeltieren, Insekten, C. elegans oder Pockenviren stammen. Bisher wurde die BTB-Domäne nur in Eukaryoten identifiziert (Pfam 00651 species tree). Neben der Überprüfung der SMART- und Pfam-Artenbäume für die Kategorisierung der BTB / Kelch-Domänenarchitektur führten wir unsere eigenen BLASTP- und TBLASTX-Suchen der A durch. thaliana Genome Database mit dem CDD Kelch Motif Consensus (dieses Suchwerkzeug identifizierte 44 BTB / Kelch-Proteine aus dem menschlichen Genom und ist daher sehr effektiv bei der Aufdeckung dieser Proteine) und identifizierte 72 Proteinsequenzen, von denen die meisten F-Box / Kelch-Proteine waren, einige davon waren Serin-Threonin-Phosphatase / Kelch-Proteine , und keines davon waren BTB / Kelch-Proteine. Suchen mit den BTB-Domänen mehrerer menschlicher oder wirbelloser Kelch-Repeat-Proteine identifizierten auch keine BTB / Kelch-Proteine in A. thaliana. BLAST genomes Durchsuchungen der Datenbanken mit vollständigen oder teilweise sequenzierten eukaryotischen Tier- und Pflanzengenomen am NCBI (Entrez / genome_tree, ), die die vollständig sequenzierten Genome des Apicomplexium Plasmodium falciparum , des Microsporidium Encephalitozoon cuniculi , der Pflanze Oryza sativa (Reis; ) und des Pilzes Neurospora crassa enthielten, identifizierten viele vorhergesagte Kelch-Repeat-haltige Proteine, aber keine ORFs, die die BTB / Kelch-Domänenarchitektur aufwiesen. Ergebnisse für ausgewählte Domänenarchitekturen in fünf eukaryotischen Organismen sind in Abb. 6. Wir haben jedoch bei Apicomplexia-Spezies zwei Proteine mit einer Tetra / Kelch-Domänenarchitektur (NP_705330 und EAA22466) festgestellt. Die K-Tetra-Domäne (Pfam 02214) ist ein entfernter struktureller Verwandter der BTB / POZ-Domäne . Insgesamt liefern diese Ergebnisse einen signifikanten Hinweis darauf, dass Protein-kodierende Sequenzen für die BTB / Kelch-Domänenarchitektur während der Evolution von mehrzelligen Tieren im Vergleich zu Apikomplexien, Pilzen, Pflanzen und anderen Eukaryoten erweitert wurden.

Molekulare Phylogenie der Kelch-Repeat-Superfamilie zeigt eine Erweiterung von BTB /Kelch-Proteinen in Tieren