La phylogénie moléculaire de la superfamille kelch-repeat révèle une expansion des protéines BTB/kelch chez les animaux

Identification et caractérisation des protéines kelch-repeat codées dans le génome humain

Pour identifier les protéines kelch-repeat codées dans le génome humain, les recherches BLAST et PSI-BLAST du génome humain la base de données sur les protéines prédites du génome humain a été réalisée avec le consensus sur le motif kelch (CDD543, Pfam01344, SMART 00612) comme séquence de requête. Cette recherche a permis d’identifier 57 protéines à répétition kelch et des protéines hypothétiques. Nous avons noté que plusieurs des protéines connues de répétition de kelch chez l’homme n’ont pas été identifiées par cette méthode, probablement parce qu’il y a relativement peu de résidus de consensus dans chaque motif de kelch, dont aucun n’est complètement invariant dans tous les exemples du motif, et aussi en raison de la variation des longueurs des boucles entre les brins β. Par conséquent, d’autres recherches ont été effectuées avec les répétitions de kelch des 28 membres connus de la superfamille, comme décrit dans les Méthodes. Ces recherches ont permis d’identifier 18 protéines supplémentaires à répétition kelch codées dans le génome humain. Le recoupement des 75 entrées par rapport à GenBank a identifié 9 des entrées comme des séquences partielles et / ou des entrées en double pour la même protéine ou ORF hypothétique, et deux des entrées comme des protéines ne contenant pas de kelch. Nous avons également croisé les résultats de la recherche avec les entrées de domaine pour kelch dans les bases de données Pfam et SMART domain. De nombreuses entrées ont été répertoriées dans SMART et Pfam, cependant un certain nombre de protéines que nous avions identifiées n’étaient pas répertoriées dans ces bases de données (indiquées dans le tableau 1), même si lorsque nous avons recherché ces polypeptides contre SMART ou Pfam, les motifs kelch ont été clairement identifiés. De plus, les nombres de protéines de répétition de kelch attribuées à H. sapiens dans les liens d’arbre d’espèces ou de Taxbreak de Pfam et SMART ont été surestimés en raison de l’inclusion d’ORF incomplets et de multiples entrées pour le même polypeptide. Nous avons également effectué des recherches supplémentaires de GenBank avec des motifs de kelch simples parmi les 28 protéines connues à répétition de kelch qui étaient nettement plus longues que le consensus CDD à motif de kelch, afin de rechercher plus largement des protéines contenant des répétitions plus divergentes. A partir de ces évaluations multiples et à l’exclusion des séquences partielles (comme décrit dans les Méthodes), nous avons identifié au moins 71 protéines à répétition kelch codées dans le génome humain (Tableau 1).

Tableau 1 Protéines de répétition Kelch de H. sapiens

Pour déterminer le nombre de motifs de kelch répétés dans chaque protéine ou protéine hypothétique, des recherches BLASTP ont été effectuées avec chaque séquence par rapport à la Base de données de domaines conservés (CDD) et à la Pfam, ainsi qu’une identification manuelle des motifs de kelch. Le nombre de motifs de kelch identifiés variait de deux à sept. Quatre pales est le nombre minimal qui a été documenté à partir des structures cristallines des domaines β-hélice. Ainsi, il est apparu peu probable que les entrées codant deux ou trois motifs kelch correspondent à des ORF complets et celles-ci ont été exclues d’une analyse plus approfondie (entrées NP-689579, XP_209285, XP_058629). Sur cette base, 12,7% (9/71) des séquences ont été prédites pour contenir des hélices β à cinq pales, 84,5% (60/71) pour être à six pales et 2,8% (2/71) pour contenir des hélices β à sept pales (tableau 1). À notre connaissance, une seule protéine de répétition de kelch à sept lames a été identifiée précédemment, la galactose oxydase fongique.

Dans la galactose oxydase, la protéine à répétition kelch unique pour laquelle il existe des informations sur la structure cristalline, l’hélice est circularisée par formation d’une septième pale composite, avec les brins β-un à β-trois fournis à partir de la répétition de séquence la plus C-terminale et les brins β-quatre fournis par la séquence amino-terminale à la première répétition de séquence complète, un mécanisme appelé « Fermeture de brin β N-terminal », (Fig. 1C). Nous avons examiné les protéines à répétition kelch humaines par prédiction de la structure secondaire des feuillets β et par analyse manuelle des répétitions de séquences, et avons constaté que pour 77,5% (55/71) des protéines, la structure de l’hélice β devait être fermée par un brin β C-terminal. Pour cinq séquences, aucune prédiction claire n’a pu être faite (tableau 1).

Localisation chromosomique des protéines à répétition de kelch humaines

Les séquences codantes des protéines à répétition de kelch humaines sont dispersées dans tout le génome, étant situées sur tous les chromosomes à l’exception du chromosome 21 et du chromosome Y (tableau 1). Plusieurs instances de gènes à proximité physique ont été remarquées, par exemple NP_006460 et NP_067646 au 1q31.3 et NP_569713 et NP_060114 au 3q27.3 (Tableau 1). Cependant, dans la majorité des cas, ceux-ci ne correspondaient pas aux séquences protéiques les plus étroitement liées comme on pouvait s’y attendre pour les gènes récemment dupliqués. Une exception était NP_055130 et NP-751943 qui étaient situés au 14q21.3 et qui étaient les plus étroitement liés l’un à l’autre (identité de 46%). Dans l’ensemble, il n’y avait aucune preuve de regroupement physique des séquences codant pour la protéine kelch dans le génome humain. En revanche, les gènes codant pour les nombreuses protéines F-box/kelch d’A. thaliana sont regroupés de telle sorte que certaines des séquences les plus fortement apparentées sont codées à partir d’emplacements génomiques physiquement proches.

Architecture de domaines des protéines à répétition de Kelch humaines

Vingt-huit protéines à répétition de kelch provenant de divers organismes étaient auparavant regroupées en 5 catégories structurelles en fonction du positionnement des répétitions de kelch dans la séquence polypeptidique et de la présence d’autres domaines structurels conservés. Pour évaluer la complexité des architectures de domaine au sein d’un seul organisme, chaque séquence de protéines à répétition kelch humaine a été réanalysée en recherchant CDD, SMART et Pfam, puis en sous-groupes selon l’architecture de domaine.

De façon frappante, 72% (51/71) des protéines à répétition kelch humaines contenaient un domaine BTB/POZ. Dans toutes les protéines sauf une, le domaine BTB était amino-terminal au domaine kelch (tableau 1). Cette protéine hypothétique, LZTR-1, contenait deux domaines BTB en tandem. Quatre protéines à répétition kelch (5,6 %) contenaient un seul domaine conservé supplémentaire. La muskéline était la seule protéine à répétition kelch identifiée dans le génome humain à contenir un domaine discoïdine (CDD 7753, Pfam 00231, SMART 00231, également connu sous le nom de domaine de type C F5/F8) (Prag, Collett et Adams, en préparation). Le domaine de la discoïdine agit comme un domaine d’interaction protéine-protéine dans un certain nombre de protéines extracellulaires et intracellulaires et, dans les facteurs de coagulation V et VIII, médie la liaison aux phospholipides. Une autre protéine kelch, XP_048774, contenait un domaine F-box (CDD9197, Pfam 00646). La F-box est un domaine d’une quarantaine de résidus, identifié pour la première fois dans la cycline A, qui interagit avec Skp1 pour ancrer les protéines à l’assemblage ubiquitine-ligase pour l’ubiquitination et le ciblage à la dégradation médiée par les protéosomes. La combinaison des domaines F-box et kelch-repeat a déjà été décrite chez A. thaliana, où au moins 67 protéines F-box/kelch et protéines hypothétiques sont codées dans le génome. Plusieurs d’entre eux fonctionnent dans la régulation dépendante de la lumière de l’horloge circadienne, mais la fonction de beaucoup d’autres est obscure. À notre connaissance, il s’agit de la première reconnaissance d’une protéine F-box/kelch dans un génome animal. Une protéine à répétition kelch prédite, NP_055608, contenait un domaine leucine carboxyl méthyltansférase (LCM) (CDD9631, Pfam 04072) avec une identité de 34% au domaine LCM de la protéine phosphatase 2 leucine carboxyl méthyltransférase. Le gène activant la recombinaison-2 (RAG-2) contient un domaine de doigt d’homéodomaine de plante (PHD) (Pfam00628) à l’extrémité carboxy.

Six protéines à répétition kelch (11 %) étaient de très grandes protéines multidomaines (tableau 1). Attractine / acajou (qui sont des variantes d’épissure d’un seul gène; 27-29) et MEGF8 sont chacun plus de 1000 acides aminés de long et contenaient un domaine CUB, des répétitions de kelch, un domaine de lectine de type C et des domaines de type EGF. Diverses fonctions ont été attribuées à l’attractine et à l’acajou qui incluent un rôle dans les interactions des cellules T (attractine, la variante d’épissure sécrétée) et la régulation de l’obésité chez la souris (acajou, la variante d’épissure transmembranaire). Les facteurs -1 et -2 des cellules hôtes (HCF-1 et HCF-2) sont également de grandes protéines qui contiennent des répétitions de kelch amino-terminales, deux domaines de fibronectine de type III et, dans le cas de HCF-1, une série de répétitions uniques de HCF. Ces protéines fonctionnent comme des coactivateurs transcriptionnels de l’expression génique précoce immédiate du virus de l’herpès simplex.

Nous avons identifié trois protéines hypothétiques de répétition de kelch comme contenant des séquences uniques non liées qui ne correspondaient pas à des domaines structuraux reconnus, positionnées soit en amino- soit en carboxy-terminal aux répétitions de kelch (tableau 1).

L’effecteur Rab9 p40 et six autres protéines à répétition de kelch étaient des polypeptides courts, de 350 à 442 acides aminés de longueur, qui étaient presque entièrement constitués de répétitions de kelch (tableau 1). Cinq de ces protéines ou protéines hypothétiques, dont p40, contiennent six répétitions de séquences et sont donc prévues pour former des hélices β à six pales. Deux protéines hypothétiques, NP_060673 et XP_114323, étaient constituées d’hélices β à sept pales. Ensemble, ces distinctions structurelles constituent la base de la nouvelle catégorisation des protéines à répétition kelch humaines présentée ici (tableau 1).

Relations structurelles des protéines BTB/kelch humaines

Le nombre étonnamment élevé de protéines BTB /kelch codées dans le génome humain nous a incités à étudier ce groupe plus en détail, dans le but d’identifier des sous-groupes structurels qui pourraient également représenter des sous-ensembles fonctionnels. Les 38 séquences complètes qui contenaient des domaines BTB simples et prédisaient des hélices β à six pales ont été alignées en fonction de la similitude de séquence dans CLUSTALW et considérées comme des arbres de voisinage. L’alignement des séquences complètes a révélé trois sous-groupes de taille approximativement égale, que nous avons appelés sous-groupes 1 à 3 (Fig. 2 BIS). Lorsque la même analyse a été effectuée avec les domaines de kelch seuls, le même regroupement était apparent pour le sous-groupe 1 et une proportion importante du sous-groupe 2, appelé sous-groupe 2A (Fig. 2B). Dans un alignement des domaines BTB uniquement, les sous-groupes 1 et 2 ont été maintenus pour la majorité des séquences (Fig. 2C). Les arbres non enracinés produits par une méthode distincte d’alignement basée sur une analyse de parcimonie maximale des séquences, PROTPARS, ne soutenaient pas le sous-groupe 3, mais démontraient systématiquement la relation entre les séquences des sous-groupes 1 et 2A (données non présentées). Nous nous sommes concentrés sur ces séquences de répétition de kelch fortement liées dans les sous-groupes 1 et 2A, pour une analyse plus approfondie des domaines de répétition de kelch.

Figure 2
 figure2

Relations entre les protéines BTB/kelch humaines. Les séquences d’acides aminés des 38 protéines BTB/kelch humaines de pleine longueur prévues pour contenir des hélices β à six pales ont été alignées dans CLUSTALW et sont présentées en Drawgram Phylip pour A) des séquences de pleine longueur; B) des domaines de répétition kelch uniquement; C) des domaines BTB uniquement, avec des codes de nuance pour les trois sous-groupes identifiés comme indiqué. L’astérisque du panneau A indique des protéines BTB/kelch se liant à l’actine connues. Le panneau B montre le regroupement robuste d’un ensemble de séquences du sous-groupe 2, appelé sous-groupe 2A.

L’alignement de séquences multiples CLUSTALW des domaines de répétition de kelch de chacun des sous-groupes 1 et 2A a démontré des caractéristiques distinctives en termes d’organisation de répétition. Dans les deux sous-groupes (Fig. 3 et Fig. 4), la boucle intrablade entre les brins β 2 et 3 (la boucle 2-3, Fig. 5A) et la boucle interblade 4-1 étaient des sources majeures de variation au sein des répétitions en ce qui concerne leur longueur et leur structure primaire. Dans le cadre d’un domaine d’hélice β intact, les boucles 1-2 et 3-4 dépassent d’une face des feuilles β et la boucle 2-3 dépasse de la face opposée (Fig. 5 BIS). La boucle 4-1 se trouve soit sur la même face que la boucle 2-3, soit peut être positionnée plus près du noyau en feuille β de l’hélice (Fig. 5). Dans le sous-groupe 1, les boucles 2-3 les plus longues ont été trouvées dans les répétitions 1, 5 et 6, avec des boucles plus courtes dans les lames 2, 3 et 4. La boucle 4-1 la plus longue était celle entre les répétitions 5 et 6 (Fig. 3). Dans le cadre d’une hélice β, cela suggère que le côté de l’hélice formé par les répétitions 5, 6 et 1 peut être particulièrement impliqué dans les interactions protéiques (voir Fig. 1C). Dans le sous-groupe 2A, les 2-3 boucles les plus longues étaient celles des répétitions 1 et 2, les répétitions 4 et 5 avaient 2-3 boucles intermédiaires et les répétitions 3 et 6 contenaient les 2-3 boucles les plus courtes. Les boucles 4-1 les plus longues étaient celles entre les répétitions 1 et 2 et les répétitions 3 et 4 (Fig. 4). Ceci suggère qu’il existe une organisation différente des sites de liaison dans les hélices β du sous-groupe 2A, avec peut-être deux faces de liaison formées par les répétitions 1 et 2, et les répétitions 4 et 5. Au niveau des séquences individuelles, il y avait également des exemples spécifiques de variation de l’organisation de répétition standard qui pourraient avoir une importance fonctionnelle pour les protéines individuelles. Par exemple, NP_695002 dans le sous-groupe 2A a une boucle 3-4 inhabituellement longue et très chargée dans la répétition 1 et xp_040383 a une boucle 3-4 longue dans la répétition 4 (Fig. 4).

Figure 3
 figure3

Alignement de séquences multiples des protéines BTB/kelch humaines du sous-groupe 1. Les domaines de répétition kelch des 15 protéines BTB/kelch du sous-groupe 1 ont été alignés dans CLUSTALW pour générer une séquence consensuelle de niveau de seuil d’identité de 50%. Les alignements sont présentés pour chaque répétition, l’unité de répétition étant affectée selon la structure 1GOF. Les quatre brins β de chaque répétition sont codés par couleur comme sur la Fig. 1A. Les alignements sont présentés en abat-jour: l’ombrage noir indique des acides aminés identiques, l’ombrage gris indique des acides aminés similaires et le fond blanc indique des acides aminés non apparentés.

Figure 4
 figure4

Alignement de séquences multiples des protéines BTB/kelch humaines du sous-groupe 2A. Les domaines de répétition kelch des 10 protéines BTB/kelch du sous-groupe 2A ont été alignés dans CLUSTALW pour générer une séquence consensuelle de niveau de seuil d’identité de 50%. Les alignements sont présentés pour chaque répétition, l’unité de répétition étant affectée selon la structure 1GOF. Les quatre brins β de chaque répétition sont codés par couleur comme sur la Fig. 1A. Les alignements sont présentés en abat-jour: un ombrage noir indique des acides aminés identiques, un ombrage gris indique des acides aminés similaires et un fond blanc indique des acides aminés non apparentés.

Figure 5
 figure5

Relations des motifs de kelch consensuels avec la structure des pales d’hélice. A, Vue de côté de la structure de pale d’hélice simple de la galactose oxydase (1GOF). les brins β sont codés par couleur comme sur la Fig. 1A et la nomenclature des boucles intra- et inter-pales est indiquée. B, Alignement des motifs de kelch consensuels dérivés des sous-groupes BTB / kelch 1 et 2A sur la structure de la lame, démontrant des distinctions dans la taille de la boucle 2-3 et la répartition des charges. La position de chaque brin β est indiquée.

Nous avons également constaté que les séquences de consensus pour le pli étaient distinctes entre les deux sous-groupes. La séquence de consensus d’identité à 50 % de chaque sous-groupe a été réalignée par rapport à l’unité de répétition kelch pour dériver des séquences de consensus d’identité moyennes à 50 % pour le sous-groupe 1 et le sous-groupe 2A. Ces motifs ont été mappés par rapport à la structure de lame connue de la galactose oxydase (Fig. 5). Les motifs de consensus comprenaient à la fois des acides aminés importants pour le pli (situés dans les brins β) et certains acides aminés dans les boucles, qui contribueraient aux interactions de liaison. Il est à noter que la longueur moyenne du motif était plus courte dans le sous-groupe 1 que dans le sous-groupe 2A. Le consensus du sous-groupe 2A devrait contenir une boucle 2-3 plus longue. Les motifs de consensus étaient distincts dans le positionnement des résidus chargés hautement conservés dans les régions de boucle (Fig. 5). La conservation de ces résidus chargés a été la plus prononcée dans le sous-groupe 1, où ces positions ont été conservées dans le motif jusqu’au seuil d’identité de 70 % (données non représentées). Ces distinctions dans les caractéristiques des boucles suggèrent également différentes modalités d’interactions protéine-protéine pour les hélices β des sous-groupes 1 et 2A. En ce qui concerne les propriétés de liaison aux protéines précédemment caractérisées, nous avons observé que les protéines BTB/kelch qui se lient à l’actine étaient réparties entre les sous-groupes 1 et 3 ; cette fonction n’a donc pas de relation simple avec la structure primaire (Fig. 2 BIS).

Protéines à répétition de Kelch codées dans les génomes d’invertébrés

Nous avons souhaité comparer le développement évolutif des protéines à répétition de kelch entre l’homme et les invertébrés modernes, et avons donc répété l’analyse des protéines à répétition de kelch et de leurs sous-groupes structuraux codés dans les génomes de D. melanogaster, A. gambiae et C. elegans. Nous avons identifié 18 protéines à répétition kelch codées dans les génomes de la Drosophile et de l’Anophèle (Tableau 2). Dix-sept d’entre eux étaient des orthologues conservés entre les deux espèces (l’identité moyenne entre les gènes orthologues de D. melanogaster et A. gambiae est de 56%) et un était unique à chaque espèce. Ainsi, un homologue d’Actinfiline a été identifié chez A. gambiae mais pas chez D. melanogaster et le génome de D. melanogaster contenait un homologue de NP_116164 qui n’était pas présent chez A. gambiae (Tableau 2). Seules trois protéines à répétition kelch ont été précédemment caractérisées en D. melanogaster, à savoir le Kelch, la muskéline et le facteur de cellule hôte de la Drosophile. Deux autres, diablo et scruin-like à la ligne médiane (SLIM-1), ont été reconnus comme des protéines à répétition kelch.

Tableau 2 Protéines à répétition Kelch de D. melanogaster et A. gambiae

Dans le groupe des 19 protéines et protéines hypothétiques, 95% contenaient six répétitions de kelch. Une seule protéine avec cinq répétitions de kelch a été identifiée chez D. melanogaster ou A. gambiae, ce qui correspond à un orthologue de la protéine F-box/kelch humaine, XP_048774 (Tableau 2). 56 % des protéines à répétition kelch de D. melanogaster et A. gambiae étaient des protéines BTB/kelch. D. melanogaster et A. gambiae contenaient une protéine discoïdine/kelch orthologue à la muskéline, une protéine F-box/kelch, trois protéines kelch et multidomaines, une protéine kelch et unique et deux protéines à hélice seulement. Ainsi, toutes les 19 protéines à répétition kelch identifiées avaient des homologues dans le génome humain et l’architecture du domaine BTB/kelch était la plus répandue (tableau 2).

Nous avons identifié 16 protéines à répétition kelch codées dans le génome de C. elegans (tableau 3). Parmi ces protéines, seules kel-1, spe-26 et CeHCF ont été caractérisées fonctionnellement. Kel-1 est une protéine intracellulaire impliquée dans la régulation du comportement alimentaire pendant le développement larvaire. Spe-26 contribue à l’organisation cellulaire des spermatocytes et des mutations sont associées à la stérilité. Le CeHCF pourrait être impliqué dans la régulation de la prolifération cellulaire. 43.7% (7/16) des protéines avaient l’architecture du domaine BTB/kelch, deux étaient des homologues du HCF et de l’attractine avec des architectures multidomaines similaires, deux contenaient des séquences uniques en dehors des répétitions de kelch et deux étaient des protéines uniquement à hélice, qui étaient toutes deux prévues pour former des hélices β à six pales. Une seule protéine F-box/kelch a été identifiée, mais aucune protéine de type muskelin n’a été trouvée (tableau 3). Au lieu de cela, deux protéines hypothétiques avec des architectures de domaines distinctes ont été identifiées : NP_506605 qui contenait également un domaine cycline carboxy-terminal (CDD 7965, Pfam 02984, SMART 00385) et NP_506602, qui contenait un domaine EN ANNEAU (CDD 8941, Pfam 00097, SMART 00184). Le domaine carboxy-terminal de la cycline forme un pli α-hélicoïdal qui peut constituer un site d’interaction protéique. Le domaine ANNULAIRE est un pli zinc-doigt qui médie les interactions protéine-protéine.

Tableau 3 Protéines de Kelch-répétition de C. elegans

Protéines à répétition de kelch codées dans les génomes de levure

Plusieurs protéines à répétition de kelch ont été étudiées fonctionnellement dans les levures en bourgeonnement et de fission, mais aucune d’entre elles ne correspond aux protéines BTB/kelch. Nous avons étudié si la prévalence de l’architecture du domaine BTB/kelch que nous avions identifiée chez les animaux multicellulaires s’étendait à la levure, en analysant le complément des protéines à répétition kelch codées dans les génomes de S. pombe et de S. cerevisiae. Nous avons constaté que chaque génome codait un petit nombre de protéines à répétition kelch (cinq chez S. pombe, huit chez S. cerevisiae), dont aucune ne correspondait à une protéine BTB/kelch (tableau 4). Des protéines et des protéines hypothétiques constituées d’une hélice β-kelch amino-terminale et d’une région enroulée étendue et d’une protéine correspondant à une leucine carboxyl méthyltransférase putative étaient communes à S. pombe et S. cerevisiae. Les autres protéines codées à répétition kelch étaient non homologues (tableau 4). La protéine 1 de type muskelin et la protéine Ral-2p ont été identifiées chez S. pombe, mais pas chez S. cerevisiae. Deux protéines avec des répétitions de kelch distantes, Gpb1/Krh1 et Gpb2/Krh2, ont été caractérisées fonctionnellement comme des protéines de liaison au récepteur couplées à la protéine G chez S. cerevisiae. Les protéines homologues n’ont pas été identifiées chez S. pombe dans le contexte de notre étude. Ainsi, l’architecture du domaine BTB/kelch n’a pas été identifiée chez ces levures.

Tableau 4 Protéines à répétition Kelch de S. cerevisiae et S. pombe

Restriction des protéines BTB/kelch aux animaux métazoaires et aux poxvirus

Parce que l’architecture du domaine BTB/kelch semblait répandue chez les animaux mais n’était pas identifiée chez la levure, nous étions intéressés à examiner si d’autres organismes pouvaient contenir des protéines à répétition kelch avec cette architecture de domaine. Un certain nombre de protéines BTB/kelch ont été rapportées comme cadres de lecture ouverts hypothétiques (ORF) dans la famille des virus des poxvirus animaux. La base de données CDART (Conserved Domain Architecture Retrieval Tool) de NCBI répertorie 333 entrées pour les protéines BTB/kelch, qui proviennent toutes de vertébrés, d’insectes, de C. elegans ou de poxvirus. À ce jour, le domaine BTB n’a été identifié que chez les eucaryotes (arbre d’espèces Pfam 00651). En plus d’examiner les arbres d’espèces SMART et Pfam pour la catégorisation de l’architecture de domaine BTB/kelch, nous avons effectué nos propres recherches BLASTP et TBLASTX du A. base de données du génome de thaliana avec le consensus du motif kelch CDD (cet outil de recherche a identifié 44 protéines BTB/kelch du génome humain et est donc très efficace pour découvrir ces protéines) et a identifié 72 séquences de protéines, dont la majorité étaient des protéines F-box/kelch, dont certaines étaient des protéines sérine-thréonine phosphatase/kelch, et aucune n’était des protéines BTB/kelch. Les recherches avec les domaines BTB de plusieurs protéines de kelch-répétition humaines ou invertébrées n’ont pas non plus permis d’identifier les protéines BTB/kelch chez A. thaliana. Génomes de BLAST Des recherches dans les bases de données de génomes eucaryotes complets ou partiellement séquencés d’animaux et de plantes au NCBI (Entrez/genome_tree,), qui comprenaient les génomes entièrement séquencés de l’Apicomplexium Plasmodium falciparum, de l’Encephalitozoon cuniculi de Microsporidium, de la plante Oryza sativa (rice;) et du champignon Neurospora crassa, ont identifié de nombreuses protéines prédites contenant des répétitions de kelch, mais aucun ORF qui avait l’architecture du domaine BTB/kelch. Les résultats pour des architectures de domaine sélectionnées dans cinq organismes eucaryotes sont présentés à la Fig. 6. Nous avons cependant noté chez les espèces d’Apicomplexies, deux protéines à architecture de domaine K Tétra/kelch (NP_705330 et EAA22466). Le domaine K tetra (Pfam 02214) est un parent structurel éloigné du domaine BTB/POZ. Dans l’ensemble, ces résultats fournissent une indication significative que les séquences codant les protéines pour l’architecture du domaine BTB/kelch se sont développées au cours de l’évolution des animaux multicellulaires, par rapport à l’Apicomplexie, aux champignons, aux plantes et aux autres eucaryotes.

Figure 6
 figure6

Prevalence of selected kelch-repeat protein domain architectures in eucaryotes. Les diagrammes à barres représentent le nombre de protéines à répétition kelch avec les architectures de domaine indiquées codées dans les protéomes de H. sapiens (Hs), D. melanogaster (Dm), C. elegans (Ce), S. pombe (Sp) et A. thaliana (At).

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.