Filogenia molecular de la superfamilia kelch-repeat revela una expansión de proteínas BTB/kelch en animales

Identificación y caracterización de proteínas kelch-repeat codificadas en el genoma humano

Para identificar las proteínas kelch-repeat codificadas en el genoma humano, búsquedas de BLAST y PSI-BLAST de la superfamilia kelch-repeat la base de datos de proteínas predecidas del genoma humano se llevó a cabo con el consenso kelch-motif (CDD543, Pfam01344, SMART 00612) como secuencia de consulta. Esta búsqueda identificó 57 proteínas de repetición kelch y proteínas hipotéticas. Notamos que varias de las proteínas de repetición de kelch humanas conocidas no fueron identificadas por este método, probablemente porque hay relativamente pocos residuos de consenso en cada motivo kelch, ninguno de los cuales es completamente invariante en todos los ejemplos del motivo, y también debido a la variación en las longitudes de los bucles entre las hebras β . Por lo tanto, se realizaron búsquedas adicionales con las repeticiones kelch de los 28 miembros de la superfamilia conocidos, como se describe en los Métodos. Estas búsquedas identificaron 18 proteínas de repetición kelch adicionales codificadas en el genoma humano. Las referencias cruzadas de las 75 entradas con GenBank identificaron 9 de las entradas como secuencias parciales y / o entradas duplicadas para la misma proteína u ORF hipotético, y dos de las entradas como proteínas que no contienen kelch. También hicimos referencias cruzadas de los resultados de búsqueda con las entradas de dominio para kelch en las bases de datos Pfam y SMART domain. Muchas entradas estaban listadas tanto en SMART como en Pfam, sin embargo, varias de las proteínas que habíamos identificado no estaban listadas en estas bases de datos (indicadas en la Tabla 1), a pesar de que cuando buscamos estos polipéptidos contra SMART o Pfam, los motivos kelch estaban claramente identificados. Además, los números de proteínas de repetición kelch asignadas a H. sapiens en los enlaces de árbol de Especies o de Desgravación Fiscal de Pfam y SMART fueron sobreestimados debido a la inclusión de ORF incompletos y entradas múltiples para el mismo polipéptido. También realizamos búsquedas adicionales de GenBank con motivos kelch individuales de las 28 proteínas de repetición kelch conocidas que eran claramente más largas que el consenso de motivos kelch de CDD, con el fin de buscar más ampliamente proteínas que contengan repeticiones más divergentes. A partir de estas múltiples evaluaciones y con exclusión de secuencias parciales (como se describe en los Métodos), identificamos al menos 71 proteínas de repetición kelch codificadas en el genoma humano (Tabla 1).

Tabla 1 Proteínas de repetición Kelch de H. sapiens

Para determinar el número de motivos kelch repetidos en cada proteína o proteína hipotética, se realizaron búsquedas BLASTP con cada secuencia en la Base de Datos de Dominios Conservados (CDD) y Pfam, junto con la identificación manual de motivos kelch. El número de motivos kelch identificados varió de dos a siete. Cuatro palas es el número mínimo que se ha documentado a partir de estructuras cristalinas de dominios de hélice β . Por lo tanto, parecía poco probable que las entradas que codificaban dos o tres motivos kelch correspondieran a ORF completos y se excluyeran de análisis posteriores (entradas NP-689579, XP_209285, XP_058629). Sobre esta base, se predijo que el 12,7 % (9/71) de las secuencias contuvieran hélices β de cinco palas, el 84,5 % (60/71) contuvieran hélices β de seis palas y el 2,8 % (2/71) contuvieran hélices β de siete palas (Tabla 1). Hasta donde sabemos, solo se ha identificado previamente una proteína de repetición kelch de siete hojas, la galactosa oxidasa fúngica .

En la galactosa oxidasa, la proteína de repetición de kelch única para la que existe información sobre la estructura cristalina, la hélice se circula mediante la formación de una séptima cuchilla compuesta, con las hebras β-uno a β-tres proporcionadas desde la repetición de la secuencia C-terminal y la hebra β-cuatro proporcionada por la secuencia amino-terminal hasta la primera repetición de secuencia completa, un mecanismo denominado «Cierre de hebra β-terminal N» (Fig. 1C). Examinamos las proteínas de repetición de kelch humano por predicción de estructura secundaria de hojas β y por análisis manual de las repeticiones de secuencia, y encontramos que para el 77,5 % (55/71) de las proteínas, se predijo que la estructura de hélice β estaría cerrada por una hebra β C-terminal. Para cinco secuencias, no se pudo hacer una predicción clara (Tabla 1).

Localización cromosómica de proteínas humanas con repetición de kelch

Las secuencias de codificación de las proteínas humanas con repetición de kelch se dispersan por todo el genoma, encontrándose en todos los cromosomas excepto en el cromosoma 21 y el cromosoma Y (Tabla 1). Se observaron varios casos de genes en proximidad física, por ejemplo NP_006460 y NP_067646 en 1q31.3 y NP_569713 y NP_060114 en 3q27.3 (Tabla 1). Sin embargo, en la mayoría de los casos, estos no correspondían a las secuencias de proteínas más estrechamente relacionadas, como cabría esperar de los genes recientemente duplicados. Una excepción fue NP_055130 y NP-751943, que se encontraban en 14q21.3 y que estaban más estrechamente relacionados entre sí (46% de identidad). En general, no hubo evidencia de agrupación física de secuencias de codificación de proteína kelch dentro del genoma humano. En contraste, los genes que codifican las numerosas proteínas F-box/kelch de A. thaliana están agrupados de tal manera que algunas de las secuencias más relacionadas se codifican desde ubicaciones genómicas físicamente cercanas .

Arquitectura de dominios de proteínas de repetición de Kelch humana

Veintiocho proteínas de repetición de kelch de varios organismos se agruparon previamente en 5 categorías estructurales de acuerdo con el posicionamiento de las repeticiones de kelch dentro de la secuencia de polipéptidos y la presencia de otros dominios estructurales conservados . Para evaluar la complejidad de las arquitecturas de dominio dentro de un solo organismo, cada secuencia de proteína de repetición de kelch humana se volvió a analizar mediante una búsqueda contra CDD, SMART y Pfam y luego se agrupó de acuerdo con la arquitectura de dominio.

Sorprendentemente, el 72 % (51/71) de las proteínas de repetición kelch humana contenían un dominio BTB/POZ. En todas menos una de las proteínas, el dominio BTB era amino-terminal al dominio kelch (Tabla 1). Esta proteína hipotética, LZTR-1, contenía dos dominios BTB en tándem. Cuatro proteínas de repetición de kelch (5,6%) contenían un único dominio conservado adicional. Muskelin fue la única proteína de repetición kelch identificada en el genoma humano que contenía un dominio de discoidina (CDD 7753, Pfam 00231, SMART 00231, también conocido como dominio F5 / F8 tipo C) (Prag, Collett y Adams, en preparación). El dominio discoidina actúa como un dominio de interacción proteína-proteína en una serie de proteínas extracelulares e intracelulares y, en los factores de coagulación V y VIII, media la unión de fosfolípidos . Otra proteína kelch, XP_048774, contenía un dominio F-box (CDD9197, Pfam 00646). El F-box es un dominio de unos cuarenta residuos, identificados por primera vez en la ciclina A, que interactúa con Skp1 para anclar proteínas al conjunto ubiquitina-ligasa para la ubiquitinación y la orientación a la degradación mediada por proteosomas . La combinación de dominios F-box y kelch-repeat ha sido descrita previamente en A. thaliana, donde al menos 67 proteínas F-box/kelch y proteínas hipotéticas están codificadas en el genoma . Varios de estos funcionan en la regulación dependiente de la luz del reloj circadiano, pero la función de muchos otros es oscura . Hasta donde sabemos, este es el primer reconocimiento de una proteína F-box/kelch en un genoma animal. Una proteína de repetición kelch predicha, NP_055608, contenía un dominio de leucina carboxil metiltansferasa (LCM) (CDD9631, Pfam 04072) con 34% de identidad al dominio de LCM de la proteína fosfatasa 2 leucina carboxil metiltransferasa . El gen-2 activador de recombinación (RAG-2) contiene un dominio dedo de homeodominio vegetal (PHD) (Pfam00628) en el carboxi-terminal .

Seis proteínas de repetición de kelch (11 %) eran proteínas multidominio muy grandes (Tabla 1). Atractin / caoba (que son variantes de empalme de un solo gen; 27-29) y MEGF8 son cada uno más de 1000 aminoácidos de largo y contienen un dominio CUB, repeticiones kelch, un dominio de lectina de tipo C y dominios similares a EGF. Se han atribuido diversas funciones a la atractina y la caoba que incluyen un papel en las interacciones de células T (atractin, la variante de empalme secretado) y la regulación de la obesidad en ratones (caoba, la variante de empalme transmembrana) . El factor 1 y el factor 2 de la célula huésped (HCF-1 y HCF-2) también son grandes proteínas que contienen repeticiones kelch amino-terminales, dos dominios de fibronectina tipo III y, en el caso del HCF-1, una serie de repeticiones únicas de HCF. Estas proteínas funcionan como coactivadores transcripcionales de la expresión génica temprana inmediata del virus del herpes simple .

Identificamos tres proteínas hipotéticas de repetición kelch que contenían secuencias únicas no relacionadas que no correspondían a dominios estructurales reconocidos, posicionadas ya sea amino o carboxi terminal a las repeticiones kelch (Tabla 1).

El efector Rab9 p40 y otras seis proteínas de repetición de kelch eran polipéptidos cortos, de 350 a 442 aminoácidos de longitud, que consistían casi en su totalidad en repeticiones de kelch (Tabla 1). Cinco de estas proteínas o proteínas hipotéticas, incluida la p40, contenían seis repeticiones de secuencia y, por lo tanto, se predice que formarán hélices β de seis palas. Dos proteínas hipotéticas, NP_060673 y XP_114323, consistían en supuestas hélices β de siete palas. Juntas, estas distinciones estructurales forman la base para la nueva categorización de proteínas de repetición de kelch humana que se presenta aquí (Tabla 1).

Relaciones estructurales de proteínas BTB/kelch humanas

El número inesperadamente grande de proteínas BTB / kelch codificadas en el genoma humano nos llevó a estudiar este grupo con más detalle, con el objetivo de identificar subgrupos estructurales que también podrían representar subconjuntos funcionales. Las 38 secuencias de longitud completa que contenían dominios BTB individuales y hélices β de seis palas predichas se alinearon de acuerdo con la similitud de secuencias en CLUSTALW y se vieron como árboles de unión vecinal. La alineación de las secuencias de longitud completa reveló tres subgrupos de aproximadamente el mismo tamaño, que denominamos subgrupos 1 a 3 (Fig. 2A). Cuando se realizó el mismo análisis con los dominios kelch solos, se observó el mismo agrupamiento para el subgrupo 1 y una proporción sustancial del subgrupo 2, denominado subgrupo 2A (Fig. 2B). En una alineación de los dominios BTB solamente, se mantuvieron los subgrupos 1 y 2 para la mayoría de las secuencias (Fig. 2C). Los árboles sin enraizar producidos por un método separado de alineación basado en el análisis de parsimonia máxima de secuencias, PROTPARS, no soportaron el subgrupo 3, pero demostraron consistentemente la relación de las secuencias en los subgrupos 1 y 2A (no se muestran datos). Nos centramos en estas secuencias de repetición de kelch robustamente relacionadas en los subgrupos 1 y 2A, para un análisis más detallado de los dominios de repetición de kelch.

Gráfico 2
figura 2

Relaciones entre proteínas BTB/kelch humanas. Las secuencias de aminoácidos de las 38 proteínas humanas de longitud completa BTB/kelch que se predijo que contendrían hélices β de seis palas se alinearon en CLUSTALW y se presentan en Drawgram de Phylip para A) secuencias de longitud completa; B) dominios de repetición kelch solamente; C) dominios de BTB solamente, con códigos de sombra para los tres subgrupos identificados como se indica. Un asterisco en el panel A indica proteínas BTB / kelch de unión a actina conocidas. El panel B muestra la agrupación robusta de un conjunto de secuencias del subgrupo 2, denominado subgrupo 2A.

La alineación de secuencias múltiples de CLUSTALW de los dominios kelch-repeat de cada uno de los subgrupos 1 y 2A demostró características distintivas en términos de organización de repeticiones. En ambos subgrupos (Fig. 3 y Fig. 4), el bucle intrablado entre los hilos β 2 y 3 (el bucle 2-3, Fig. 5A) y el bucle interblade 4-1 fueron fuentes principales de variación dentro de las repeticiones con respecto a su longitud y estructura primaria. En el contexto de un dominio de hélice β intacto, los bucles 1-2 y 3-4 sobresalen por encima de una cara de las hojas β y el bucle 2-3 sobresale de la cara opuesta (Fig. 5A). El bucle 4-1 se encuentra en la misma cara que el bucle 2-3, o puede colocarse más cerca del núcleo de lámina β de la hélice (Fig. 5). En el subgrupo 1, los 2-3 bucles más largos se encontraron en las repeticiones 1, 5 y 6, con bucles más cortos en las cuchillas 2, 3 y 4. El bucle 4-1 más largo era el que se encontraba entre las repeticiones 5 y 6 (Fig. 3). En el contexto de una hélice β, esto sugiere que el lado de la hélice formado por repeticiones 5, 6 y 1 puede estar particularmente involucrado en interacciones proteicas (ver Fig. 1C). En el subgrupo 2A, los 2-3 bucles más largos eran los de las repeticiones 1 y 2, las repeticiones 4 y 5 tenían 2-3 bucles intermedios y las repeticiones 3 y 6 contenían los 2-3 bucles más cortos. Los bucles 4-1 más largos eran los que se encontraban entre las repeticiones 1 y 2, y las repeticiones 3 y 4 (Fig. 4). Esto sugiere que hay una organización diferente de los sitios de unión en las hélices del subgrupo 2A β, con quizás dos caras de unión formadas por repeticiones 1 y 2, y repeticiones 4 y 5. A nivel de secuencias individuales, también hubo ejemplos específicos de variación de la organización de repeticiones estándar que podrían ser de importancia funcional para proteínas individuales. Por ejemplo, NP_695002 en el subgrupo 2A tiene un bucle 3-4 inusualmente largo y altamente cargado en la repetición 1 y XP_ 040383 tiene un bucle 3-4 largo en la repetición 4 (Fig. 4).

Gráfico 3
figura 3

Alineación de secuencias múltiples de proteínas BTB/kelch humanas del subgrupo 1. Los dominios de repetición kelch de las 15 proteínas BTB/kelch del subgrupo 1 se alinearon en CLUSTALW para generar una secuencia de consenso de nivel de umbral de identidad del 50%. Las alineaciones se presentan para cada repetición, con la unidad de repetición asignada de acuerdo con la estructura 1GOF. Las cuatro hebras β en cada repetición están codificadas por colores como en la Fig. 1A. Las alineaciones se presentan en pantalla de caja: el sombreado negro indica aminoácidos idénticos, el sombreado gris indica aminoácidos similares y el fondo blanco indica aminoácidos no relacionados.

Gráfico 4
figura 4

Alineación de secuencias múltiples de proteínas humanas BTB/kelch del subgrupo 2A. Los dominios de repetición kelch de los 10 subgrupos 2A de proteínas BTB/kelch se alinearon en CLUSTALW para generar una secuencia de consenso de nivel de umbral de identidad del 50%. Las alineaciones se presentan para cada repetición, con la unidad de repetición asignada de acuerdo con la estructura 1GOF. Las cuatro hebras β en cada repetición están codificadas por colores como en la Fig. 1A. Las alineaciones se presentan en pantalla de caja: el sombreado negro indica aminoácidos idénticos, el sombreado gris indica aminoácidos similares y el fondo blanco indica aminoácidos no relacionados.

Figura 5
figura5

Relaciones de consenso kelch-motivos a la pala de la hélice de la estructura. A, Vista lateral de la estructura de palas de hélice única de galactosa oxidasa (1GOF). las hebras β están codificadas por colores como en la Fig. 1A y se indica la nomenclatura para los bucles intra e interlama. B, Alineación de motivos de consenso kelch derivados de los subgrupos BTB / kelch 1 y 2A a la estructura de la hoja, demostrando distinciones en el tamaño de bucle 2-3 y la distribución de carga. Se indica la posición de cada hebra β.

También encontramos que las secuencias de consenso para el pliegue eran distintivas entre los dos subgrupos. La secuencia de consenso de identidad del 50% de cada subgrupo se realineó contra la unidad de repetición kelch para derivar secuencias de consenso de identidad medias del 50% para el subgrupo 1 y el subgrupo 2A. Estos motivos se mapearon contra la estructura de lámina conocida de galactosa oxidasa (Fig. 5). Los motivos de consenso incluyeron tanto aminoácidos de importancia para el pliegue (ubicados dentro de las hebras β) como ciertos aminoácidos dentro de los bucles, que se pronosticaría que contribuirían a las interacciones de unión. Cabe destacar que la longitud media del motivo fue más corta en el subgrupo 1 que en el subgrupo 2A. Se prevé que el consenso del subgrupo 2A contenga un bucle 2-3 más largo. Los motivos de consenso fueron distintos en el posicionamiento de residuos cargados altamente conservados dentro de las regiones de bucle (Fig. 5). La conservación de estos residuos cargados fue más pronunciada en el subgrupo 1, donde estas posiciones se conservaron en el motivo hasta el umbral de identidad del 70% (no se muestran los datos). Estas distinciones en las características del bucle también sugieren diferentes modalidades de interacciones proteína-proteína para las hélices β de los subgrupos 1 y 2A. Con respecto a las propiedades de unión a proteínas previamente caracterizadas, observamos que las proteínas BTB/kelch que se unen a la actina se dividieron entre los subgrupos 1 y 3; por lo tanto, esta función no tiene una relación simple con la estructura primaria (Fig. 2A).

Proteínas de repetición Kelch codificadas en genomas de invertebrados

Deseábamos comparar el desarrollo evolutivo de proteínas de repetición kelch entre humanos e invertebrados modernos, y así repetir el análisis de proteínas de repetición kelch y sus subgrupos estructurales codificados en los genomas de D. melanogaster, A. gambiae y C. elegans . Se identificaron 18 proteínas de repetición kelch codificadas en los genomas Drosophila y Anopheles (Tabla 2). Diecisiete de ellos eran ortólogos conservados entre las dos especies (la identidad promedio entre los genes ortólogos de D. melanogaster y A. gambiae es del 56 % ) y uno era único para cada especie. Por lo tanto, se identificó un homólogo de actinfilina en A. gambiae, pero no en D. melanogaster, y el genoma de D. melanogaster contenía un homólogo de NP_116164 que no estaba presente en A. gambiae (Tabla 2). Solo tres proteínas de repetición de kelch se caracterizaron previamente en D. melanogaster, es decir , factor de célula huésped Kelch, Muskelin y Drosophila . Otras dos, diablo y scruin en la línea media (SLIM-1), han sido reconocidas como proteínas de repetición kelch .

Tabla 2 Proteínas de repetición Kelch de D. melanogaster y A. gambiae

Dentro del grupo de 19 proteínas y proteínas hipotéticas, el 95% contenía seis repeticiones kelch. Solo se identificó una proteína con cinco repeticiones kelch en D. melanogaster o A. gambiae, que correspondió a un ortólogo de la proteína F-box/kelch humana, XP_048774 (Tabla 2). el 56% de las proteínas de repetición kelch de D. melanogaster y A. gambiae eran proteínas BTB/kelch. Tanto D. melanogaster como A. gambiae contenían una proteína discoidina / kelch ortóloga a muskelina, una proteína F-box/kelch, tres proteínas kelch y multidominio, una proteína kelch y única, y dos proteínas de hélice. Por lo tanto, todas las 19 proteínas de repetición kelch identificadas tenían homólogos en el genoma humano y la arquitectura de dominio BTB/kelch fue la más prevalente (Tabla 2).

Identificamos 16 proteínas de repetición kelch codificadas en el genoma de C. elegans (Tabla 3). De estas proteínas, solo kel-1, spe-26 y CeHCF han sido caracterizadas funcionalmente. Kel-1 es una proteína intracelular involucrada en la regulación del comportamiento de alimentación durante el desarrollo larvario . La Spe-26 contribuye a la organización celular de los espermatocitos y las mutaciones están asociadas con la esterilidad . CeHCF podría estar involucrado en la regulación de la proliferación celular . 43.el 7% (7/16) de las proteínas tenían la arquitectura de dominio BTB/kelch, dos eran homólogos de HCF y atractin con arquitecturas multidominio similares, dos contenían secuencias únicas fuera de las repeticiones kelch y dos eran proteínas de hélice única, ambas de las cuales se predijo que formarían hélices β de seis palas. Se identificó una sola proteína F-box/kelch, pero no se encontró proteína similar a la muskelina (Tabla 3). En su lugar, se identificaron dos proteínas hipotéticas con arquitecturas de dominio distintivas : NP_506605 que también contenía un dominio carboxi-terminal de ciclina (CDD 7965, Pfam 02984, SMART 00385) y NP_506602, que contenía un dominio ANULAR (CDD 8941, Pfam 00097, SMART 00184). El dominio carboxi-terminal de la ciclina forma un pliegue α-helicoidal que puede constituir un sitio de interacción de proteínas . El dominio de ANILLO es un pliegue de dedo de zinc que media las interacciones proteína-proteína .

Tabla 3 Proteínas de repetición Kelch de C. elegans

Proteínas de repetición de Kelch codificadas en genomas de levadura

Se han estudiado funcionalmente varias proteínas de repetición de kelch en levaduras en ciernes y de fisión, pero ninguna de ellas corresponde a proteínas BTB / kelch . Investigamos si la prevalencia de la arquitectura de dominio BTB/kelch que habíamos identificado en animales multicelulares se extendía a la levadura, analizando el complemento de proteínas de repetición kelch codificadas en los genomas de S. pombe y S. cerevisiae . Encontramos que cada genoma codificaba un pequeño número de proteínas de repetición kelch (cinco en S. pombe, ocho en S. cerevisiae), ninguna de las cuales correspondía a una proteína BTB/kelch (Tabla 4). Las proteínas y proteínas hipotéticas que consistían en una hélice β kelch amino-terminal y una región de bobina enrollada extendida y una proteína correspondiente a una supuesta leucina carboxil metiltransferasa eran comunes a S. pombe y S. cerevisiae. Las otras proteínas de repetición kelch codificadas no eran homólogas (Tabla 4). La proteína 1 similar a Muskelin y Ral-2p se identificaron en S. pombe, pero no en S. cerevisiae . Dos proteínas con repeticiones kelch distantes, Gpb1 / Krh1 y Gpb2 / Krh2, se han caracterizado funcionalmente como proteínas de unión al receptor acopladas a proteínas G en S. cerevisiae . Las proteínas homólogas no fueron identificadas en S. pombe en el contexto de nuestro estudio. Por lo tanto, la arquitectura de dominio BTB/kelch no se identificó en estas levaduras.

Tabla 4 Proteínas de repetición Kelch de S. cerevisiae y S. pombe

Restricción de proteínas BTB / kelch a animales metazoanos y poxvirus

Debido a que la arquitectura de dominio BTB/kelch parecía prevalente en animales pero no se identificó en levaduras, nos interesó considerar si otros organismos podrían contener proteínas de repetición kelch con esta arquitectura de dominio. Un número de proteínas BTB / kelch han sido reportadas como marcos hipotéticos de lectura abierta (ORF, por sus siglas en inglés) en la familia de virus poxvirus de animales . La base de datos de la Herramienta de Recuperación de Arquitectura de Dominio Conservado (CDART) en NCBI enumera 333 entradas para proteínas BTB/kelch, todas las cuales se originan de vertebrados, insectos, C. elegans o poxvirus. Hasta la fecha, el dominio BTB solo se ha identificado en eucariotas (árbol de especies Pfam 00651). Además de revisar los árboles de especies SMART y Pfam para la categorización de la arquitectura de dominio BTB/kelch, realizamos nuestras propias búsquedas BLASTP y TBLASTX de la A. base de datos del genoma de thaliana con el consenso de motivos kelch de CDD (esta herramienta de búsqueda identificó 44 proteínas BTB / kelch del genoma humano y, por lo tanto, es muy eficaz para descubrir estas proteínas) e identificó 72 secuencias de proteínas, la mayoría de las cuales eran proteínas F-box/kelch , algunas de las cuales eran proteínas serina-treonina fosfatasa/kelch, y ninguna de las cuales eran proteínas BTB/kelch. Las búsquedas con los dominios BTB de varias proteínas de repetición kelch humana o invertebrada tampoco identificaron proteínas BTB/kelch en A. thaliana. Las búsquedas de genomas de EXPLOSIÓN en las bases de datos de genomas eucarióticos completos o parcialmente secuenciados de animales y plantas en NCBI (Entrez / genome_tree,), que incluyeron los genomas completamente secuenciados del Apicomplexium Plasmodium falciparum , el Encefalitozoon de Microsporidium cuniculi, la planta Oryza sativa (rice;) y el hongo Neurospora crassa, identificaron muchas proteínas que contenían repeticiones kelch, pero no ORF que tuvieran la arquitectura de dominio BTB/kelch. Los resultados de arquitecturas de dominio seleccionadas en cinco organismos eucarióticos se presentan en la Fig. 6. Sin embargo, observamos en especies de Apicomplexia, dos proteínas con arquitectura de dominio K Tetra /kelch (NP_705330 y EAA22466). El dominio K tetra (Pfam 02214) es un relativo estructural distante del dominio BTB/POZ . En general, estos resultados proporcionan una indicación significativa de que las secuencias de codificación de proteínas para la arquitectura de dominio BTB/kelch se han expandido durante la evolución de los animales multicelulares, en comparación con la Apicomplexia, los hongos, las plantas y otros eucariotas.

Gráfico 6
figura 6

Prevalencia de arquitecturas seleccionadas de dominio proteico de repetición kelch en eucariotas. Los gráficos de barras representan el número de proteínas de repetición kelch con las arquitecturas de dominio indicadas codificadas en los proteomas de H. sapiens (Hs), D. melanogaster (Dm), C. elegans (Ce), S. pombe (Sp) y A. thaliana (At).

Deja una respuesta

Tu dirección de correo electrónico no será publicada.