Moleculaire fylogenie van de kelch-herhaal onderorde onthult een uitbreiding van BTB/kelch eiwitten in dieren

Identificatie en karakterisering van kelch-herhaal gecodeerde eiwitten in het menselijk genoom

identificeren de kelch-herhaal gecodeerde eiwitten in het menselijk genoom, BLAST en PSI-BLAST zoekopdrachten van het menselijk genoom voorspelde eiwit database werden uitgevoerd met de kelch-motief consensus (CDD543, Pfam01344, SMART 00612) als een query-sequentie. Deze zoektocht identificeerde 57 kelch-repeat proteã nen en hypothetische proteã nen. Wij merkten op dat verscheidene van de bekende menselijke kelch-repeat proteã nen niet door deze methode werden geïdentificeerd, waarschijnlijk omdat er relatief weinig consensusresiduen in elk kelch-motief zijn, waarvan geen volledig invariant is in alle voorbeelden van het motief, en ook wegens variatie in de lengtes van de lussen tussen de β-strengen . Daarom werden verdere zoekopdrachten uitgevoerd met de kelch-herhalingen van alle 28 bekende superfamilieleden, zoals beschreven in de methoden. Deze onderzoeken identificeerden 18 extra kelch-repeat proteã nen gecodeerd in het menselijke genoom. Door alle 75 ingangen tegen GenBank te vergelijken, werden 9 ingangen geïdentificeerd als gedeeltelijke sequenties en/of dubbele ingangen voor hetzelfde eiwit of hypothetische ORF, en twee ingangen als niet-kelch bevattende eiwitten. We hebben ook de zoekresultaten vergeleken met de domeinvermeldingen voor kelch in de Pfam en SMART domain databases. Veel vermeldingen werden zowel in SMART als Pfam vermeld, maar een aantal van de eiwitten die we hadden geïdentificeerd werden niet in deze databases vermeld (aangegeven in Tabel 1), hoewel toen we deze polypeptiden zochten tegen SMART of Pfam, kelch-motieven duidelijk werden geïdentificeerd. Bovendien werden de aantallen kelch herhaal proteã nen toegewezen aan H. sapiens in de Species tree of Taxbreak schakels van Pfam en SMART overschat wegens opneming van onvolledige ORFs en veelvoudige inzendingen voor hetzelfde polypeptide. We voerden ook extra onderzoeken van GenBank uit met enkele kelch-motieven van de 28 bekende kelch-repeat proteã nen die duidelijk langer waren dan de consensus van CDD kelch-motief, om uitgebreider te zoeken naar proteã nen die meer divergente herhalingen bevatten. Uit deze meervoudige evaluaties en met uitsluiting van partiële sequenties (zoals beschreven in de methoden), identificeerden we ten minste 71 kelch-repeat eiwitten gecodeerd in het menselijk genoom (Tabel 1).

Tabel 1 Kelch-herhalingseiwitten van H. sapiens

om het aantal herhaalde kelch-motieven in elke proteã ne of hypothetische proteã ne te bepalen, werden BLASTP-zoekopdrachten uitgevoerd met elke sequentie tegen de geconserveerde domeindatabase (CDD) en Pfam, samen met handmatige identificatie van kelch-motieven. Het aantal geïdentificeerde kelch-motieven varieerde van twee tot zeven. Vier bladen is het minumumgetal dat is gedocumenteerd uit kristalstructuren van β-propellerdomeinen . Het leek dus onwaarschijnlijk dat items die twee of drie kelch-motieven coderen overeenkwamen met volledige ORF ‘ s en deze werden uitgesloten van verdere analyse (entries NP-689579, XP_209285, XP_058629). Op basis hiervan werd voorspeld dat 12,7 % (9/71) van de sequenties vijfbladige β-propellers bevatten, 84,5 % (60/71) zesbladige en 2,8 % (2/71) zevenbladige β-propellers bevatten (Tabel 1). Voor zover wij weten, is slechts één zevenbladige kelch repeat proteïne eerder geà dentificeerd, schimmelgalactose oxidase .

in galactose-oxidase, het enige kelch-repeat-eiwit waarvoor informatie over de kristalstructuur beschikbaar is, wordt de propeller circulair gevormd door de vorming van een samengesteld zevende blad, waarbij de β-één tot β-drie strengen worden geleverd uit de meest C-terminale sequentie-herhaling en de β-vier strengen worden geleverd door de sequentie-amino-terminal aan de eerste volledige sequentie-herhaling, een mechanisme dat wordt aangeduid als “n-terminale β-streng-sluiting” (Fig. 1C). Wij onderzochten de menselijke kelch-repeat proteã nen door secundaire structuurvoorspelling van β-bladen en door handmatige analyse van de opeenvolging herhalingen, en stelden vast dat Voor 77,5 % (55/71) van de proteã nen de β-propellerstructuur werd voorspeld door een C-eind β-streng te worden gesloten. Voor vijf sequenties kon geen duidelijke voorspelling worden gemaakt (tabel 1).

chromosomale lokalisatie van Humane kelch-repeat-eiwitten

de coderingsequenties voor humane kelch-repeat-eiwitten worden verspreid door het gehele genoom en bevinden zich op alle chromosomen behalve chromosoom 21 en het Y-chromosoom (Tabel 1). Verschillende gevallen van genen in fysieke nabijheid werden opgemerkt, bijvoorbeeld NP_006460 en NP_067646 bij 1q31. 3 en NP_569713 en NP_060114 bij 3q27.3 (Tabel 1). In de meeste gevallen kwamen deze echter niet overeen met de nauwst verwante eiwitsequenties zoals verwacht zou worden voor recent gedupliceerde genen. Een uitzondering was NP_055130 en NP-751943 die zich op 14q21.3 bevonden en die het nauwst met elkaar verbonden waren (46% identiteit). Globaal, was er geen bewijs voor fysieke groepering van kelch-proteã ne die opeenvolgingen binnen het menselijke genoom coderen. In tegenstelling, zijn de genen die de talrijke F-doos/kelch proteã nen van A. thaliana coderen zodanig geclusterd dat sommige hoogst-verwante opeenvolgingen van fysisch dicht genomic plaatsen worden gecodeerd .

Domeinarchitectuur van Humane Kelch-repeat proteïnen

achtentwintig kelch-repeat proteïnen van verschillende organismen werden eerder gegroepeerd in 5 structurele categorieën volgens de positionering van de kelch-repeats binnen de polypeptidesequentie en de aanwezigheid van andere behouden structurele domeinen . Om de complexiteit van domeinarchitecturen binnen één enkel organisme te evalueren, werd elke menselijke kelch-repeat eiwitopeenvolging opnieuw geanalyseerd door tegen CDD, SMART en Pfam te zoeken en vervolgens te subgroeperen volgens domeinarchitectuur.Opvallend is dat 72 % (51/71) van de humane kelch-repeat-eiwitten een BTB/POZ-domein bevatten. In alle eiwitten op één na was het BTB-domein amino-terminaal aan het kelch-domein (Tabel 1). Dit hypothetische eiwit, LZTR-1, bevatte twee tandem BTB domeinen. Vier (5,6%) kelch-repeat proteã nen bevatten één enkel extra behouden domein. Muskeline was de enige kelch-herhaalproteã ne die in het menselijke genoom wordt geà dentificeerd om een discoidin domein te bevatten (CDD 7753, Pfam 00231, SMART 00231, ook als F5/F8 Type C domein wordt bekend) (Prag, Collett en Adams, in voorbereiding). Het discoidin-domein doet dienst als eiwit-eiwitinteractiedomein in een aantal extracellulaire en intracellulaire proteã nen en, in stollingsfactoren V en VIII, bemiddelt fosfolipid band . Een ander kelch-eiwit, XP_048774, bevatte een F-box domein (CDD9197, Pfam 00646). De F-doos is een domein van ongeveer veertig residuen, eerst geà dentificeerd in cyclin a, dat met Skp1 in wisselwerking staat om proteã nen aan de ubiquitin-ligase assemblage voor ubiquitination te verankeren en het richten aan proteosome-bemiddelde degradatie . De combinatie van F-box en kelch-repeat domeinen is eerder beschreven in A. thaliana, waar ten minste 67 F-box/kelch proteã nen en hypothetische proteã nen in het genoom worden gecodeerd . Verscheidene van deze functies functioneren in lichtafhankelijke regulatie van de circadiaanse klok, maar de functie van vele anderen is onduidelijk . Voor zover bekend is dit de eerste herkenning van een F-box/kelch-eiwit in een dierlijk genoom. Eén voorspelde kelch-repeat proteïne, NP_055608, bevatte een leucine carboxyl methyltansferase (LCM) domein (CDD9631, Pfam 04072) met 34% identiteit aan het LCM domein van eiwitfosfatase 2 leucine carboxyl methyltransferase . Recombinatie-activerend Gen-2 (RAG-2) bevat een plant homeodomain (PHD) vingerdomein (Pfam00628) aan de carboxy-terminus .

zes kelch-repeat-eiwitten (11 %) waren zeer grote, multidomain-eiwitten (Tabel 1). Attractin / mahonie (dat zijn splice varianten van een enkel gen; 27-29) en MEGF8 zijn elk meer dan 1000 aminozuren lang en bevatten een CUB-domein, kelch herhalingen, een c-type lectine domein en EGF-achtige domeinen. De Diverse functies zijn toegeschreven aan attractin en mahonie die een rol in t-celinteractie (attractin, de afgescheiden lasvariant) en zwaarlijvigheidsregelgeving in muizen (Mahonie, de transmembrane lasvariant) omvatten . De factor-1 en -2 van de gastheercel (HCF-1 en HCF-2) zijn ook grote proteã nen die amino-eind kelch-herhalingen, twee domeinen van fibronectin type III en, in het geval van HCF-1, een reeks unieke HCF herhalingen bevatten. Deze proteã nen functioneren als transcriptional coactivators van onmiddellijke vroege genuitdrukking van het herpes simplexvirus .

we identificeerden drie hypothetische kelch-repeat-eiwitten die niet-gerelateerde unieke sequenties bevatten die niet overeenkwamen met erkende structurele domeinen, die ofwel amino – ofwel carboxy-terminaal zijn geplaatst op de kelch-herhalingen (Tabel 1).

Rab9 effector p40 en zes andere kelch-repeat proteïnen waren korte polypeptiden, van 350-442 aminozuren in lengte, die bijna volledig uit kelch-herhalingen bestonden (Tabel 1). Vijf van deze proteã nen of hypothetische proteã nen, met inbegrip van p40, bevatten zes opeenvolgingsverhalen en zo wordt voorspeld om zesbladige β-propellers te vormen. Twee hypothetische eiwitten, NP_060673 en XP_114323, bestonden uit zevenbladige β-propellers. Samen vormen deze structurele verschillen de basis voor de nieuwe categorisatie van menselijke kelch-repeat proteïnen die hier wordt gepresenteerd (Tabel 1).

structurele relaties van menselijke BTB / kelch-eiwitten

het onverwacht grote aantal BTB / kelch-eiwitten dat in het menselijk genoom gecodeerd is, heeft ons ertoe gebracht deze groep nader te bestuderen, met als doel structurele subgroepen te identificeren die ook functionele subgroepen kunnen vertegenwoordigen. De 38 reeksen over de volledige lengte die enkele BTB-domeinen bevatten en voorspelde zesbladige β-propellers werden uitgelijnd volgens de sequentie-gelijkenis in CLUSTALW en gezien als buurtverbindende bomen. Uitlijning van de volledige lengte sequenties onthulde drie subgroepen van ongeveer gelijke grootte, die we subgroepen 1 tot 3 noemden (Fig. 2 bis). Wanneer dezelfde analyse werd uitgevoerd met de kelch domeinen alleen, dezelfde groepering was duidelijk voor subgroep 1 en een substantieel deel van subgroep 2, genaamd subgroep 2A (Fig. 2B). In een uitlijning van alleen de BTB-domeinen werden de subgroepen 1 en 2 voor de meerderheid van de sequenties gehandhaafd (Fig. 2C). Niet-wortelvormige bomen geproduceerd door een aparte methode voor uitlijning op basis van maximale parsimonieanalyse van sequenties, PROTPARS, ondersteunden subgroep 3 niet, maar toonden consistent het verband aan tussen de sequenties in subgroepen 1 en 2A (gegevens niet getoond). We richtten ons op deze robuust gerelateerde kelch-repeat sequenties in subgroepen 1 en 2A, voor een nadere analyse van de Kelch-repeat domeinen.

Figuur 2
figuur 2

relaties tussen menselijke BTB / kelch-eiwitten. De aminozuursequenties van de 38 menselijke BTB/kelch-eiwitten die naar verwachting zesbladige β-propellers bevatten, werden in CLUSTALW uitgelijnd en worden gepresenteerd in Phylip-Drawgram voor A) volledige sequenties; B) alleen kelch-herhaaldomeinen; C) alleen BTB-domeinen, met schaduwcodes voor de drie geïdentificeerde subgroepen zoals aangegeven. De sterretje in Paneel A wijzen op bekende actin-bindende BTB / kelch proteã nen. Paneel B toont de robuuste groepering van een reeks sequenties uit subgroep 2, genaamd subgroep 2A.

CLUSTALW multiple sequence alignment van de kelch-repeat domeinen uit elk van de subgroepen 1 en 2A vertoonde onderscheidende kenmerken in termen van herhalingsorganisatie. In beide subgroepen (Fig. 3 en Fig. 4), de intrablade lus tussen β-strengen 2 en 3 (de 2-3 lus, Fig. 5A) en de interblade 4-1 lus waren belangrijke bronnen van variatie binnen de herhalingen met betrekking tot hun lengte en primaire structuur. In de context van een intact β-propellerdomein steken de 1-2 en 3-4 lussen boven één zijde van de β-bladen uit en de 2-3 lus steekt uit van de tegenoverliggende zijde (Fig. 5A). De 4-1 lus ligt ofwel op hetzelfde vlak als de 2-3 lus, ofwel kan dichter bij de β-plaatkern van de propeller worden geplaatst (Fig. 5). In subgroep 1 werden de langste 2-3 lussen gevonden in herhalingen 1, 5 en 6, met kortere lussen in bladen 2, 3 en 4. De langste 4-1 lus was die tussen herhalingen 5 en 6 (Fig. 3). In de context van een β-propeller suggereert dit dat de zijde van de propeller gevormd door herhalingen 5, 6 en 1 in het bijzonder betrokken kan zijn bij eiwitinteracties (zie Fig. 1C). In subgroep 2A waren de langste 2-3 lussen die in herhalingen 1 en 2, herhalingen 4 en 5 hadden tussenliggende 2-3 lussen en herhalingen 3 en 6 bevatten de kortste 2-3 lussen. De langste 4-1 lussen waren die tussen herhalingen 1 en 2, en herhalingen 3 en 4 (Fig. 4). Dit suggereert dat er een andere organisatie van bindingsplaatsen is in subgroep 2A β-propellers, met misschien twee bindvlakken gevormd door herhalingen 1 en 2, en herhalingen 4 en 5. Op het niveau van individuele opeenvolgingen, waren er ook specifieke voorbeelden van variatie van de standaard herhaalorganisatie die voor individuele proteã nen van functioneel belang zouden kunnen zijn. Bijvoorbeeld, NP_695002 in subgroep 2A heeft een ongewoon lange en sterk geladen 3-4 lus in repeat 1 en XP_ 040383 heeft een lange 3-4 lus in repeat 4 (Fig. 4).

Figuur 3
figuur 3

veelvoudige opeenvolgingsuitlijning van menselijke BTB/kelch proteã nen subgroep 1. De kelch-herhaaldomeinen van de 15 subgroep 1 BTB/kelch proteã nen werden in CLUSTALW afgestemd om een 50% – de consensusopeenvolging van het niveau van de identiteitsdrempel te produceren. De uitlijningen worden gepresenteerd voor elke herhaling, met de herhaaleenheid toegewezen volgens de 1GOF-structuur. De vier β-strengen in elke herhaling zijn van kleur gecodeerd zoals in Fig. 1A. Alignments worden gepresenteerd in Boxshade: het Zwarte in de schaduw stellen wijst op identieke aminozuren, het grijze in de schaduw stellen wijst op gelijkaardige aminozuren en de witte achtergrond wijst op ongerelateerde aminozuren.

Figuur 4
figuur 4

veelvoudige opeenvolgingsaanpassing van menselijke BTB/kelch proteã nen subgroep 2A. De kelch-herhaaldomeinen van de 10 subgroep 2A BTB/kelch proteã nen werden afgestemd in CLUSTALW om een 50% – de consensusopeenvolging van het niveau van de identiteitsdrempel te produceren. De uitlijningen worden gepresenteerd voor elke herhaling, met de herhaaleenheid toegewezen volgens de 1GOF-structuur. De vier β-strengen in elke herhaling zijn van kleur gecodeerd zoals in Fig. 1A. Alignments worden gepresenteerd in Boxshade: zwarte schaduw geeft identieke aminozuren aan, grijze schaduw geeft vergelijkbare aminozuren aan en witte achtergrond geeft niet-gerelateerde aminozuren aan.

Figuur 5
figuur 5

relaties van consensus kelch-motieven aan propeller blade structuur. A, zijaanzicht van de enige structuur van het propellerblad van galactose-oxidase (1GOF). β-strengen zijn kleurgecodeerd zoals in Fig. 1A en de nomenclatuur voor de intra – en interbladlussen is aangegeven. B, uitlijning van consensus kelch-motieven afgeleid van BTB / kelch-subgroepen 1 en 2A tot bladestructuur, waarbij onderscheid wordt aangetoond in de 2-3 lusgrootte en ladingsverdeling. De positie van elke β-streng wordt aangegeven.

we vonden ook dat de consensus sequenties voor de vouw onderscheidend waren tussen de twee subgroepen. De 50% identity consensus sequence van elke subgroep werd opnieuw afgestemd op de kelch-repeat unit om Gemiddelde 50% identity consensus sequences voor subgroep 1 en subgroep 2A af te leiden. deze motieven werden in kaart gebracht tegen de bekende bladstructuur van galactose oxidase (Fig. 5). De consensusmotieven omvatten zowel aminozuren van belang voor de vouw (die binnen de β-bundels worden gevestigd) als bepaalde aminozuren binnen lijnen, die zouden worden voorspeld om tot bindende interactie bij te dragen. De gemiddelde lengte van het motief was in subgroep 1 korter dan in subgroep 2A. De consensus van subgroep 2A zal naar verwachting een langere 2-3 lus bevatten. De consensusmotieven waren verschillend in de positionering van sterk geconserveerde geladen residuen binnen de lusgebieden (Fig. 5). De bewaring van deze geladen residuen was het meest uitgesproken in subgroep 1, waar deze posities in het motief werden behouden tot het 70% – niveau van de identiteitsdrempel (gegevens niet getoond). Deze verschillen in luskenmerken zijn ook suggestief van verschillende modaliteiten van eiwit-eiwitinteractie voor de β-propellers van subgroepen 1 en 2A. Met betrekking tot eerder gekarakteriseerde eiwitbindende eigenschappen merkten we op dat de BTB/kelch-eiwitten die aan actine binden, verdeeld waren tussen subgroepen 1 en 3; Deze functie heeft dus geen eenvoudige relatie met de primaire structuur (Fig. 2 bis).

Kelch-repeat proteïnen gecodeerd in ongewervelde genomen

we wilden de evolutionaire ontwikkeling van kelch-repeat proteïnen vergelijken tussen mensen en moderne ongewervelde dieren, en herhaalden zo de analyse van kelch-repeat proteïnen en hun structurele subgroepen gecodeerd in de genomen van D. melanogaster, A. gambiae en C. elegans . We identificeerden 18 kelch-repeat proteã nen gecodeerd in de genomen van Drosophila en Anopheles (Tabel 2). Zeventien hiervan waren orthologen die bewaard werden tussen de twee soorten (De gemiddelde identiteit tussen de orthologe genen van D. melanogaster en A. gambiae is 56 % ) en één was uniek voor elke soort. Zo werd een Actinfilinehomoloog geïdentificeerd in A. gambiae maar niet in D. melanogaster en het D. melanogaster genoom bevatte een homoloog van NP_116164 die niet aanwezig was in A. gambiae (Tabel 2). Slechts drie kelch-repeat proteã NEN werden eerder gekarakteriseerd in D. melanogaster, namelijk Kelch, Muskeline en Drosophila gastheercelfactor . Twee andere, diablo en scruin-achtige op de middellijn (SLIM-1), zijn herkend als kelch-repeat proteïnen .

Tabel 2 Kelch-herhalingseiwitten van D. melanogaster en A. gambiae

binnen de groep van 19 proteã NEN EN hypothetische proteã nen, bevatte 95% zes kelch-herhalingen. Slechts één eiwit met vijf kelch-herhalingen werd geïdentificeerd in ofwel D. melanogaster of A. gambiae, wat overeenkwam met een ortholoog van het humane F-box/kelch-eiwit, XP_048774 (Tabel 2). 56 % van de kelch-repeat proteã nen van D. melanogaster en A. gambiae waren BTB/kelch proteã nen. Zowel D. melanogaster als A. gambiae bevatten één discoïdin / kelch-eiwit orthologe aan muskeline, één F-box / kelch-eiwit, drie kelch-en multidomain-eiwitten, één kelch – en unieke proteïne en twee propeller-only-eiwitten. Aldus, hadden alle 19 geà dentificeerde kelch-repeat proteã nen homologen in het menselijke genoom en was de BTB/kelch domeinarchitectuur het meest overwegend (Tabel 2).

we identificeerden 16 kelch-repeat proteïnen gecodeerd in het genoom van C. elegans (Tabel 3). Van deze eiwitten zijn alleen kel-1, spe-26 en CeHCF functioneel gekarakteriseerd. Kel-1 is een intracellulaire proteã ne die betrokken is bij de regulering van het voedselgedrag tijdens de larvale ontwikkeling . Spe-26 draagt bij aan de cellulaire organisatie van spermatocyten en mutaties worden geassocieerd met steriliteit . CeHCF kan betrokken zijn bij de regulering van celproliferatie . 43.7 % (7/16) van de proteã nen had de BTB/kelch domeinarchitectuur, twee waren homologen van HCF en attractin met gelijkaardige multidomainarchitecturen, twee bevatten unieke opeenvolgingen buiten de kelch herhalingen en twee waren propeller-enige proteã nen, die beide werden voorspeld om zesbladige β-propellers te vormen. Een enkel F-box / kelch-eiwit werd geïdentificeerd, maar er werd geen muskeline-achtig eiwit gevonden (Tabel 3). In plaats daarvan werden twee hypothetische proteã nen met onderscheidende domeinarchitecturen geà dentificeerd : NP_506605 die ook een cyclin carboxy-terminal domein bevatte (CDD 7965, Pfam 02984, SMART 00385) en NP_506602, dat een RING domein bevatte (CDD 8941, Pfam 00097, SMART 00184). Het cyclin carboxy-einddomein vormt een α-spiraalvormige vouw die een eiwitinteractieplaats kan vormen . Het RINGSDOMEIN is een zink-vingervouw die eiwit-eiwitinteractie bemiddelt .

Tabel 3 Kelch-repeat proteïnen van C. elegans

Kelch-repeat proteïnen gecodeerd in gistgenomen

verschillende kelch-repeat proteïnen zijn functioneel bestudeerd in ontluikende en splijtingsgist, maar geen van deze komen overeen met BTB/kelch proteïnen . We onderzochten of de prevalentie van de BTB/kelch domeinarchitectuur die we bij meercellige dieren hadden geïdentificeerd, zich uitstrekte tot gist, door de complement van kelch-repeat proteïnen te analyseren die gecodeerd zijn in de genomen van S. pombe en S. cerevisiae . We ontdekten dat elk genoom een klein aantal kelch-repeat proteïnen codeerde (vijf in S. pombe, acht in S. cerevisiae), waarvan geen enkele overeenkwam met een BTB/kelch-eiwit (Tabel 4). Proteïnen en hypothetische proteïnen bestaande uit een amino-terminale kelch β-propeller en een uitgebreid gebied met opgerolde spoelen en een eiwit dat overeenkomt met een veronderstelde leucinecarboxylmethyltransferase waren gemeenschappelijk voor S. pombe en S. cerevisiae. De andere gecodeerde kelch-repeat proteïnen waren niet-homoloog (Tabel 4). Muskeline-achtig 1-eiwit en Ral-2p werden geïdentificeerd in S. pombe maar niet in S. cerevisiae . Twee eiwitten met ver verwante kelch-herhalingen, Gpb1/Krh1 en Gpb2 / Krh2, zijn functioneel gekarakteriseerd als G-eiwitgekoppelde receptorbindende eiwitten in S. cerevisiae . Homologe eiwitten werden niet geïdentificeerd in S. pombe in de context van onze studie. De BTB / kelch domeinarchitectuur werd dus niet geïdentificeerd in deze gisten.

Tabel 4 Kelch-herhalingseiwitten van S. cerevisiae en S. pombe

beperking van BTB / kelch-eiwitten tot metazoaanse dieren en poxvirussen

omdat de BTB / kelch-domeinarchitectuur in dieren voorkwam, maar niet werd geïdentificeerd in gist, waren we geïnteresseerd om te overwegen of andere organismen kelch-repeat-eiwitten zouden kunnen bevatten met deze domeinarchitectuur. Een aantal BTB / kelch proteã nen zijn gemeld als hypothetische open lezingskaders (ORFs) in de poxvirusfamilie van dierlijke virussen . De Conserved Domain Architecture Retrieval Tool (CDART) database op NCBI bevat 333 ingangen voor BTB/kelch eiwitten, die allemaal afkomstig zijn van gewervelde dieren, insecten, C. elegans of poxvirussen. Tot op heden is het BTB domein alleen geïdentificeerd in eucaryoten (Pfam 00651 species tree). Naast het bekijken van de SMART en Pfam soorten bomen voor categorisatie van de BTB / kelch domeinarchitectuur, hebben we onze eigen blastp en TBLASTX zoekopdrachten uitgevoerd van de A. thaliana genome database met de CDD kelch motif consensus (deze zoekmachine identificeerde 44 BTB / kelch eiwitten uit het menselijk genoom en is dus zeer effectief in het blootleggen van deze eiwitten) en identificeerde 72 eiwitsequenties, waarvan de meerderheid F-box/kelch eiwitten waren, waarvan sommige serine-threonine fosfatase/kelch eiwitten, en geen van die waren BTB/kelch eiwitten. Zoekopdrachten met de BTB domeinen van verschillende menselijke of ongewervelde kelch-repeat proteã nen identificeerden ook geen BTB/kelch proteã nen in A. thaliana. BLAST genomen zoekopdrachten van de databases van complete of gedeeltelijk gesequenced eucaryotische dier-en planten genomen bij NCBI (Entrez/genome_tree, ), die de volledig gesequenced genomen van het Apicomplexium Plasmodium falciparum , het Microsporidium Encephalitozoon cuniculi, de plant Oryza sativa (rijst; ) en de schimmel Neurospora crassa identificeerde veel voorspelde kelch-repeat-bevattende eiwitten, maar geen ORFs die de BTB/kelch domeinarchitectuur hadden. Resultaten voor geselecteerde domeinarchitecturen in vijf eucaryotische organismen worden gepresenteerd in Fig. 6. Bij Apicomplexiesoorten noteerden we echter twee eiwitten met K Tetra / kelch domeinarchitectuur (NP_705330 en EAA22466). Het K tetra-domein (Pfam 02214) is een verre structurele verwant van het BTB/POZ-domein . Globaal, verstrekken deze resultaten een significante aanwijzing dat eiwit-codeert opeenvolgingen voor de BTB/kelch domeinarchitectuur tijdens de evolutie van multicellular dieren, in vergelijking met Apicomplexia, schimmels, installaties en andere eucaryotes zijn uitgebreid.

Figuur 6
figuur 6

prevalentie van geselecteerde kelch-herhaal eiwitdomeinarchitecturen in eucaryotes. De staafdiagrammen vertegenwoordigen het aantal kelch-repeat proteã nen met de aangegeven domeinarchitecturen gecodeerd in de proteomen van H. sapiens (Hs), D. melanogaster (Dm), C. elegans (Ce), S. pombe (Sp) en A. thaliana (At).

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.