- ihmisen genomiin koodattujen Kelch-toistuvien proteiinien tunnistaminen ja luonnehdinta
- ihmisen kelch-toistoproteiinien Kromosomipaikkaus
- ihmisen Kelch-toistoproteiinien Domeeniarkkitehtuuri
- ihmisen BTB/kelch-proteiinien rakenteelliset suhteet
- Kelch-toistoproteiinit koodattu selkärangattomiin genomeihin
- hiivagenomeihin
- BTB/kelch-proteiinien rajoittaminen metatsoaanieläimiin ja rokaviruksiin
ihmisen genomiin koodattujen Kelch-toistuvien proteiinien tunnistaminen ja luonnehdinta
ihmisen genomiin, BLASTIIN ja PSI-BLASTIIN koodattujen kelch-toistuvien proteiinien tunnistamiseksi ihmisen genomin ennustettu proteiinitietokanta toteutettiin Kelch-motif konsensuksella (CDD543, PFAM01344, Smart 00612) kyselysekvenssinä. Haussa tunnistettiin 57 kelch-toistoproteiinia ja hypoteettisia proteiineja. Huomasimme, että useita tunnettuja ihmisen kelch-toistoproteiineja ei tunnistettu tällä menetelmällä, luultavasti siksi, että jokaisessa kelch-motiivissa on suhteellisen vähän konsensusjäämiä, joista yksikään ei ole täysin invariantti kaikissa Motifin esimerkeissä, ja myös siksi, että β-säikeiden välisten silmukoiden pituudet vaihtelevat . Siksi etsinnät jatkuivat Kaikkien 28 tunnetun superperheen jäsenen kelch-toistoilla, kuten menetelmissä on kuvattu. Näissä etsinnöissä tunnistettiin 18 muuta ihmisen perimään koodattua kelch-toistoproteiinia. Kaikkien 75 nimikkeen vertaaminen Genbankiin osoitti 9 nimitystä osittaisiksi sekvensseiksi ja / tai päällekkäisiksi saman proteiinin tai hypoteettisen ORF: n nimityksiksi ja kaksi nimitystä ei-Kelch-proteiineiksi. Vertasimme hakutuloksia myös kelchin verkkotunnusmerkintöihin Pfam-ja SMART domain-tietokannoissa. Monet merkinnät oli lueteltu sekä SMART-että Pfam-tietokannoissa, mutta useita tunnistamiamme proteiineja ei mainittu näissä tietokannoissa (taulukossa 1), vaikka kelch-motiivit tunnistettiin selvästi, kun näitä polypeptidejä tutkittiin SMART-tai Pfam-geenejä vastaan. Lisäksi H. sapiensille osoitettujen kelch-toistoproteiinien määrä Pfam: n ja SMART: n lajipuussa tai Taxbreak-yhteyksissä oli yliarvioitu, koska samaan polypeptidiin oli sisällytetty epätäydellisiä ORF: iä ja useita merkintöjä. Teimme Genbankista lisähakuja 28 tunnetusta kelch-toistoproteiinista, jotka olivat selvästi pidempiä kuin CDD kelch-motif konsensus, etsiäksemme laajemmin proteiineja, jotka sisältävät enemmän poikkeavia toistoja. Näistä useista arvioinneista ja lukuun ottamatta osittaisia sekvenssejä (kuten menetelmissä on kuvattu), tunnistimme ainakin 71 ihmisen genomiin koodattua kelch-toistoproteiinia (Taulukko 1).
jotta voitiin määrittää toistuvien kelch-motiivien määrä kussakin proteiinissa tai hypoteettisessa proteiinissa, BLASTP-hakuja tehtiin kunkin sekvenssin kanssa käyttäen suojattua Verkkotunnustietokantaa (CDD) ja Pfam: ää sekä kelch-motiivien manuaalista tunnistamista. Tunnistettujen kelch-motiivien määrä vaihteli kahdesta seitsemään. Neljä terää on β-potkuridomeenien kiderakenteista dokumentoitu minum-luku . Näin ollen vaikutti epätodennäköiseltä, että kahta tai kolmea kelch-motiivia koodaavat merkinnät vastaisivat täydellisiä ORF: iä, ja nämä jätettiin jatkoanalyysin ulkopuolelle (nimikkeet NP-689579, XP_209285, XP_058629). Tällä perusteella 12,7%: n (9/71) jaksoista ennustettiin sisältävän viisiteräisiä β-potkureita, 84,5%: n (60/71) kuusiteräisiä ja 2,8%: n (2/71) seitsenteräisiä β-potkureita (Taulukko 1). Tietääksemme aiemmin on tunnistettu vain yksi seitsenlapainen kelch-toisioproteiini, sieni-galaktoosioksidaasi .
galaktoosioksidaasissa, yksittäisessä kelch-toistoproteiinissa, josta on kiderakennetiedot, potkuri kiertyy muodostaen komposiittisen seitsemännen terän, jossa β-oni-β – kolmijuoste on saatu kaikkein C-terminaalisesta sekvenssin toistosta ja β-nelijuoste sekvenssin amino-terminaalisesta ensimmäisestä täyden sekvenssin toistosta, mekanismia kutsutaan ”N-terminaaliseksi β-säikeeksi” (Kuva. 1C). Tutkimme ihmisen kelch-toistoproteiineja β-arkkien sekundaarirakenneennustuksella ja sekvenssin toistojen manuaalisella analyysillä ja huomasimme, että 77,5%: n (55/71) proteiineista β-potkurirakenteen ennustettiin sulkeutuvan C-terminaalisella β-juosteella. Viiden jakson osalta ei voitu tehdä selvää ennustetta (Taulukko 1).
ihmisen kelch-toistoproteiinien Kromosomipaikkaus
ihmisen kelch-toistoproteiinien koodaussekvenssit ovat hajallaan koko genomissa ja sijaitsevat kaikissa kromosomeissa lukuun ottamatta kromosomia 21 ja Y-kromosomia (Taulukko 1). Useita fysikaalisen läheisyyden geenejä havaittiin, esimerkiksi np_006460 ja NP_067646 kohdassa 1q31.3 ja NP_569713 ja NP_060114 kohdassa 3q27.3 (taulukko 1). Useimmissa tapauksissa nämä eivät kuitenkaan vastanneet lähisukulaisimpia proteiinisekvenssejä, kuten vastikään kahdentuneilla geeneillä voisi olettaa. Yksi poikkeus olivat np_055130 ja NP-751943, jotka sijaitsivat 14q21.3: ssa ja jotka olivat läheisintä sukua toisilleen (46% identiteetti). Kaiken kaikkiaan ei ollut näyttöä Kelch-proteiinia koodaavien sekvenssien fyysisestä ryhmittelystä ihmisen genomissa. Sen sijaan A. thalianan lukuisia F-box/kelch-proteiineja koodaavat geenit ovat ryhmittyneet siten, että osa erittäin samankaltaisista sekvensseistä koodataan fyysisesti läheisistä genomipaikoista .
ihmisen Kelch-toistoproteiinien Domeeniarkkitehtuuri
kaksikymmentäkahdeksan eri eliöiden Kelch-toistoproteiinia oli aiemmin ryhmitelty 5 rakennekategoriaan Kelch-toistojen sijoittumisen polypeptidisekvenssin sisällä ja muiden säilyneiden rakenteellisten domeenien läsnäolon mukaan . Jotta voitiin arvioida toimialueen arkkitehtuurien monimutkaisuutta yhden organismin sisällä, jokainen ihmisen kelch-repeat-proteiinisekvenssi analysoitiin uudelleen etsimällä CDD: tä, Smartia ja Pfam: ää ja sitten aliryhmitettiin toimialueen arkkitehtuurin mukaan.
silmiinpistävästi 72 % (51/71) ihmisen kelch-toistoproteiineista sisälsi BTB / POZ-domeenin. Kaikissa proteiineissa yhtä lukuun ottamatta BTB-domeeni oli aminoterminaalinen kelchin domeeniin nähden (Taulukko 1). Tämä hypoteettinen proteiini, LZTR-1, sisälsi kaksi tandem BTB-domeenia. Neljä (5, 6%) kelch-toistoproteiinia sisälsi yhden ylimääräisen säilyneen domeenin. Muskeliini oli ainoa ihmisen perimästä tunnistettu kelch-toistoproteiini, joka sisältää diskoidiinidomeenin (CDD 7753, Pfam 00231, SMART 00231, tunnetaan myös nimellä F5/F8 C-tyypin domeeni) (valmisteilla oleva Prag, Collett ja Adams). Disidiinidomeeni toimii proteiini-proteiini-interaktiodomeenina useissa solunulkoisissa ja solunsisäisissä proteiineissa ja välittää fosfolipidisitoutumista hyytymistekijöissä V ja VIII . Toinen kelch-proteiini, XP_048774, sisälsi F-box-domeenin (CDD9197, Pfam 00646). F-box on noin neljänkymmenen jäännöksen domeeni, joka on ensin tunnistettu sykliini A: ssa, joka vuorovaikuttaa Skp1: n kanssa ankkuroidakseen proteiinit ubikitiini-ligaasikokoonpanoon ubikitinaatiota varten ja kohdentaakseen ne proteosomivälitteiseen hajoamiseen . F-box-ja kelch-repeat-domeenien yhdistelmä on aiemmin kuvattu A. thalianassa, jossa ainakin 67 F-box/kelch-proteiinia ja hypoteettisia proteiineja koodataan genomiin . Useat näistä toimivat vuorokausikellon valosta riippuvaisessa säätelyssä, mutta monien muiden toiminta on hämärän peitossa . Tietääksemme tämä on ensimmäinen F-box/kelch-proteiinin tunnistus eläimen perimässä. Yksi ennustettu kelch-toistuva proteiini, NP_055608, sisälsi leusiinikarboksyylimetyylitansferaasin (LCM) domeenin (CDD9631, PFAM 04072), jonka identiteetti on 34% proteiinifosfataasi 2: n leusiinikarboksyylimetyylitransferaasin LCM-domeenista . Rekombinaatiota aktivoiva geeni-2 (RAG-2) sisältää kasvin homeodomain (PHD) finger domain (Pfam00628) karboksyyliterminaalissa .
kuusi kelch-toistoproteiinia (11 %) oli hyvin suuria moniarvoisia proteiineja (Taulukko 1). Attractin / mahonki (jotka ovat liitosvariantteja yhdestä geenistä; 27-29) ja MEGF8 ovat kumpikin yli 1000 aminohapon pituisia ja sisältävät CUB-domeenin, kelch toistaa, C-tyypin lektiinidomeenin ja EGF: n kaltaiset domeenit. Attraktiinilla ja mahongilla on useita eri toimintoja, joihin kuuluu rooli T-solujen yhteisvaikutuksissa (attraktiini, erittyvä liitosvariantti) ja lihavuuden säätelyssä hiirillä (mahonki, transmembraani-liitosvariantti) . Isäntäsolutekijä-1 ja -2 (HCF-1 ja HCF-2) ovat myös suuria proteiineja, jotka sisältävät aminoterminaalisia kelch-toistoja, kahta fibronektiinityypin III domeenia ja HCF-1: n tapauksessa sarjan ainutlaatuisia HCF-toistoja. Nämä proteiinit toimivat herpes simplex-viruksen transkriptiokoaktivaattoreina välittömästi varhaisen geeniekspression aikana .
tunnistimme kolme hypoteettista kelch-toistoproteiinia, jotka sisälsivät toisiinsa liittymättömiä ainutlaatuisia sekvenssejä, jotka eivät vastanneet tunnustettuja rakenteellisia domeeneja ja jotka oli sijoitettu joko amino – tai karboksipäätteisiin kelch-toistoihin (Taulukko 1).
Rab9 effector p40 ja kuusi muuta kelch-toistoproteiinia olivat lyhyitä 350-442 aminohapon pituisia polypeptidejä, jotka koostuivat lähes kokonaan kelch-toistoista (Taulukko 1). Viisi näistä proteiineista eli hypoteettisista proteiineista, mukaan lukien p40, sisälsi kuusi peräkkäistä toistoa, joten niiden ennustetaan muodostavan kuusiteräisiä β-potkureita. Kaksi hypoteettista proteiinia, NP_060673 ja XP_114323, koostuivat oletetuista seitsenlapaisista β-potkureista. Yhdessä nämä rakenteelliset erot muodostavat perustan ihmisen kelch-toistoproteiinien uudelle luokittelulle, joka esitetään tässä (Taulukko 1).
ihmisen BTB/kelch-proteiinien rakenteelliset suhteet
odottamattoman suuri määrä BTB/kelch-proteiineja, jotka on koodattu ihmisen genomiin, sai meidät tutkimaan tätä ryhmää yksityiskohtaisemmin, tavoitteena tunnistaa rakenteellisia alaryhmiä, jotka saattavat edustaa myös toiminnallisia alaryhmiä. Ne 38 täysmittaista jaksoa, jotka sisälsivät yksittäisiä BTB-verkkotunnuksia ja ennustivat kuusiteräisiä β-potkureita, olivat linjassa clustalw: n sekvenssien samankaltaisuuden mukaan ja niitä pidettiin lähiliittymäpuina. Yhdenmukaistaminen kokopitkä sekvenssit paljasti kolme alaryhmiä, jotka ovat suunnilleen samankokoisia, joita me kutsutaan alaryhmiä 1-3 (Kuva. 2 A). Kun sama analyysi tehtiin kelchin domeeneilla yksin, sama ryhmittely oli ilmeinen aliryhmälle 1 ja huomattavalle osalle aliryhmästä 2, jota kutsutaan aliryhmäksi 2A(Kuva. 2b). Vuonna yhdenmukaistaminen BTB verkkotunnuksia vain, alaryhmät 1 ja 2 säilyivät useimpien sekvenssien (Fig. 2C). Sekvenssien enimmäispaljousanalyysiin perustuvalla erillisellä linjausmenetelmällä (PROTPARS) tuotetut juurettomat puut eivät tukeneet alaryhmää 3, mutta osoittivat alaryhmien 1 ja 2a jaksojen välisen suhteen johdonmukaisesti (tietoja ei näy). Keskityimme näihin robustly-related kelch-toista sekvenssejä alaryhmien 1 ja 2a, tarkempi analyysi kelch-toista verkkotunnuksia.
Kelch-repeat-verkkotunnusten monijaksoinen linjaus kustakin alaryhmästä 1 ja 2a osoitti toistuvia organisaatioita koskevia erityispiirteitä. Molemmissa alaryhmissä (Kuva. 3 ja viikuna. 4), β-säikeiden 2 ja 3 välinen intrablade-silmukka (2-3-silmukka, Kuva. 5A) ja interblade 4-1-silmukka olivat merkittäviä vaihtelun lähteitä toistojen sisällä niiden pituuden ja primäärirakenteen suhteen. Ehjän β-potkuridomaanin yhteydessä 1-2-ja 3-4-silmukat työntyvät β-levyjen toisen sivun yläpuolelle ja 2-3-silmukka työntyy vastakkaisesta pinnasta (Kuva. 5 A). 4-1-silmukka sijaitsee joko samalla pinnalla kuin 2-3-silmukka, tai se voi sijaita lähempänä potkurin β-arkin ydintä (Kuva. 5). Alaryhmässä 1 pisimmät 2-3 silmukat löytyivät toistoissa 1, 5 ja 6, lyhyemmät silmukat terissä 2, 3 ja 4. Pisin 4-1 silmukka oli, että välillä toistaa 5 ja 6 (Kuva. 3). Β-potkurin yhteydessä tämä viittaa siihen, että toistojen 5, 6 ja 1 muodostama potkurin sivu voi osallistua erityisesti proteiinien vuorovaikutuksiin (KS. 1C). Aliryhmässä 2a pisimmät 2-3 silmukat olivat toistoissa 1 ja 2, toistoissa 4 ja 5 oli väli 2-3 silmukkaa ja toistoissa 3 ja 6 lyhimmät 2-3 silmukkaa. Pisimmät 4-1 silmukat olivat toistojen 1 ja 2 välillä sekä toistojen 3 ja 4 (Kuva. 4). Tämä viittaa siihen, että alaryhmässä 2A β-potkureissa on erilainen sidontapaikkojen organisaatio, jossa ehkä kaksi sidontapintaa muodostuu toistoista 1 ja 2 sekä toistoista 4 ja 5. Yksittäisten sekvenssien tasolla oli myös erityisiä esimerkkejä standardikertausorganisaatiosta poikkeamisesta, jolla saattoi olla funktionaalista merkitystä yksittäisille proteiineille. Esimerkiksi aliryhmässä 2A NP_695002 on harvinaisen pitkä ja erittäin latautunut 3-4-silmukka toistossa 1 ja XP_ 040383 on pitkä 3-4-silmukka toistossa 4 (Kuva. 4).
olemme myös havainneet, että konsensus sekvenssit kansi oli erottuva kahden alaryhmiä. Kunkin aliryhmän 50%: n identiteettikonsensusjärjestys kohdistettiin kelch-toistoyksikköön, jolloin saatiin keskimääräiset 50%: n identiteettikonsensussekvenssit alaryhmälle 1 ja aliryhmälle 2a. nämä motiivit yhdistettiin galaktoosioksidaasin tunnettuun terärakenteeseen (Kuva. 5). Konsensusaiheisiin kuuluivat sekä taitoksen kannalta tärkeät aminohapot (jotka sijaitsevat β-säikeiden sisällä) että tietyt silmukoissa olevat aminohapot, joiden ennustettiin edistävän sitovia vuorovaikutuksia. On huomattava, että Motifin keskimääräinen pituus oli aliryhmässä 1 lyhyempi kuin aliryhmässä 2A. Aliryhmän 2A konsensuksen ennustetaan sisältävän pidemmän 2-3 silmukan. Konsensusaiheet erosivat toisistaan suuresti säilyneiden varattujen jäämien sijoittamisessa silmukkaalueiden sisällä(kuva. 5). Näiden varautuneiden jäämien säilyminen oli selvintä alaryhmässä 1, jossa nämä sijainnit säilyivät motiivissa 70 prosentin tunnistettavuuden raja-arvolle (tietoja ei näy). Nämä loop-ominaisuuksien erot viittaavat myös proteiinien ja proteiinien yhteisvaikutusten erilaisiin modaliteetteihin alaryhmien 1 ja 2a β-propelleilla. Aiemmin karakterisoitujen proteiineihin sitoutuvien ominaisuuksien osalta havaitsimme, että aktiiniin sitoutuvat BTB / kelch-proteiinit jakautuivat alaryhmiin 1 ja 3; näin ollen tällä funktiolla ei ole yksinkertaista suhdetta primäärirakenteeseen (Fig. 2 A).
Kelch-toistoproteiinit koodattu selkärangattomiin genomeihin
halusimme verrata kelch-toistoproteiinien evolutiivista kehitystä ihmisen ja nykyisten selkärangattomien välillä, ja niin toistimme Kelch-toistoproteiinien ja niiden rakenteellisten alaryhmien analyysin, jotka koodattiin D. melanogasterin, A. gambiaen ja C: n genomeihin. elegaaneja . Tunnistimme 18 kelch-toistoproteiinia, jotka on koodattu Drosophila-ja Anopheles-genomeihin (Taulukko 2). Näistä seitsemäntoista oli ortologisia säilyneitä kahden lajin välillä (keskimääräinen identiteetti D. melanogasterin ja A. gambiaen ortologisten geenien välillä on 56 % ) ja yksi oli ainutlaatuinen kullekin lajille. Näin Aktinfiliinihomologue tunnistettiin A. gambiaesta, mutta ei D. melanogasterista ja D. melanogasterin genomi sisälsi homologian np_116164, jota ei ollut A. gambiaessa (Taulukko 2). D: ssä oli aiemmin kuvattu vain kolme kelch-toistoproteiinia. melanogaster eli Kelch, Muskelin ja Drosophila isäntäsolutekijä . Kaksi muuta, Diablo ja scruin-tyyppinen keskiviivalla (SLIM-1), on tunnistettu kelch-toistoproteiineiksi .
19 proteiinin ja hypoteettisten proteiinien ryhmästä 95 % sisälsi kuusi kelch-toistoa. Vain yksi proteiini, jossa oli viisi kelch-toistoa, tunnistettiin joko D. melanogasterista tai A. gambiaesta, joka vastasi Ihmisen F-box/kelch-proteiinin ortologiaa, XP_048774 (Taulukko 2). D. melanogasterin ja A. gambiaen kelch-toistoproteiineista 56 % oli BTB / kelch-proteiineja. Sekä D. melanogaster että A. gambiae sisälsivät yhden muskeliinille ortologisen diskoidin/kelch-proteiinin, yhden F-box / kelch-proteiinin, kolme kelch-ja multidomain-proteiinia, yhden kelch-ja unique-proteiinin ja kaksi potkuriproteiinia. Näin ollen kaikilla tunnistetuilla 19 kelch-toistoproteiinilla oli homologeja ihmisen genomissa ja BTB / kelch-domeeniarkkitehtuuri oli yleisin (Taulukko 2).
tunnistimme 16 kelch-toistoproteiinia, jotka on koodattu C. elegansin genomiin (Taulukko 3). Näistä proteiineista vain kel-1, spe-26 ja CeHCF on toiminnallisesti karakterisoitu. Kel-1 on solunsisäinen proteiini, joka osallistuu ruokintakäyttäytymisen säätelyyn toukkakehityksen aikana . Spe-26 edistää spermatosyyttien soluorganisaatiota ja mutaatiot liittyvät steriiliyteen . Cehcf saattaa osallistua solujen proliferaation säätelyyn . 43.Proteiineista 7%: lla (7/16) oli BTB / kelch-domeeniarkkitehtuuri, kaksi oli HCF: n ja attractinin homologeja, joilla oli samanlaiset monialuearkkitehtuurit, kaksi sisälsi ainutlaatuisia sekvenssejä kelch-toistojen ulkopuolella ja kaksi pelkästään potkuriproteiineja, joiden molempien ennustettiin muodostavan kuusiteräisiä β-potkureita. Yksi F-box / kelch-proteiini tunnistettiin, mutta myskeliinin kaltaista proteiinia ei löytynyt (Taulukko 3),. Sen sijaan tunnistettiin kaksi hypoteettista proteiinia, joilla oli tunnusomaisia domeeniarkkitehtuureja : NP_506605, joka sisälsi myös sykliinikarboksipäätetunnuksen (CDD 7965, Pfam 02984, SMART 00385) ja NP_506602, joka sisälsi RENGASTUNNUKSEN (CDD 8941, Pfam 00097, SMART 00184). Sykliinikarboksin terminaalinen domeeni muodostaa α-kierteisen poimun, joka voi muodostaa proteiinin interaktiokohdan . RENGASDOMEENI on sinkki-sormipoimu, joka välittää proteiinin ja proteiinin välisiä vuorovaikutuksia .
hiivagenomeihin
koodattuja Kelch-toistoproteiineja on tutkittu useita Kelch-toistoproteiineja toiminnallisesti orastavassa ja fissiohiivassa, mutta mikään näistä ei vastaa BTB/kelch-proteiineja . Selvitimme, esiintyikö tunnistamamme BTB/kelch-verkkotunnuksen esiintyvyys monisoluisissa hiivaan ulottuvissa eläimissä analysoimalla S. pombe-ja S. cerevisiae-genomeihin koodattujen Kelch-toistoproteiinien komplementtia . Havaitsimme, että jokainen genomi koodasi pienen määrän kelch-toistoproteiineja (viisi S. pombessa, kahdeksan S. cerevisiae), joista yksikään ei vastannut BTB/kelch-proteiinia (Taulukko 4). Proteiinit ja hypoteettiset proteiinit, jotka koostuvat aminoterminaalisesta kelch-β-potkurista ja pidennetystä kelttialueesta sekä oletettua leusiinikarboksyylimetyylitransferaasia vastaavasta proteiinista, olivat yhteisiä S. pombelle ja S. cerevisiaelle. Muut koodatut kelch-toistoproteiinit eivät olleet homologisia (Taulukko 4). Muskeliinin kaltaista 1-proteiinia ja Ral-2p: tä tunnistettiin S. pombesta, mutta ei S. cerevisiaesta . Kaksi proteiinia, joilla on kaukaisia Kelch-toistoja, Gpb1/Krh1 ja Gpb2 / Krh2, on kuvattu toiminnallisesti g-proteiineihin kytkettyinä reseptoreita sitovina proteiineina S. cerevisiaessa . Homologisia proteiineja ei havaittu S. pombessa tutkimuksemme yhteydessä. BTB / kelch – verkkotunnusarkkitehtuuria ei siis tunnistettu näissä hiivoissa.
BTB/kelch-proteiinien rajoittaminen metatsoaanieläimiin ja rokaviruksiin
koska BTB / kelch-domeeni-arkkitehtuuri oli yleistä eläimillä, mutta sitä ei tunnistettu hiivassa, olimme kiinnostuneita pohtimaan, voisiko jokin muu organismi sisältää kelch-toistoproteiineja tämän domeenin arkkitehtuurin kanssa. Useita BTB / kelch-proteiineja on raportoitu hypoteettisina avoimina lukukehyksinä (ORFS) eläinvirusten poxvirusperheessä . NCBI: n Conserved Domain Architecture Retrieval Tool (CDART) – tietokanta listaa 333 kohtaa BTB/kelch-proteiineille, jotka kaikki ovat peräisin selkärankaisista, hyönteisistä, C. elegans-bakteereista tai poxviruksista. Tähän mennessä BTB-verkkotunnus on tunnistettu vain eukaryooteissa (Pfam 00651 species tree). Sen lisäksi, että tarkastelimme SMART-ja Pfam-lajipuita BTB/kelch-domainarkkitehtuurin luokittelua varten, teimme omat BLASTP – ja TBLASTX-hakumme A: sta. thalianan genomitietokanta CDD kelch motif-konsensuksella (tämä hakutyökalu tunnisti 44 BTB / kelch-proteiinia ihmisen genomista ja on siten erittäin tehokas näiden proteiinien paljastamisessa) ja tunnisti 72 proteiinisekvenssiä, joista suurin osa oli F-box/kelch-proteiineja, joista osa oli seriini-treoniinifosfataasi/kelch-proteiineja, eikä yksikään ollut BTB/kelch-proteiineja. Useiden ihmisten tai selkärangattomien kelch-toistoproteiinien BTB-domeeneilla tehdyt haut eivät myöskään tunnistaneet A. thalianan BTB/kelch-proteiineja. NCBI: n (Entrez/genome_tree,) täydellisten tai osittain sekvensoitujen eukaryoottisten eläin-ja kasvigenomien tietokannoista tehdyissä BLAST genomitutkimuksissa, joihin sisältyivät Apicomplexium Plasmodium falciparum-bakteerin , Microsporidium Encephalitozoon cuniculi-kasvin , Oryza sativa-kasvin (riisi; ) ja sienen Neurospora crassan täysin sekvensoidut genomit, tunnistettiin monia ennustettuja Kelch-toistoa sisältäviä proteiineja, mutta ei ORF-yhdisteitä, joilla olisi ollut BTB/kelch-verkkotunnuksen arkkitehtuuri. Viiden eukaryoottisen eliön valittujen verkkotunnusarkkitehtuurien tulokset esitetään kuvassa. 6. Havaitsimme kuitenkin Apicomplexia-lajeissa kaksi proteiinia, joissa on K Tetra /kelch-domeeni-arkkitehtuuri (NP_705330 ja EAA22466). K tetra-domeeni (pfam 02214) on BTB/POZ-domeenin kaukainen rakenteellinen sukulainen . Kaiken kaikkiaan nämä tulokset ovat merkittävä osoitus siitä, että BTB/kelch-verkkotunnusarkkitehtuurin proteiineja koodaavat sekvenssit ovat monisoluisten eläinten evoluution aikana laajentuneet verrattuna Apikompleksiaan, sieniin, kasveihin ja muihin eukaryootteihin.