2020/12 actualizare
vă rugăm să consultați Kraken 2 GitHub Wiki pentru toate actualizările în mișcare înainte. Suntem în curs de a muta toate informațiile/linkurile relevante către pagina Wiki Github. Mulțumesc pentru răbdare.
începând cu septembrie 2020, am creat un site de servicii Web Amazon pentru a găzdui mulți dintre cei mai folosiți indici Kraken2, disponibili la https://github.com/BenLangmead/aws-indexes.
KrakenTools este o suită de script-uri pentru a ajuta la analiza rezultatelor Kraken. KrakenTools este un proiect în curs de desfășurare condus de Jennifer Lu. Vă rugăm să consultați pagina web KrakenTools pentru mai multe detalii.
despre Kraken 2
Kraken 2 Este cea mai nouă versiune a Kraken, un sistem de clasificare taxonomică care utilizează potriviri exacte k-mer pentru a obține o precizie ridicată și viteze rapide de clasificare. Acest clasificator se potrivește cu fiecare k-mer dintr-o secvență de interogare cu cel mai mic strămoș comun (LCA) din toate genomii care conțin k-mer dat. Sarcinile k-mer informează algoritmul de clasificare. .
Kraken 2 oferă îmbunătățiri semnificative pentru Kraken 1, cu timpi mai rapizi de construire a bazelor de date, dimensiuni mai mici ale bazelor de date și viteze de clasificare mai rapide. Aceste îmbunătățiri au fost realizate prin următoarele actualizări ale programului de clasificare Kraken:
- depozitarea Minimizatoarelor: în loc să stocheze/interogheze întregul k-mers, Kraken 2 stochează minimizatoare (l-mers) ale fiecărui k-mer. Lungimea fiecărui l-mer trebuie să fie egală cu lungimea k-mer. Fiecare k-mer este tratat de Kraken 2 ca și cum LCA-ul său este același cu LCA-ul minimizatorului său.
- introducerea semințelor distanțate: Kraken 2 folosește, de asemenea, semințe distanțate pentru a stoca și a interoga minimizatoarele pentru a îmbunătăți precizia clasificării.
- Structura Bazei De Date: În timp ce Kraken 1 a salvat o listă indexată și sortată de perechi k-mer/LCA, Kraken 2 folosește un tabel hash compact. Acest tabel hash este o structură de date probabilistică care permite interogări mai rapide și cerințe de memorie mai mici. Cu toate acestea, această structură de date are o șansă <1% de a returna LCA incorect sau de a returna un LCA pentru un minimizator neinserat. Utilizatorii pot compensa această posibilitate folosind pragurile de notare a încrederii Kraken.
- baze de date proteice: Kraken 2 permite baze de date construite din secvențe de aminoacizi. Când este interogat, Kraken 2 efectuează o căutare tradusă în șase cadre a secvențelor de interogare împotriva bazei de date.
- 16S baze de date: Kraken 2 oferă, de asemenea, suport pentru baze de date care nu se bazează pe taxonomia NCBI. În prezent, acestea includ bazele de date 16S: Greengenes, SILVA și RDP.