Kraken2

2020/12 opdatering

der henvises til Kraken 2 Github for alle opdateringer bevæger sig fremad. Vi er i færd med at flytte alle relevante oplysninger/links til Github-siden. Tak for din tålmodighed.

fra September 2020 har vi oprettet en hjemmeside til at være vært for mange af de mest anvendte kraken2-indekser, der er tilgængelige på https://github.com/BenLangmead/aws-indexes.

KrakenTools er en pakke af scripts til at hjælpe med analysen af Kraken resultater. KrakenTools er et igangværende projekt ledet af Jennifer Lu. Se KrakenTools hjemmeside for flere detaljer.

om Kraken 2

Kraken 2 er den nyeste version af Kraken, et taksonomisk klassificeringssystem, der bruger nøjagtige k-mer-matches for at opnå høj nøjagtighed og hurtige klassificeringshastigheder. Denne klassifikator matcher hver k-mer inden for en forespørgselssekvens til den laveste fælles forfader (LCA) af alle genomer, der indeholder den givne k-mer. K-mer-opgaverne informerer klassificeringsalgoritmen. .
Kraken 2 giver betydelige forbedringer af Kraken 1 med hurtigere databaseopbygningstider, mindre databasestørrelser og hurtigere klassificeringshastigheder. Disse forbedringer blev opnået ved følgende opdateringer til Kraken-klassificeringsprogrammet:

  1. opbevaring af Minimeringsmidler: i stedet for at opbevare/forespørge hele k-mers, gemmer Kraken 2 minimeringsmidler (l-mers) af hver k-mer. Længden af hver l-mer skal være lig med K-mer længden. Hver k-mer behandles af Kraken 2, som om dens LCA er den samme som dens minimerings LCA.
  2. introduktion af fordelte frø: Kraken 2 bruger også fordelte frø til at gemme og forespørge minimeringsmidler for at forbedre klassificeringsnøjagtigheden.
  3. Databasestruktur: Mens Kraken 1 gemte en indekseret og sorteret liste over k-mer/LCA-par, bruger Kraken 2 et kompakt hash-bord. Denne hash-tabel er en sandsynlig datastruktur, der giver mulighed for hurtigere forespørgsler og lavere hukommelseskrav. Denne datastruktur har dog en < 1% chance for at returnere den forkerte LCA eller returnere en LCA til en ikke-indsat minimering. Brugere kan kompensere for denne mulighed ved at bruge Krakens tillid scoring tærskler.
  4. Protein databaser: Kraken 2 giver mulighed for databaser bygget fra aminosyresekvenser. Når forespørges, Kraken 2 udfører en seks-frame oversat søgning af forespørgselssekvenserne mod databasen.
  5. 16S databaser: Kraken 2 yder også support til databaser, der ikke er baseret på NCBI ‘ s taksonomi. I øjeblikket omfatter disse 16S databaser: Greengenes, SILVA og RDP.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.