Kraken2

2020/12 UPDATE

Vennligst Se Kraken 2 Github Wiki for alle oppdateringer fremover. Vi er i ferd med å flytte all relevant informasjon / lenker til Github Wiki-siden. Takk for tålmodigheten.

fra September 2020 har Vi opprettet Et Amazon Web Services-nettsted for å være vert for mange Av De mest brukte Kraken2-indeksene, tilgjengelig på https://github.com/BenLangmead/aws-indexes.

KrakenTools er en pakke med skript for å bistå i analysen Av Kraken resultater. KrakenTools er et pågående prosjekt ledet Av Jennifer Lu. Vennligst se KrakenTools nettside for mer informasjon.

Om Kraken 2

Kraken 2 er den nyeste versjonen Av Kraken, et taksonomisk klassifiseringssystem som bruker eksakte k-mer-kamper for å oppnå høy nøyaktighet og raske klassifiseringshastigheter. Denne klassifikatoren matcher hver k – mer i en spørringssekvens til den laveste felles stamfaren (lca) av alle genomene som inneholder den gitte k-mer. K-mer-oppdragene informerer klassifiseringsalgoritmen. .
Kraken 2 gir betydelige forbedringer Av Kraken 1, med raskere databaseoppbyggingstider, mindre databasestørrelser og raskere klassifiseringshastigheter. Disse forbedringene ble oppnådd ved følgende oppdateringer Til Kraken-klassifiseringsprogrammet:

  1. Lagring Av Minimizers: I Stedet for å lagre/spørre hele k-mers, lagrer Kraken 2 minimizers (l-mers) av hver k-mer. Lengden på hver l-mer må være ≤ k-mer lengde. Hver k-mer behandles Av Kraken 2 som om LCA er den samme som minimizer ‘ S LCA.
  2. Innføring Av Avstandsfrø: Kraken 2 bruker også avstandsfrø til å lagre og spørre minimisatorer for å forbedre klassifiseringsnøyaktigheten.
  3. Databasestruktur: Mens Kraken 1 lagret en indeksert og sortert liste over k-mer/LCA-par, Bruker Kraken 2 et kompakt hash-bord. Denne hash-tabellen er en probabilistisk datastruktur som gir raskere spørringer og lavere minnekrav. Denne datastrukturen har imidlertid en < 1% sjanse for å returnere feil LCA eller returnere EN LCA for en ikke-innsatt minimizer. Brukere kan kompensere for denne muligheten ved Å bruke Kraken ‘ s confidence scoring terskler.
  4. Protein Databaser: Kraken 2 tillater databaser bygget fra aminosyresekvenser. Når spørres, Utfører Kraken 2 en seks-ramme oversatt søk av spørringen sekvenser mot databasen.
  5. 16s Databaser: Kraken 2 gir også støtte for databaser som ikke er basert PÅ NCBIS taksonomi. For tiden inkluderer DISSE 16s-databasene: Greengenes, SILVA og RDP.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.