Kraken2

2020/12 uppdatera

se Kraken 2 Github Wiki för alla uppdateringar framåt. Vi håller på att flytta all relevant information / länkar till Github Wiki-sidan. Tack för ditt tålamod.

från och med September 2020 har vi skapat en Amazon Web Services-webbplats för att vara värd för många av de mest använda Kraken2-indexen, tillgängliga på https://github.com/BenLangmead/aws-indexes.

KrakenTools är en serie skript för att hjälpa till med analys av Kraken-resultat. KrakenTools är ett pågående projekt som leds av Jennifer Lu. Se KrakenTools hemsida för mer information.

om Kraken 2

Kraken 2 är den senaste versionen av Kraken, ett taxonomiskt klassificeringssystem som använder exakta k-Mer-matchningar för att uppnå hög noggrannhet och snabba klassificeringshastigheter. Denna klassificerare matchar varje k-Mer inom en frågesekvens till den lägsta gemensamma förfadern (LCA) av alla genom som innehåller den givna k-meren. K-Mer-uppdragen informerar klassificeringsalgoritmen. .
Kraken 2 ger betydande förbättringar av Kraken 1, med snabbare databasbyggnadstider, mindre databasstorlekar och snabbare klassificeringshastigheter. Dessa förbättringar uppnåddes genom följande uppdateringar av Kraken-klassificeringsprogrammet:

  1. lagring av Minimizers: i stället för att lagra/fråga hela k-mers, Kraken 2 lagrar minimizers (l-mers) för varje k-mer. Längden på varje l-mer måste vara k-Mer längd. Varje k-mer behandlas av Kraken 2 som om dess LCA är densamma som dess minimizer LCA.
  2. introduktion av åtskilda frön: Kraken 2 använder också åtskilda frön för att lagra och fråga minimisatorer för att förbättra klassificeringsnoggrannheten.
  3. Databasstruktur: Medan Kraken 1 sparade en indexerad och sorterad lista över K-Mer/LCA-par använder Kraken 2 en kompakt hashtabell. Denna hashtabell är en probabilistisk datastruktur som möjliggör snabbare frågor och lägre minneskrav. Denna datastruktur har dock en <1% chans att returnera felaktig LCA eller returnera en LCA för en icke-infogad minimizer. Användare kan kompensera för denna möjlighet genom att använda Krakens tröskelvärden för förtroende.
  4. Proteindatabaser: Kraken 2 möjliggör databaser byggda från aminosyrasekvenser. När frågas, Kraken 2 Utför en sex-bildruta översatt sökning av frågesekvenserna mot databasen.
  5. 16s databaser: Kraken 2 ger också stöd för databaser som inte är baserade på NCBI: s taxonomi. För närvarande inkluderar dessa 16S-databaserna: Greengenes, SILVA och RDP.

Lämna ett svar

Din e-postadress kommer inte publiceras.