Kraken2color

2020/12 UPDATE

Raadpleeg de Kraken 2 Github Wiki voor alle updates die vooruit gaan. We zijn bezig met het verplaatsen van alle relevante informatie/links naar de Github Wiki pagina. Bedankt voor je geduld.

vanaf September 2020 hebben we een Amazon Web Services-site gemaakt om veel van de meest gebruikte Kraken2-indices te hosten, beschikbaar op https://github.com/BenLangmead/aws-indexes. KrakenTools is een reeks scripts die helpen bij de analyse van Kraken-resultaten. KrakenTools is een lopend project onder leiding van Jennifer Lu. Zie de KrakenTools webpagina voor meer details.

over Kraken 2

Kraken 2 is de nieuwste versie van Kraken, een taxonomisch classificatiesysteem dat exacte K-mer-matches gebruikt om hoge nauwkeurigheid en hoge classificatiesnelheden te bereiken. Deze classificeerder komt overeen met elke k-mer binnen een vraagopeenvolging aan de laagste gemeenschappelijke voorouder (LCA) van alle genomen die de gegeven k-mer bevatten. De k-Mer-opdrachten informeren het classificatiealgoritme. .
Kraken 2 biedt significante verbeteringen aan Kraken 1, met snellere databasebouwtijden, kleinere databasegrootte en hogere classificatiesnelheden. Deze verbeteringen werden bereikt door de volgende updates van het Kraken classificatieprogramma:

  1. opslag van Minimizers: in plaats van het opslaan/opvragen van hele k-mers, Kraken 2 winkels minimizers (l-mers) van elke k-mer. De lengte van elke l-mer moet ≤ de lengte van de k-mer zijn. Elke k-mer wordt door Kraken 2 behandeld alsof zijn LCA hetzelfde is als de LCA van zijn minimizer.
  2. introductie van Spaced zaden: Kraken 2 gebruikt ook spaced zaden om minimizers op te slaan en te bevragen om de classificatienauwkeurigheid te verbeteren.
  3. Databasestructuur: Terwijl Kraken 1 een geïndexeerde en gesorteerde lijst van K-mer/LCA-paren heeft opgeslagen, gebruikt Kraken 2 een compacte hash-tabel. Deze hash tabel is een probabilistische datastructuur die zorgt voor snellere query ‘ s en lagere geheugenvereisten. Deze gegevensstructuur heeft echter een <1% kans op het retourneren van de onjuiste LCA of het retourneren van een LCA voor een niet-ingevoegde minimizer. Gebruikers kunnen deze mogelijkheid compenseren door gebruik te maken van Kraken ‘ s confidence scoring drempels.
  4. Eiwitdatabases: Kraken 2 maakt databases mogelijk die zijn opgebouwd uit aminozuursequenties. Wanneer gevraagd, Kraken 2 voert een zes-frame vertaalde zoekopdracht van de query sequenties tegen de database.
  5. 16S Databases: Kraken 2 biedt ook ondersteuning voor databases die niet gebaseerd zijn op de taxonomie van de NCBI. Momenteel omvatten deze de 16S databases: Greengenes, SILVA, en RDP.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.