Kraken2

2020/12 aktualizace

naleznete na Kraken 2 GitHub Wiki pro všechny aktualizace kupředu. Právě přesouváme všechny relevantní informace / odkazy na stránku Github Wiki. Děkuji za trpělivost.

od září 2020 jsme vytvořili web Amazon Web Services, který hostuje mnoho nejpoužívanějších indexů Kraken2, dostupných na https://github.com/BenLangmead/aws-indexes.

KrakenTools je sada skriptů, které pomáhají při analýze výsledků Kraken. KrakenTools je probíhající projekt vedený Jennifer Lu. Další podrobnosti najdete na webové stránce KrakenTools.

o Kraken 2

Kraken 2 je nejnovější verze Kraken, taxonomického klasifikačního systému využívajícího přesné shody k-mer k dosažení vysoké přesnosti a rychlých klasifikačních rychlostí. Tento klasifikátor porovnává každý k-mer v sekvenci dotazu s nejnižším společným předkem (LCA) všech genomů obsahujících daný k-mer. Přiřazení k-mer informuje klasifikační algoritmus. .
Kraken 2 poskytuje významná vylepšení Kraken 1, s rychlejšími časy sestavení databáze, menšími velikostmi databáze a rychlejšími rychlostmi klasifikace. Těchto vylepšení bylo dosaženo následujícími aktualizacemi klasifikačního programu Kraken:

  1. ukládání Minimalizátorů: místo ukládání / dotazování celého k-mers ukládá Kraken 2 minimalizátory (l-mers) každého k-mer. Délka každého l-mer musí být ≤ délka K-mer. S každým k-merem se Kraken 2 zachází, jako by jeho LCA byla stejná jako LCA minimizéru.
  2. zavedení rozmístěných semen: Kraken 2 také používá rozmístěná semena k ukládání a minimalizaci dotazů pro zlepšení přesnosti klasifikace.
  3. Struktura Databáze: Zatímco Kraken 1 uložil indexovaný a tříděný seznam párů k-mer/LCA, Kraken 2 používá kompaktní hash tabulku. Tato hash tabulka je pravděpodobnostní datová struktura, která umožňuje rychlejší dotazy a nižší požadavky na paměť. Tato datová struktura má však <1% šanci na vrácení nesprávné LCA nebo vrácení LCA pro nevložený minimalizátor. Uživatelé mohou tuto možnost kompenzovat pomocí prahů pro hodnocení důvěry Kraken.
  4. proteinové databáze: Kraken 2 umožňuje databáze vytvořené z aminokyselinových sekvencí. Při dotazování provede Kraken 2 šestirámové přeložené vyhledávání sekvencí dotazů proti databázi.
  5. 16s databáze: Kraken 2 také poskytuje podporu pro databáze, které nejsou založeny na taxonomii NCBI. V současné době se jedná o databáze 16S: Greengenes, SILVA a RDP.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.