Kraken2

2020/12 aktualizacja

wszystkie aktualizacje można znaleźć na stronie Kraken 2 Github Wiki. Jesteśmy w trakcie przenoszenia wszystkich istotnych informacji/linków do strony Wiki Github. Dziękuję za cierpliwość.

od września 2020 r.stworzyliśmy witrynę Amazon Web Services, aby hostować wiele najczęściej używanych indeksów Kraken2, dostępnych pod adresem https://github.com/BenLangmead/aws-indexes.

KrakenTools to zestaw skryptów wspomagających analizę wyników Krakena. KrakenTools to projekt prowadzony przez Jennifer Lu. Więcej informacji można znaleźć na stronie KrakenTools.

o Kraken 2

Kraken 2 to najnowsza wersja Krakena, systemu klasyfikacji taksonomicznej wykorzystującego dokładne dopasowania k-mer w celu osiągnięcia wysokiej dokładności i szybkich prędkości klasyfikacji. Klasyfikator ten dopasowuje każdy k-mer w sekwencji zapytań do najniższego wspólnego przodka (LCA) wszystkich genomów zawierających dany k-mer. Przydziały k-mer informują o algorytmie klasyfikacji. .
Kraken 2 zapewnia znaczące ulepszenia Kraken 1, dzięki szybszemu czasowi budowania bazy danych, mniejszym rozmiarom bazy danych i szybszej klasyfikacji. Ulepszenia te zostały osiągnięte poprzez następujące aktualizacje programu klasyfikacji Kraken:

  1. Przechowywanie Minimizerów: zamiast przechowywania/odpytywania całych k-merów, Kraken 2 przechowuje minimizery (l-Mery) każdego k-Mera. Długość każdej l-mer musi być ≤ długości k-mer. Każdy k-mer jest traktowany przez Kraken 2 tak, jakby jego LCA był taki sam jak LCA jego minimizera.
  2. wprowadzenie Spaced Seeds: Kraken 2 używa również spaced seeds do przechowywania i minimalizowania zapytań w celu poprawy dokładności klasyfikacji.
  3. Struktura Bazy Danych: Podczas gdy Kraken 1 zapisał indeksowaną i posortowaną listę par k-mer/LCA, Kraken 2 używa kompaktowej tabeli skrótu. Ta tabela skrótów jest probabilistyczną strukturą danych, która pozwala na szybsze zapytania i niższe wymagania dotyczące pamięci. Jednak ta struktura danych ma <1% szans na zwrócenie nieprawidłowej oceny cyklu życia lub zwrócenie oceny cyklu życia dla niewłożonego minimizera. Użytkownicy mogą zrekompensować tę możliwość, korzystając z progów punktacji zaufania Krakena.
  4. bazy danych białek: Kraken 2 pozwala na bazy danych zbudowane z sekwencji aminokwasowych. Po zapytaniu Kraken 2 przeprowadza sześciokramkowe przeszukiwanie sekwencji zapytań w bazie danych.
  5. bazy danych 16s: Kraken 2 zapewnia również wsparcie dla baz danych nie opartych na taksonomii NCBI. Obecnie należą do nich bazy danych 16S: Greengenes, SILVA i RDP.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.