Kraken2

2020/12 frissítés

kérjük, olvassa el a Kraken 2 Github Wiki minden frissítés halad előre. Folyamatban van az összes releváns információ/Link áthelyezése a Github Wiki oldalra. Köszönöm a türelmét.

2020 szeptemberétől létrehoztunk egy Amazon Web Services webhelyet a legszélesebb körben használt Kraken2 indexek tárolására, amelyek https://github.com/BenLangmead/aws-indexes címen érhetők el.

KrakenTools egy csomag szkriptek, hogy segítse az elemzés Kraken eredmények. A KrakenTools egy folyamatban lévő projekt, amelyet Jennifer Lu vezet. Kérjük, olvassa el a KrakenTools weboldal további részletekért.

a Kraken 2-ről

a Kraken 2 A Kraken legújabb verziója, egy rendszertani osztályozási rendszer, amely pontos k-mer egyezéseket használ a nagy pontosság és a gyors osztályozási sebesség elérése érdekében. Ez az osztályozó minden egyes k-mer-t egy lekérdezési szekvencián belül a legalacsonyabb közös ős (LCA) az adott k-mer-t tartalmazó összes Genom közül. A K-mer hozzárendelések tájékoztatják az osztályozási algoritmust. .
a Kraken 2 jelentős javulást biztosít a Kraken 1 – hez, gyorsabb adatbázis-építési időkkel, kisebb adatbázisméretekkel és gyorsabb osztályozási sebességgel. Ezeket a fejlesztéseket a Kraken osztályozási program következő frissítéseivel sikerült elérni:

  1. Minimalizálók tárolása: a teljes k-Mer-ek tárolása/lekérdezése helyett a Kraken 2 tárolja az egyes k-mer-ek minimalizálóit (l-Mer-eket). Az egyes l-mer hosszának a K-mer hosszának kell lennie. Mindegyik k-mer-t a Kraken 2 úgy kezeli, mintha az LCA megegyezik a minimalizáló LCA-jával.
  2. a Spaced Seeds bevezetése: a Kraken 2 a spaced seeds-t is használja a minimalizátorok tárolására és lekérdezésére az osztályozás pontosságának javítása érdekében.
  3. Adatbázis Felépítése: Míg a Kraken 1 A k-mer/LCA Párok indexelt és rendezett listáját mentette, a Kraken 2 egy kompakt hash táblát használ. Ez a hash tábla egy valószínűségi adatszerkezet, amely gyorsabb lekérdezéseket és alacsonyabb memóriaigényt tesz lehetővé. Ennek az adatstruktúrának azonban <1% esélye van a helytelen LCA visszaadására vagy az LCA visszaadására egy be nem illesztett minimalizáló számára. A felhasználók kompenzálni ezt a lehetőséget segítségével Kraken bizalom pontozási küszöbértékek.
  4. fehérje adatbázisok: a Kraken 2 lehetővé teszi az aminosavszekvenciákból épített adatbázisokat. Lekérdezéskor a Kraken 2 hat képkockás lefordított keresést hajt végre a lekérdezési szekvenciákban az adatbázis ellen.
  5. 16S adatbázisok: a Kraken 2 olyan adatbázisokat is támogat, amelyek nem az NCBI taxonómiáján alapulnak. Jelenleg ezek közé tartoznak a 16S adatbázisok: Greengenes, SILVA és RDP.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.