2020/12 frissítés
kérjük, olvassa el a Kraken 2 Github Wiki minden frissítés halad előre. Folyamatban van az összes releváns információ/Link áthelyezése a Github Wiki oldalra. Köszönöm a türelmét.
2020 szeptemberétől létrehoztunk egy Amazon Web Services webhelyet a legszélesebb körben használt Kraken2 indexek tárolására, amelyek https://github.com/BenLangmead/aws-indexes címen érhetők el.
KrakenTools egy csomag szkriptek, hogy segítse az elemzés Kraken eredmények. A KrakenTools egy folyamatban lévő projekt, amelyet Jennifer Lu vezet. Kérjük, olvassa el a KrakenTools weboldal további részletekért.
a Kraken 2-ről
a Kraken 2 A Kraken legújabb verziója, egy rendszertani osztályozási rendszer, amely pontos k-mer egyezéseket használ a nagy pontosság és a gyors osztályozási sebesség elérése érdekében. Ez az osztályozó minden egyes k-mer-t egy lekérdezési szekvencián belül a legalacsonyabb közös ős (LCA) az adott k-mer-t tartalmazó összes Genom közül. A K-mer hozzárendelések tájékoztatják az osztályozási algoritmust. .
a Kraken 2 jelentős javulást biztosít a Kraken 1 – hez, gyorsabb adatbázis-építési időkkel, kisebb adatbázisméretekkel és gyorsabb osztályozási sebességgel. Ezeket a fejlesztéseket a Kraken osztályozási program következő frissítéseivel sikerült elérni:
- Minimalizálók tárolása: a teljes k-Mer-ek tárolása/lekérdezése helyett a Kraken 2 tárolja az egyes k-mer-ek minimalizálóit (l-Mer-eket). Az egyes l-mer hosszának a K-mer hosszának kell lennie. Mindegyik k-mer-t a Kraken 2 úgy kezeli, mintha az LCA megegyezik a minimalizáló LCA-jával.
- a Spaced Seeds bevezetése: a Kraken 2 a spaced seeds-t is használja a minimalizátorok tárolására és lekérdezésére az osztályozás pontosságának javítása érdekében.
- Adatbázis Felépítése: Míg a Kraken 1 A k-mer/LCA Párok indexelt és rendezett listáját mentette, a Kraken 2 egy kompakt hash táblát használ. Ez a hash tábla egy valószínűségi adatszerkezet, amely gyorsabb lekérdezéseket és alacsonyabb memóriaigényt tesz lehetővé. Ennek az adatstruktúrának azonban <1% esélye van a helytelen LCA visszaadására vagy az LCA visszaadására egy be nem illesztett minimalizáló számára. A felhasználók kompenzálni ezt a lehetőséget segítségével Kraken bizalom pontozási küszöbértékek.
- fehérje adatbázisok: a Kraken 2 lehetővé teszi az aminosavszekvenciákból épített adatbázisokat. Lekérdezéskor a Kraken 2 hat képkockás lefordított keresést hajt végre a lekérdezési szekvenciákban az adatbázis ellen.
- 16S adatbázisok: a Kraken 2 olyan adatbázisokat is támogat, amelyek nem az NCBI taxonómiáján alapulnak. Jelenleg ezek közé tartoznak a 16S adatbázisok: Greengenes, SILVA és RDP.