2020/12 MISE À JOUR
Veuillez vous référer au Wiki Kraken 2 Github pour toutes les mises à jour à venir. Nous sommes en train de déplacer toutes les informations / liens pertinents vers la page Wiki de Github. Merci pour votre patience.
Depuis septembre 2020, nous avons créé un site Amazon Web Services pour héberger un grand nombre des indices Kraken2 les plus utilisés, disponibles à https://github.com/BenLangmead/aws-indexes.
KrakenTools est une suite de scripts pour aider à l’analyse des résultats de Kraken. KrakenTools est un projet en cours dirigé par Jennifer Lu. Veuillez consulter la page Web de KrakenTools pour plus de détails.
À propos de Kraken 2
Kraken 2 est la dernière version de Kraken, un système de classification taxonomique utilisant des correspondances k-mer exactes pour obtenir une grande précision et des vitesses de classification rapides. Ce classificateur fait correspondre chaque k-mer dans une séquence de requête à l’ancêtre commun le plus bas (ACV) de tous les génomes contenant le k-mer donné. Les affectations k-mer informent l’algorithme de classification. .
Kraken 2 apporte des améliorations significatives à Kraken 1, avec des temps de construction de base de données plus rapides, des tailles de base de données plus petites et des vitesses de classification plus rapides. Ces améliorations ont été obtenues grâce aux mises à jour suivantes du programme de classification de Kraken:
- Stockage des minimiseurs: Au lieu de stocker / interroger des k-mers entiers, Kraken 2 stocke des minimiseurs (l-mers) de chaque k-mer. La longueur de chaque l-mer doit être ≤ la longueur k-mer. Chaque k-mer est traité par Kraken 2 comme si son ACV était le même que l’ACV de son minimiseur.
- Introduction de graines espacées: Kraken 2 utilise également des graines espacées pour stocker et interroger des minimiseurs afin d’améliorer la précision de la classification.
- Structure de la base de données: Alors que Kraken 1 a enregistré une liste indexée et triée de paires k-mer/LCA, Kraken 2 utilise une table de hachage compacte. Cette table de hachage est une structure de données probabiliste qui permet des requêtes plus rapides et des besoins en mémoire réduits. Cependant, cette structure de données a < 1% de chances de renvoyer l’ACV incorrecte ou de renvoyer une ACV pour un minimiseur non inséré. Les utilisateurs peuvent compenser cette possibilité en utilisant les seuils de notation de confiance de Kraken.
- Bases de données sur les protéines : Kraken 2 permet de créer des bases de données à partir de séquences d’acides aminés. Lorsqu’il est interrogé, Kraken 2 effectue une recherche traduite en six images des séquences de requête par rapport à la base de données.Bases de données
- 16S: Kraken 2 prend également en charge les bases de données non basées sur la taxonomie de NCBI. Actuellement, ceux-ci incluent les bases de données 16S: Greengenes, SILVA et RDP.