Kraken2

2020/12 Päivitä

Katso kaikki eteenpäin menevät päivitykset Kraken 2 Github-wikistä. Olemme parhaillaan siirtämässä kaikkia olennaisia tietoja / linkkejä Github Wiki-sivulle. Kiitos kärsivällisyydestänne.

syyskuusta 2020 lähtien olemme luoneet Amazon Web Services-sivuston, johon on koottu monia käytetyimpiä Kraken2-indeksejä, jotka ovat saatavilla osoitteessa https://github.com/BenLangmead/aws-indexes.

KrakenTools on sarja skriptejä, jotka auttavat Krakenin tulosten analysoinnissa. KrakenTools on Jennifer Lun johtama jatkuva projekti. Katso lisätietoja KrakenTools-sivustolta.

noin Kraken 2

Kraken 2 on Krakenin uusin versio, taksonominen luokittelujärjestelmä, jossa käytetään tarkkoja k-mer-osumia suuren tarkkuuden ja nopeiden luokittelunopeuksien saavuttamiseksi. Tämä luokittelija vastaa jokaista k-mer sisällä kyselyn sekvenssi alin yhteinen kantaisä (LCA) kaikkien genomien sisältää tietyn k-mer. K-mer-tehtävät informoivat luokittelualgoritmia. .
Kraken 2 tarjoaa merkittäviä parannuksia Kraken 1: een nopeammilla tietokannan rakennusajoilla, pienemmillä tietokantakooilla ja nopeammilla luokittelunopeuksilla. Nämä parannukset saavutettiin Kraken-luokitteluohjelman seuraavilla päivityksillä:

  1. Minimisaattorien säilytys: kokonaisten k-merien säilyttämisen/kyselyn sijaan Kraken 2 tallentaa jokaisen k-Merin minimisaattorit (l-mers). Kunkin l-mer: n pituuden on oltava ≤ k-mer: n pituus. Jokainen k-mer käsitellään Kraken 2 ikään kuin sen LCA on sama kuin sen minimizer n LCA.
  2. introduction of Spaced Seeds: Kraken 2 käyttää myös spaced seedsiä tallentaakseen ja kysyäkseen minimaattoreita luokituksen tarkkuuden parantamiseksi.
  3. Tietokannan Rakenne: Siinä missä Kraken 1 tallensi indeksoidun ja lajitellun listan k-mer/LCA-pareista, Kraken 2 käyttää kompaktia hajautustaulukkoa. Tämä hajautustaulukko on probabilistinen tietorakenne, joka mahdollistaa nopeammat kyselyt ja alhaisemmat muistivaatimukset. Tällä tietorakenteella on kuitenkin <1% mahdollisuus palauttaa virheellinen LCA tai palauttaa LCA ei-asetetulle minimaattorille. Käyttäjät voivat kompensoida tätä mahdollisuutta käyttämällä Krakenin luottamusta pisteytys kynnysarvoja.
  4. Proteiinitietokannat: Kraken 2 mahdollistaa aminohapposekvensseistä rakennetut tietokannat. Kun tiedustellaan, Kraken 2 suorittaa kuuden ruudun käännetyn haun kyselysekvensseistä tietokantaa vastaan.
  5. 16s-tietokannat: Kraken 2 tarjoaa myös tuen tietokannoille, jotka eivät perustu NCBI: n taksonomiaan. Tällä hetkellä näitä ovat 16s-tietokannat: Greengenes, SILVA ja RDP.

Vastaa

Sähköpostiosoitettasi ei julkaista.