Mitä eroa on FASTAlla ja FASTQ:lla

Sisällysluettelo:

Mitä eroa on FASTAlla ja FASTQ:lla
Mitä eroa on FASTAlla ja FASTQ:lla

Video: Mitä eroa on FASTAlla ja FASTQ:lla

Video: Mitä eroa on FASTAlla ja FASTQ:lla
Video: Основные ошибки при шпатлевке стен и потолка. #35 2024, Marraskuu
Anonim

Avainero FASTA:n ja FASTQ:n välillä on, että FASTA on tekstipohjainen muoto, joka tallentaa vain nukleotidi- tai proteiinisekvenssejä, kun taas FASTQ on tekstipohjainen muoto, joka tallentaa sekä sekvenssin että niihin liittyvien sekvenssien laatuarvot.

Bioinformatiikka on ala, joka käyttää erilaisia ohjelmistoja biologisen tiedon analysointiin ja ymmärtämiseen, varsinkin kun tietojoukko on monimutkainen ja suuri. Tämä ala yhdistää biologian, kemian, fysiikan, tietojenkäsittelytieteen, tietotekniikan, matematiikan ja tilastotieteen analysoimaan ja tulkitsemaan biologista dataa. FASTA ja FASTQ ovat kaksi sekvenssin esitysmuotoa bioinformatiikan alalla sekvenssien kohdistamiseksi ja analysoimiseksi. Itse asiassa FASTQ on sarjatiedostomuoto, joka laajentaa FASTA-muotoa siten, että se pystyy tallentamaan sekvenssin laadun.

Mikä on FASTA?

FASTA on DNA- ja proteiinisekvenssien kohdistusohjelmisto. FASTA-ohjelmisto käyttää FASTA-muotoa. Se on tekstipohjainen muoto, joka edustaa joko nukleotidisekvenssejä tai aminohappo (proteiini) sekvenssejä. Tässä yksikirjaiminen koodit edustavat molempia näitä sekvenssejä. FASTA on tärkeä työkalu bioinformatiikan ja biokemian aloilla. Tämä muoto sallii sekvenssien nimet ja kommentit ennen jaksoja.

FASTA vs FASTQ taulukkomuodossa
FASTA vs FASTQ taulukkomuodossa

Kuva 01: FASTA-sekvenssi

Tämä muoto sai alkunsa FASTA-ohjelmistosta, ja sen esittelivät David J. Lipmann ja William R. Pearson vuonna 1985. FASTA-työkaluun tehtiin monia muutoksia ajan mittaan, ja uusin versio koostuu ohjelmista proteiini:proteiini, DNA:DNA, proteiini:käännetty DNA (kehyssiirtymillä) ja järjestetyt tai järjestämättömät peptidihaut. FASTA lukee tietyn nukleotidi- tai aminohapposekvenssin ja etsii vastaavaa sekvenssitietokantaa käyttämällä paikallista sekvenssikohdistusta löytääkseen vastaavia samank altaisia tietokantasekvenssejä.

Mikä on FASTQ?

FASTQ on bioinformatiikan alalla käytetty kohdistusohjelmisto, joka tallentaa sekä biologisen sekvenssin (yleensä nukleotidisekvenssin) että sitä vastaavat laatupisteet. Wellcome Trust Sanger Institute kehitti FASTQ:n alun perin niputtamaan FASTA-muotoisen sekvenssin ja siihen liittyvät laatutiedot. Bioinformatiikan alan kehityksen myötä FASTQ:sta tuli de facto standardi monien suuritehoisten sekvensointiinstrumenttien tallentamiseen.

FASTQ-muoto käyttää neljää eri riviä sarjaa kohti. Rivi 1 alkaa @-merkillä ja sitä seuraa sarjan tunniste (samanlainen kuin FASTA-otsikkorivi). Rivi 2 koostuu raakajärjestyskirjaimista. Rivillä 3 sarja alkaa '+'-merkillä ja sitä seuraa valinnaisesti sama sekvenssitunniste. Rivi 4 koodaa rivin 2 sekvenssin laatuarvot, ja sen tulee koostua samasta määrästä symboleja kuin sekvenssin kirjaimista.

Mitä yhtäläisyyksiä FASTAn ja FASTQ:n välillä on?

  • FASTA ja FASTQ ovat kohdistustyökaluja.
  • Ne ovat kaksi sekvenssiesitysmuotoa.
  • Molemmat liittyvät bioinformatiikan alaan.
  • Sekä FAST että FASTQ ovat tärkeitä työkaluja tallennus- ja sekvensointitarkoituksiin.
  • FASTQ on FASTA-muodon laajennus, joka mahdollistaa sekvenssin laadun tallentamisen.

Mitä eroa FASTAlla ja FASTQ:lla on?

FASTA on tekstipohjainen muoto, joka tallentaa vain nukleotidi- tai proteiinisekvenssejä, kun taas FASTQ on tekstipohjainen muoto, joka tallentaa sekä sekvenssin että niihin liittyvien sekvenssien laatuarvot. Näin ollen tämä on keskeinen ero FASTA:n ja FASTQ:n välillä. Lisäksi FASTA tallentaa sekvenssifragmentteja kartoituksen jälkeen, kun taas FASTQ tallentaa sekvenssifragmentteja ennen kartoitusta. Lisäksi toinen ero FASTA:n ja FASTQ:n välillä on se, että FASTA koostuu yhdestä kuvausrivistä ja FASTAQ neljästä rivistä.

Alla oleva infografiikka esittelee FASTAn ja FASTQ:n väliset erot taulukkomuodossa vierekkäin vertailua varten.

Yhteenveto – FASTA vs FASTQ

Bioinformatiikka käyttää erilaisia sekvenssien muotoja, kuten FASTA ja FASTQ jne. FASTA tallentaa sekvenssifragmentit kartoituksen jälkeen, kun taas FASTQ tallentaa sekvenssifragmentit ennen kartoitusta. FASTA on DNA- ja proteiinisekvenssien kohdistusohjelmisto. Se koostuu ohjelmista proteiini:proteiini, DNA:DNA, proteiini:käännetty DNA (kehyssiirtymillä) ja järjestetyille tai järjestämättömille peptidihauille. FASTQ on bioinformatiikan alalla käytettävä kohdistusohjelmisto, joka tallentaa sekä biologisen sekvenssin (yleensä nukleotidisekvenssin) että sitä vastaavat laatupisteet. FASTA koostuu yhdestä kuvausrivistä ja FASTQ neljästä rivistä. Joten tämä tiivistää eron FASTA:n ja FASTQ:n välillä.

Suositeltava: