fast5
a HDF5
egy változata, a natív formátum, amelyben az Oxford Nanopore MinION nyers adatait nyújtják. Könnyedén kivonhatja az olvasást fast5 formátumban egy standard fastq formátumba, például a poretools
használatával.
Tegyük fel, hogy ezeket az olvasásokat fastq
formátumban egy külső referencia genomhoz igazítottam, ami egy SAM
fájlt eredményezett. Tegyük fel, hogy ezután a SAM
fájl egy részhalmazát vettem át a bitenként jelző szerint, hogy csak a leolvasott fájlokat vegyem fel a hivatkozásba. Az olvasási azonosítóval ezután kiválthatom őket az olvasást tartalmazó fájlból fastq
formátumban, és létrehozhatok egy fastq
formátumú részhalmazfájlt, amely csak az azonosított ID-ket tartalmazza. a referencia.
Most az a kérdésem, hogy a fast5
archívumból beolvashatjuk-e az olvasmányokat a leképezés-olvasások listája szerint, amint az a fájlból származik, a fastq
-val olvasható formátum? Ez oktatási célokra szolgál, így kisebb kezdő archívummal rendelkezünk, és a fast5
-> fastq
kibontása kevesebb CPU-időt vesz igénybe.