Mi az az index fastq fájl, amely néhány Illumina szekvenáló adatkészlethez tartozik? (A samplename_I * .fastq.gz
fájl.)
Például nemrégiben kaptam néhány 10X Chromium olvasmányt két, ugyanazon a sávon szekvenált könyvtárhoz. Ez egy 2x150-es szekvenciafuttatás volt, ezért két fastq fájlnak kell lennie. A szekvenáló központ demultiplexelte a könyvtárakat, és két külön könyvtárat generált - mindegyik könyvtárhoz egyet.
- Minden könyvtárban három fastq fájl található:
-
Mysample_I1_001.fastq.gz
Mysample_R1_001.fastq.gz
Mysample_R2_001.fastq.gz
-
Tudom, hogy az R1 fastq fájl tartalmazza az előreolvasott és az R2 gyors fájl fordított olvasmányokat, de mi az indexfájl? Az első néhány szekvencia nem egyezik a könyvtár 10X indexével ( ACATTACT
, CAGCCCAC
, GGCAATGG
, TTTGGGTA
) .
>bioawk -cfastx '{print ($ seq)}' Saját minta_I1_001.fastq.gz | headNTTGGGTANGCAATGGNAGCCCACNAGCCCACNCATTACTNCATTACTNGCAATGGNAGCCCACNTTGGGTANAGCCCAC