Kérdés:
A picard markduplicate kapcsolja a PCR duplicate samflagot
svural
2017-10-27 19:49:30 UTC
view on stackexchange narkive permalink

Van egy RNA-seq bam fájlom, és kevés olvasmány zavar engem.

A bam fejléc szerint ez a bam fájl koordináták szerint van rendezve, a tophat használatával jön létre, és a markduplicate lépés nem Kész. De egyes olvasmányok megjelölésre kerülnek, mert a samflag-ban duplikáltak. Ami a legrosszabb, ha picard markduplicate-t futtatok, ezek a PCR duplicate flag be vannak kapcsolva, és nem duplikátumok. Szintén kézzel találtam meg ennek az olvasásnak a duplikátumát (azonos olvasás ugyanazokkal a kezdő és a kezdő pozíciókkal), így a kezdeti jelölés igaznak tűnik.

Tehát a kérdéseim a következők:

Van ötlet, miért ez megtörténik?

A Tophat védjegy megismétlődik? (Nem hinném) És a picard markduplicate váltja-e az ismétlődő zászlót, ha az olvasások már duplikátumokként vannak megjelölve?

Így néz ki az olvasás a jelölés előtt és után ismétlődő lépés.

Előtt :

  C0RTF 1187 17 7579880 255 61M10754N40M = 7579927 10902 CTC ... 0UNP1 163 17 7579880 255 61M10754N40M = 7579927 10902 CTC .. . 

A Markduplicate után:

  C0RTF 163 17 7579880 255 61M10754N40M = 7579927 10902 CTC ... 0UNP1 163 17 7579880 255 61M10754N40M = 7579927 10902 CTC .. .  
> És a picard markduplicate váltja-e az ismétlődő zászlót, ha az olvasások már duplikátumokként vannak megjelölve? igen: https://github.com/broadinstitute/picard/blob/master/src/main/java/picard/sam/markduplicates/MarkDuplicates.java#L342
@Pierre Nem ismerek Java-t, de úgy tűnik, hogy ez kikapcsolja a duplikált zászlót, ha az `isDuplicate` hamis. Nem, ha ez már igaz. Lemaradtam valamiről?
@terdon:, ha megismétli a zászlót, a https://github.com/broadinstitute/picard/blob/master/src/main/java/picard/sam/markduplicates/MarkDuplicates.java#L330 beállítással van megadva, egyébként nincs beállítva https: // github.com/broadinstitute/picard/blob/master/src/main/java/picard/sam/markduplicates/MarkDuplicates.java#L342
@Pierre igen, pontosan. Ha jól értem, az OP-nak van egy fájlja, amelynek már meg vannak adva az ismétlődő zászlók, de amikor áthaladnak a markDuplicates-en, a beállított zászlók most be vannak kapcsolva: nincsenek beállítva, ezért már nincsenek megjelölve másolatokként. A mutatott kód azt sugallja, hogy ha a zászló már be van állítva, akkor semmi sem változik. Hacsak a picard nem olvassa el a zászlókat, és csak a saját számításait végzi el a dupes meghatározásához, és ebben az esetben nem értett egyet az eredeti jelölésekkel.
Egy válasz:
Devon Ryan
2017-10-31 01:15:42 UTC
view on stackexchange narkive permalink

Igen, ha a MarkDuplicates olyan párral találkozik, amelyet duplikátumként jelöltek meg, és amelyet (bármilyen okból) nem duplikátumnak tekint, akkor a kettős jelölést törli. Ezt saját maga is kipróbálhatja egy kis BAM fájl készítésével, duplikált bejegyzésekkel vagy anélkül, de néhányat ettől függetlenül megjelölt. Tényleges másolatok esetén a duplikátum jelző megmarad. Abban az esetben, ha nincsenek tényleges másolatok, akkor a jelzőt eltávolítjuk. Legalábbis ez a helyzet a 2.14 verzióban.



Ezt a kérdést és választ automatikusan lefordították angol nyelvről.Az eredeti tartalom elérhető a stackexchange oldalon, amelyet köszönünk az cc by-sa 3.0 licencért, amely alatt terjesztik.
Loading...