Kérdés:
GATK dokumentáció a szükséges mélységről, hogy megbízhatóan lehessen hívni a heterozigóta mutációt diploid organizmusban?
Mark Ebbert
2018-09-24 21:02:33 UTC
view on stackexchange narkive permalink

Hivatalos GATK dokumentációt (vagy egy nemrégiben készült kéziratot) keresek, amely meghatároz egy általános ajánlást / követelményt a szekvencia mélységének meghatározásához, hogy megbízhatóan hívjanak heterozigóta pontmutációt egy diploid organizmusban (WGS). Ebben az esetben emberekkel dolgozom. Pontosabban, tegyük fel, hogy a genom X helyzetét vizsgáljuk, és osztályozni akarjuk (Igaz / Hamis), hogy volt-e elegendő lefedettség egy heterozigóta pontmutáció kimutatásához.

Milyen lefedettség lenne? Mindkettőre kíváncsi vagyok: (1) UnifiedGenotyper és (2) HaplotypeCaller

Tudom, hogy az általános gyakorlat az, hogy 30x lefedettséggel rendelkezik genomálisan, de a GATK dokumentációjában nem látok semmit (pl. Bevált módszerek) a szükséges lefedettségről.

Nagyon értékelem a segítségedet.

Megjegyzés: kérdést is elküldtem a GATK csapatának. múlt héten.

Egy válasz:
Mark Ebbert
2018-09-25 20:28:54 UTC
view on stackexchange narkive permalink

UPDATE: Frissítésként Sarah Walker (a plakát társszerzője) válaszolt a kérdésemre a GATK fórumon. A következő állítással tisztázta:

Úgy gondoljuk, hogy a 30X körüli (és 150X feletti) oldalakat az alacsony leképezési minőség miatt szűrjük (mivel ez az egész genom, így sok olyan terület van, amely nehéz feltérképezéséhez), amely megmagyarázza ezeken a területeken az alacsony érzékenységet. Amint a hibasávok mutatják, nagyon kevés változat van ezeken az alacsony feltérképezési minőségi területeken.

Ezután közzétette a következő ábrát, amely sokkal jobban beleillik abba, amire mindannyian számíthatnánk. Ez egy olyan diagram, amely érzékenységet mutat a NA12878 iránt a NIST igazsághoz képest. NA12878: sensitivity by depth


shlee, a GATK fórumaiból, rámutatott egy egy AGBT 2018 plakátra, ahol a szerzők összehasonlították a HiSeqX és a NovaSeq eszközöket. A 3. ábra az SNP-k és a rövid INDEL-ek iránti érzékenységet mutatja a tüskés bejutásokból származó több allélfrakción (AF). Meglepődve tapasztaltam, hogy az SNP-k, ahol az AF = 0,4 csak ~ 50% -os érzékenységet jelent ~ 25x lefedettségnél, és csak ~ 75% -os érzékenységet jelentenek ~ 50x lefedettségnél .

A poszter a szomatikus variációkra irányul, de a 3. ábra adatainak úgy kell viselkedniük, mint egy szokásos diploid csíra variáns, mivel gyakran látni az allél frakciók széles skáláját a csíra változatoktól. Spike-ineket használtak a 3. ábra számára. Nem világos számomra, hogy a 3. ábrán HaplotypeCaller-t használtak-e, de nem tudom, hogyan használhatták volna a Mutect2-t, mint az 1. ábrán & 2.

Ezen információk alapján úgy tűnik, hogy a standard 30x-os genom-lefedettség általában nem elegendő sok heterozigóta mutáció magabiztos hívásához, és ez a ~ 90-100x ideális.

Hiányzik valami? Tényleg hiányzik az a sok heterozigóta mutáció a standard WGS / WES-ben?

Egyelőre megválaszolatlanul hagyom ezt a kérdést, hogy mások is beleszólhassanak tolmácsolásba stb. Nagyra értékelném a további gondolatokat.

poster from AGBT 2018



Ezt a kérdést és választ automatikusan lefordították angol nyelvről.Az eredeti tartalom elérhető a stackexchange oldalon, amelyet köszönünk az cc by-sa 4.0 licencért, amely alatt terjesztik.
Loading...