Kérdés:
GRCh38 centromerek leképezhetősége
719016
2017-08-14 13:33:43 UTC
view on stackexchange narkive permalink

Hasonlóak-e a centromerek leképezhetősége a GRCh38 genom referenciájában?

Amennyire emlékszem, amikor a GRCh38 megjelent, a centromerek szekvenciáját szekvenálási adatok kombinációjával határoztuk meg és a szoftveres előrejelzés.

Tekintettel arra, hogy a centromerek szekvenciáját meghatározták, számítsunk-e arra, hogy az Illumina 2x150bp (vagy rövidebb, 2x75bp) olvasásai viszonylag egyformán leképezzék az összes centromer szekvenciát?

Kettő válaszokat:
gringer
2017-08-14 15:49:09 UTC
view on stackexchange narkive permalink

Kétlem, hacsak nem azt kérdezi, hogy a térképezés minden centromérushoz hasonlóan rossz lenne-e. Íme néhány ismétlődő struktúra (valószínűleg nem centromerikus), amelyeket a nanopórusokban találtam: a nanopórus-WGS konzorcium által létrehozott NA12878 "emberi" mintához:

Repetitive human reads #1

Ezek a struktúrák következetesek, mivel sokszor megismétlődnek, de a belső minták meglehetősen eltérőek lehetnek. Íme még néhány:

Repetitive human reads #2

Tekintettel arra, hogy a centromereknek egyedileg kapcsolódniuk kell egyetlen kromoszómához, számomra lenne értelme, ha a centromér belső szerkezete minden kromoszómán egyedi.

Lehetséges, hogy nagyon ismétlődő struktúrák legyenek, amelyek nem jelennek meg egymással. Noha nem mélyedtem el mélyen az emberi olvasmányok között, megnéztem az öt legjobban összenyomható régiót egy összerakott rágcsáló-parazita ( Nippostrongylus brasiliensis ) genomban, és nem találtam belső hasonlóságot közöttük:

Nippo most-compressible regions

Az illuminai összeszerelés egyik kérdése az, hogy ezek a nagyon ismétlődő régiók egyetlen ismétléssé (vagy legjobb esetben) összeomlanak a fragmens hosszának kétszereséig terjedő régió). A 98% feletti azonosságú belső ismétlő egységeknél a valódi szekvencia összeállítása nagyon nehéz, még a páros olvasási elválasztás pontos ismerete mellett is. Még ha ez lehetséges is lehet, lehetetlen helyesen elhelyezni az olvasmányt, mert több belső egység azonos lehet (vagy hasonlóan különbözhet) a szekvenált olvasattól.

user172818
2017-08-18 09:54:39 UTC
view on stackexchange narkive permalink

számítanunk kell arra, hogy az Illumina 2x150bp (vagy rövidebb, 2x75bp) olvasásai viszonylag egyenlően jelennek meg az összes centromer szekvencián?

Nem Régóta bebizonyosodott, hogy a különböző kromoszómák különböző centromer szekvenciákkal társulnak. Időnként meg lehet mondani, hogy az olvasás melyik chr-ből származik, annak szekvenciája alapján.

A GRCh38 centromerek bonyolultabbak. Mint emlékszem, a centromer szekvenciákat számítási úton generálták egy Markov-lánccal (vagy valami hasonlóval), amelyet Venter genomja alapján modelleztek. A GRC képes megkülönböztetni a legtöbb kromoszómát, de nem mindegyiket. Néhány alfa-tömb 2 vagy 4 kromoszómára kerül. Az eredeti GRCh38 mind a 4 példányt megőrzi. Ha leképezés céljából letölti a GRCh38 fájlt, csak egy példány marad meg; további példányok keményen el vannak maszkolva a chrY PAR-jaival együtt.

Ha többet szeretne megtudni, olvassa el ezt a papírt és ezt.



Ezt a kérdést és választ automatikusan lefordították angol nyelvről.Az eredeti tartalom elérhető a stackexchange oldalon, amelyet köszönünk az cc by-sa 3.0 licencért, amely alatt terjesztik.
Loading...