Kérdés:
Szűrje ki az scRNS-seq (heterogén sejtek) kiugró értékeit
Nikita Vlasenko
2017-12-18 04:11:39 UTC
view on stackexchange narkive permalink

Új vagyok az adattudományban. Van egy egysejtes gén expressziós adatkészletem több sejttípusból a C-ben. Elegans t. Az adatkészlet a A többsejtű organizmus átfogó, egysejtes transzkripciós profilja című lapból származik.

A fő kérdésem az, hogy Milyen megközelítéseket kell alkalmaznom a rossz sejtek kiszűrésére ebben eset, amikor több sejttípus van az adatkészletben?

Eddig a Bioconductor “simpleSingleCell” munkafolyamatot követve próbáltam kiszűrni a túl magas mitokondriális géntartalmú géneket.

Az oktatóanyag azonban kifejezetten azt mondja, hogy a mitokondriális gének alapján történő kiszűrési módszer valószínűleg nem fog működni, ha az adatkészletnek több sejttípusa van:

Az összes elemzése a sejttípusok együtt szükségtelenül felfújnák a MAD-t, és a legjobb esetben veszélyeztetnék az alacsony minőségű sejtek eltávolítását; vagy a legrosszabb esetben egy sejttípus teljes elvesztéséhez vezethet.

Minden javaslatot nagyra értékelnénk.

Szűréssel mit jelent: a minta eltávolítása az elemzésből, ha túl sok a mitokondriális gén, vagy a mitokondriális gének eltávolítása? (Ez fontosnak tűnik az scRNAseq-ben, és még nem dolgoztam vele, ezért bocsásson meg, ha ez egy naiv kérdés)
a rossz minőségű minták eltávolítása
Nem szokványos, de hasznosnak találtam ezt a tanfolyamot: http://hemberg-lab.github.io/scRNA.seq.course/. Személyesen szűrök túl alacsony vagy túl magas transzkriptumszámú sejteket, alacsony kimutatott génszámú sejteket és magas bepattintási / endogén RNS arányú sejteket. Ezt a folyamatot megelőzően a riboszomális RNS-t is kiszűröm. Vegyünk egy szem sóval, mert még mindig kísérletezem vele. Ez a válasz segíthet a https://bioinformatics.stackexchange.com/a/3171/1771 webhelyen is
Egy válasz:
plat
2018-01-10 19:44:39 UTC
view on stackexchange narkive permalink

Amit tudtam, a területen nincs egyértelmű konszenzus, és ez attól függ, hogy milyen típusú cellákat kérdezel ki.

Ha azonban a mitoRNS / endogénRNS arány nem felel meg az Ön céljainak, akkor másik lehetőség az, hogy ellenőrizze az egyes sejtekben észlelt gének / transzkriptumok teljes számát . Ily módon kiszűrheti azokat a sejteket, amelyeknél lényegesen kevesebb gént / transzkriptumot észlelnek, mint a többit, mivel ez bármilyen okból rossz minőségű sejtekre utalhat (apoptózis, RNS lebomlás, maga szekvenálása stb.). Például, hogy> 1000 gén / transzkript küszöbértékét tegyük egy cellába, amelyet további elemzés céljából figyelembe kell venni.

Fontolja meg azt is, hogy vessen egy pillantást a leképezett olvasások számára minden sejt, mivel az alacsony leképezésű olvasási cellák a többihez képest potenciálisan problémásak lehetnek.

Mit jelent a „leképezett olvasmányok”? Miben különbözik magától az expressziós mátrixtól?
Ha UMI-kat használ, akkor általában kiszűröm azokat, amelyeket kevesebb, mint 3 olvasás támogat, és olyanokat, amelyek nem felelnek meg a minőségbiztosítási követelményeknek. Ebben az esetben az UMI-k és a leképezett olvasások nem felelnek meg (bár nagyon hasonlónak kell lenniük). A végén egy másik módszer az adatok minőségellenőrzésének elvégzésére, de az elemzés egy korábbi szakaszában (mielőtt molekulákat számlálnánk és génekhez rendelnénk).


Ezt a kérdést és választ automatikusan lefordították angol nyelvről.Az eredeti tartalom elérhető a stackexchange oldalon, amelyet köszönünk az cc by-sa 3.0 licencért, amely alatt terjesztik.
Loading...