Kérdés:
Az egysejtű RNS-seq adatok nem kívánt variációs forrásainak visszafejlesztése
DCZ
2018-04-18 19:58:58 UTC
view on stackexchange narkive permalink

Van egy sejtszámlálási adatkészletem, és szeretném visszafejleszteni az UMI-k száma és a mitokondriális gének százalékos aránya által okozott variációt.

Tudom, hogy a számlálási adatok diszkrét adatok, és általában negatív binomiális eloszlást követ. E két zavaró tényező regressziójához lineáris modellt vagy GLM-et (poisson / negatív binomiális) kell használnom? És hogyan határozhatom meg az optimális választást?

Mit értesz az "egysejtszámú adatok" alatt? Ha mRNS-számításra gondolsz, akkor az adatok összetételesek, és ilyennek kell őket kezelni.
igen az mRNS számít, ahogy a címben is említettem. Milyen regressziós technika alkalmazható a kompozíciós adatokra?
Ha jól értelek, "vissza akarom vonni az UMI-k száma és a mitokondriális gének százalékos aránya által okozott variációt" azt jelenti, hogy enyhíteni kívánja a multinomiális mintavételből fakadó korlátozott geometriát (más néven az egység-összeg problémát). Több olyan transzformáció létezik, amelyek enyhíthetik az összetétel bizonyos hatásait (alr, clr, iqlr), vagy az adatokat egy korlátlan euklideszi térbe vetíthetik (ilr). A választás a későbbi elemzésektől és azok tulajdonságaitól függ. Az ALDEx2, egy széles körben használt RNS-seq csomag, clr-t és iqlr-t használ. Vegye figyelembe, hogy valamennyien bizonyos tulajdonságokkal rendelkeznek.
Három válaszokat:
gringer
2018-04-19 03:34:12 UTC
view on stackexchange narkive permalink

Az adatok tisztítása az elemzés előtt fontosabb lehet, mint az adatelemzés módszere. Az UMI-k számára nyilvánvaló tisztítási lépést lehet elvégezni: jobb lenne kiszűrni a duplikátumokat (a számlálás generálása előtt), mint megpróbálni beépíteni ezeket az információkat a számlálás elemzésébe.

Nem vagyok ismeri az egysejtes elemzést, de tisztában vagyok azzal, hogy a DESeq2 adaptálható egyetlen cellával való együttműködésre, és további variációk beépítése csupán egy további kovariátus hozzáadásának kérdése. DESeq2 képletmodell.

Köszönjük a választ. Időközben megtudtam, hogy általában lineáris regressziót használnak, de a negatív binomiális megoldás lenne a kedvező.
swbarnes2
2018-04-24 21:16:38 UTC
view on stackexchange narkive permalink

A Seurat protokolljának része egy olyan lépés, ahol az UMI-számok és a mitokondriális százalékok alapján szűrhet

http://satijalab.org/seurat/pbmc3k_tutorial.html

Igen, de alapértelmezésként lineáris regressziót használ. A kérdésem konkrétan az, hogy miért lineáris vagy negatív binomiális regresszió.
plat
2018-04-19 14:36:21 UTC
view on stackexchange narkive permalink

Ha csak az UMI-val kapcsolatos problémákat és a magas mitokondriális / nukleáris aránnyal rendelkező sejteket akarja szűrni, akkor talán nincs szükség modellezésre. erős>: Szűrheti azokat az UMI-kat , amelyeket legalább x olvasás nem támogat (például 3 olvasás), és amelyek valószínűleg szekvenálási hibákból származnak.

  • Magas mitokondriális / nukleáris arány esetén: kiszámíthatja (a mitokondriális gének molekuláinak száma / a nukleáris gének molekuláinak száma) és ábrázolhatja ezt az arányt az összes sejt számára, és megpróbálhatja küszöbértéket adni azoknak a celláknak, amelyek nagy értékekkel rendelkeznek ehhez az arányhoz . Így szűrje le ezeket a cellákat, amelyek furcsán viselkednek a többihez képest.

  • Köszönjük a válaszát. Tudom, hogy ezek standard küszöbprotokollok, többnyire rosszul szekvenált sejtekkel vagy haldokló sejtekkel foglalkoznak, azonban ez nem korrekció az amplifikációs torzítás szempontjából. Tehát nem hiszem, hogy ezt a választ keresem.
    @DCZ A cellák klaszterezéséhez készült Seurat oktatóanyagot követtem (http://satijalab.org/seurat/pbmc3k_tutorial.html), amikor valami nagyon hasonlót találtam a kérdéséhez. Szó szerint a nem kívánt variációs forrás eltávolításának lépésében: "Ebben az egyszerű példában itt a poszt-mitotikus vérsejtekre visszavonjuk a sejtenként észlelt molekulák számát, valamint a mitokondriális géntartalom százalékos arányát." Úgy tűnik, hogy lineáris modellt alkalmaztak, amelyet Buettner et al., 2015-ből vontak ki (https://www.nature.com/articles/nbt.3102). Ezt keresi? Még egy megvalósított funkciójuk is van.
    Így van. A Seurat oktatóprogram valóban ezt csinálja, de a scaleData függvény alapértelmezés szerint lineáris regressziót használ. Mivel a számlálási adatok negatív binomiális eloszlást követnek, ez számomra különös választásnak tűnt.


    Ezt a kérdést és választ automatikusan lefordították angol nyelvről.Az eredeti tartalom elérhető a stackexchange oldalon, amelyet köszönünk az cc by-sa 3.0 licencért, amely alatt terjesztik.
    Loading...