Kérdés:
Milyen motívumkereső szoftver érhető el ~ 10Kb több szekvenciához?
ShanZhengYang
2017-06-09 01:21:19 UTC
view on stackexchange narkive permalink

Körülbelül ~ 3000 rövid, kb. 10Kb hosszú szekvenciám van. Milyen módszerekkel lehet a motívumokat megtalálni e szekvenciák között? Van egy bizonyos szoftver / módszer ajánlott?

Ennek többféle módja van. A célom az lenne, hogy:

(1) Ellenőrizzük, hogy az egyes szekvenciákon belül megismétlődnek-e a motívumok. Ellenőrizze, hogy vannak-e "várható" vagy ismert motívumok.

A 3. sz. Vonatkozásában kíváncsi vagyok arra is, ha pl. trinukleotidszekvenciák, hogyan lehet ellenőrizni a kontextust ezen régiók körül?

Köszönjük az ajánlásokat / segítséget!

Az összes sorozat által megosztott motívumokat keresi? Az egyes sorrendekben megismételt motívumok? Konkrét, ismert motívumok jelenlétét keresi?
"Az összes szekvencia által megosztott motívumokat keres? Az egyes szekvenciákban megismételt motívumok?" Kerestem mindkét motívumot, amelyeket az összes szekvencia megosztott és szekvenciákban megismételtek, de valójában érdekes lenne minden szekvenciát megismételt szekvenciának ellenőrizni. - Konkrét, ismert motívumok jelenlétét keresi? Nem, de érdekes lenne ezt utólag megvizsgálni
OK, kérjük, [szerkessze] a kérdését, és vegye figyelembe ezt az információt. A megjegyzéseket könnyű kihagyni, nehezen olvashatók, és figyelmeztetés nélkül törölhetők. A három probléma (de-novo megosztott motívum-azonosítás, de-novo ismételt motívum-azonosítás és ismert motívumok detektálása) különbözik, és mindegyikhez meg kell adni a saját megközelítését.
@terdon Természetesen
Összesen 10kb-ra gondolsz, vagy 3000 szekvenciára, amelyek mindegyikének hossza kb. 10kb?
@CharlesE. Adjon 3000 szekvenciát, mindegyik hossza kb. 10 kb
öt válaszokat:
Charles E. Grant
2017-06-14 00:28:20 UTC
view on stackexchange narkive permalink

A MEME Suite webhely a motívumelemzés eszközeinek gyűjteményét tartalmazza (én vagyok az egyik fenntartó). Két de novo motívumfelfedező eszközt tartalmaz: MEME és DREME. Nyilvános webalkalmazások állnak rendelkezésre, de a helyi telepítéshez parancssori eszközöket is letölthet és készíthet.

Első célként használhatja a MEME alkalmazást, és válassza a "Bármennyi ismétlési modell "(ANR). Második céljához használja a MEME-t a "Zéró vagy egy előfordulás sorozatonként" (ZOOPS) modellel. Harmadik céljához használhatja a FIMO-t (egyéni motívum előfordulások keresése), valamint a szoftver és adatbázis letöltési oldalon található motívum adatbázisok közül egyet vagy többet.

Úgy hangzik, mint a szekvenciaadatok kb. 30 MB. A MEME webalkalmazás 60 kb-os szekvenciaadatokra korlátozódik, ezért telepítenie kell a MEME Suite helyi másolatát. A MEME hosszú időt vesz igénybe egy 30 MB-os szekvencia-adatbázis elemzésével, hacsak nem konfigurálta az MPI-t és sok mag áll rendelkezésre. Fontolja meg a szekvenciák véletlenszerűen kiválasztott részhalmazának elemzését. A MEME futási ideje a szekvenciák számának kockájaként növekszik.

Rövid motívumok esetén érdemes a DREME -et használni a MEME helyett. A DREME jobb, mint a MEME a rövid motívumok azonosításában, de az < = 8 pozíció széles motívumokra korlátozódik.

EMiller
2017-06-12 21:02:22 UTC
view on stackexchange narkive permalink

Nézze meg a HOMER oldalt. "Szoftver a motívumok felfedezéséhez és a következő generációs szekvenálás elemzéséhez", ezt laboratóriumom jelenleg használja az eRNS motívumok megtalálásához. HOMER De Novo motívum

Meg lehet-e fedezni de novo motívumot? Ha nem, akkor nem vagyok teljesen biztos abban, hogyan hoznék létre hátteret ezzel a modellel.
@ShanZhengYang Lásd a szerkesztésemet.
Köszönöm. Még mindig nem vagyok biztos abban, hogy a beállításom hogyan válasszon hátteret Homérosz számára ...
Még soha nem használtam a De Novo-hoz, ezért vegye ezt egy szem sóval, de először próbálja ki az alapértelmezéseket. Talán lőjön egy e-mailt a fejlesztőknek.
Az @EMiller megjegyzésének bővítése érdekében a HOMER számos modellorganizmus számára kitalálhat egy háttérmodellt az Ön számára. Csak be kell telepítenie a modell szervezetének támogató fájljait a configureHomer.pl használatával
gringer
2017-06-09 07:19:01 UTC
view on stackexchange narkive permalink

A (3) ezen az oldalon sok hivatkozás található a minta / motívumkereső eszközökhöz. Az oldalon található YMF linken keresztül rátaláltam a Washingtoni Egyetem Motif Discovery szakaszára. Ezek közül a vetítés tűnik az egyetlen letölthető eszköznek. Érdekesnek tartom, hogy ezek az eszközök mennyi idősek; talán a mikro-rays és az NGS bevezetése feleslegessé tette őket.

A (2) alproblémád hasonlónak tűnik ahhoz a problémához, amely a Nippostrongylus brasiliensis genomszekvenciákkal van, ahol Szeretnék olyan nagyon magas homológiájú régiókat találni (500 bp és 20 kb közötti vagy annál hosszabb, 95-99% -ban hasonló), amelyek az egész genomban megismétlődnek. Ezek a szekvenciák megölik az összeállítást.

Ezeknek a régióknak a megtalálásának fő módja az, ha megnézem az összeállított genomhoz leképezett hosszú nanorészecskék olvasási lefedettségi diagramját (GraphMap vagy BWA használatával). Bármely régió, amely lényegesen magasabb, mint a medián lefedettség, valószínűleg megosztott ismétlésekkel rendelkezik.

Korábban már játszottam azzal, hogy az olvasmányokat kisebb méretűre aprítottam, ami jobban működik, ha olyan kisebb ismétlődő régiókat ütünk meg, amelyek ilyenek a legtöbb olvasás kis hányada soha nem kerül feltérképezésre az összes ismétlődő helyen. Egy darabig írtam a saját szkriptemet, hogy összevágjam az olvasmányokat (más célból), ami egy FASTA / FASTQ fájlt állít elő, ahol minden olvasás pontosan egyforma. Valami ismeretlen okból időt szántam arra, hogy a szkriptet "megfelelően" dokumentáljam a POD használatával, ezért itt egy rövid összefoglaló:

A bemeneti FASTA fájl összes szekvenciáját azonos hosszúságúra konvertálja. A célhossznál rövidebb szekvenciákat eldobják, és a célhossznál hosszabb szekvenciákat egymást átfedő részekre bontják, amelyek a teljes tartományt lefedik. Ez előkészíti a szekvenciákat egy átfedéses-konszenzusos összeállítóban való használatra, amely állandó hosszúságú szekvenciákat igényel (például Edena).

És itt van a szintaxis:

  $ ./normalise_seqlengths.pl -hHasználat:
./normalise_seqlengths.pl <reads.fa> [opciók] Opciók: -help Csak ezt a súgó üzenetet jeleníti meg -fraglength Cél töredék hossza (alap-párokban, alapértelmezett 2000) -overlap Minimális átfedési hossz (alap-párokban, alapértelmezett 200) -rövid Tartson rövid szekvenciákat (rövidebb, mint a fraglength)  
Kristoffer Vitting-Seerup
2017-06-09 14:41:26 UTC
view on stackexchange narkive permalink

A legtöbb általam ismert eszköz a konkrét motívumok gazdagabbá tételére törekszik - de ehhez meg kell adni egy sor különös érdeklődésre számot tartó szekvenciát, és be kell állítani egy olyan hátteret, amely ellen tesztelni lehet.

Frissítés a megjegyzések után 2017. június 12-én.

Kipróbálhatja a mémcsomagot pontosabban a motívumkeresőt

Szia Kristoffer Vitting-Seerup, köszönöm megjegyzését, és üdvözli Önt a Bioinformatikai Verem Tőzsdén. Nagyra értékeljük az ilyen jellegű megjegyzéseket, amelyek segítenek az embereknek jobb kérdéseket feltenni. Válaszát "nem válaszként" jelöltem meg, mert úgy gondolom, hogy megjegyzésként hozzá kell adni a kérdéshez (amit maga nem tehet meg, amíg el nem éri az 50-es hírnevet).
Sziasztok, igen, ez jobb megjegyzés lenne az eredeti kérdéshez. Ez a SO stílus. Kérdéseddel kapcsolatban nincs beállítva háttér
galicae
2017-06-09 15:20:12 UTC
view on stackexchange narkive permalink

fejlesztés alatt áll, de talán a BaMMotif! az Ön számára? Legfőbb eladási pontja, hogy egyforma hosszúságú sorozatokban gazdagabb motívumokat kereshet de novo . Ha nem tud / nem akar negatív halmazt megadni, akkor megtanul egyet a pozitív szekvenciákból. Rengeteg lehetőség közül választhat, ha több információval rendelkezik a szekvenciáiról: különböző modellek léteznek a motívum "nulla vagy egy", "egy" és "több" előfordulásához.

Megadhatja használhatja ismert motívumok keresésére is, ha XXmotif PWM-ként kódolja őket. Ha van egy motívumokkal rendelkező fájlja (például a kötőhelyek), akkor ezt inicializálásként is használhatja.

Bár magam nem használtam a szoftvert, a szerzők nagyon reagálnak a gitre, és a telepítési utasítások eléggé tűnnek. egyszerű.

SZERKESZTÉS: Úgy tűnik, hogy a szoftvert a szokásos használati eseteként ChIP-kísérlettel fejlesztették ki, a nagyobb szekvenciák esetén helytelenül viselkedhet, vagy futtatása sokáig tarthat.

Szia galicae, köszönöm válaszát, és üdvözli Önt a Bioinformatikai Verem Tőzsdén. A válasz kissé rövid, és egy kicsit több magyarázattal szolgálhat. Szeretne még egy kis információt hozzáadni a BaMMmotif-tal kapcsolatos válaszához? Ez egy olyan eszköz, amelyet korábban használt? Megfelelő program lenne-e új motívumok, ugyanazon sorrendben ismétlődő motívumok vagy ismert motívumok megtalálásához?
-1


Ezt a kérdést és választ automatikusan lefordították angol nyelvről.Az eredeti tartalom elérhető a stackexchange oldalon, amelyet köszönünk az cc by-sa 3.0 licencért, amely alatt terjesztik.
Loading...