Ez a kérdés egy kérdésen alapul, amelyet a BioStars-on 2 évvel ezelőtt írt ki a jack felhasználó.
Nagyon gyakran leírja a GO-jelölések generálását nem modell organizmusok számára. . Bár ez valamilyen speciális formátumon és egyetlen alkalmazáson (Ontologizer) alapul, hasznos lenne általános leírást adni a GAF fájl elérésének útjáról.
Ne feledje, hogy a beviteli formátumból hiányzik egy kis alapvető információ, például annak megszerzésének módja. Ezért bizonyítékkódot kell rendelni. Ezért tegyük fel, hogy a GO kifejezések hozzárendelései automatikusan történtek.
Szeretném elvégezni a géndúsítást az Ontologizer segítségével előre definiált társítási fájl nélkül (ez nem modellszervezet).
Elemeztem egy fájlt, amely két oszlopot tartalmazott ehhez a szervezethez:
geneA GO: 0006950, GO: 0005737geneB GO: 0016020, GO: 0005524, GO: 0006468 , GO: 0005737, GO: 0004674, GO: 0006914, GO: 0016021, GO: 0015031geneC GO: 0003779, GO: 0006941, GO: 0005524, GO: 0003774, GO: 0005516, GO: 0005737, GO: 0005863geneD GO: , GO: 0003677, GO: 0030154, GO: 0006350, GO: 0006355, GO: 0007275, GO: 0030528
Az .ob fájlt letöltöttem a gén ontológiai fájlból, amely ezeket az információkat tartalmazza ( innen):
!! GO ID-k (csak elsődleges) és szöveges karakterláncok megnevezése! GO: 0000000 [tab] szöveg karakterlánc [tab] F | P | C! ahol F = molekuláris funkció, P = biológiai folyamat, C = sejtkomponens! GO: 0000001 mitokondrium öröklődése PGO: 0000002 mitokondriális genom fenntartó PGO: 0000003 reprodukció PGO: 0000005 riboszomális chaperone aktivitás FGO: 0000006 nagy affinitású cink felvétel transzmembrán transzporter aktivitás FGO alacsony affinitású cinkion transzmembrán transzporter aktivitás FGO: 0000008 tioredoxin FGO: 0000009 alfa-1,6-mannosiltranszferáz aktivitás FGO: 0000010 transz-hexapreniltransztranszferáz aktivitás FGO: 0000011 vacuole öröklés P
Mire van szükségem a kimenet .gaf fájl a következő formátumban (a a fájlok formátuma itt):
! gaf-version: 2.0! Project_name: Leishmania major GeneDB! URL: http://www.genedb.org/leish ! Kapcsolattartó e-mail: mb4@sanger.ac.uk .36.4770 LmjF.36.4770 GO: 0044429 PMID: 20660476 ISS C mitokondriális RNS-kötő komplex 1 alegység, feltételezett LmjF36.4770 gén taxon: 347515 20100803 GeneDB_Lmajor GeneDB_Lmajor LmjF.36.47.4670.4770.4770 Lidj mitokondriális RNS-kötő komplex 1 alegység, feltételezett LmjF36.4770 gén taxon: 347515 20120910 GeneDB_Lmajor GeneDB_Lmajor LmjF.36.4770 LmjF.36.4770 GO: 0048255 PMID: 22396527 ISO GeneDB: Tb9 27.10.10130 P mitokondriális RNS-kötő komplex 1 alegység, feltételezett LmjF36.4770 gén taxon: 347515 20120910 GeneDB_Lmajor
Hogyan hozhatunk létre saját GO asszociációs fájlt (gaf)?
blokk idézet>