Kérdés:
Véletlenszerűség a BLAST-ban
user37060
2019-02-15 03:47:37 UTC
view on stackexchange narkive permalink

Tehát ha látja a BLAST paramétereket, akkor azt mondja

Az E várható érték egy olyan paraméter, amely leírja, hogy mekkora találatokra számíthatunk véletlenül egy adott adatbázis keresésekor méret. A pontszám (S) növekedésével exponenciálisan csökken. Lényeges, hogy az E érték leírja a véletlenszerűség háttérzaját. Például egy találathoz rendelt 1-es E-érték úgy értelmezhető, hogy az aktuális méretű adatbázis valószínűleg véletlenül lát 1 hasonló eredményű mérkőzést. Annál jobb az E érték csökkentése. "

Hogyan lehet valami" ESETÉN ", ez egy szoftveres igaz?

Három válaszokat:
Pallie
2019-02-15 18:22:40 UTC
view on stackexchange narkive permalink

A Blast E az álpozitív értékek várható gyakorisága. Ez függ a lekérdezés méretétől (nukleotid- vagy aminosavmaradékok számától) és az adatbázis méretétől. Rövid lekérdezéssel és nagy adatbázissal nagyobb valószínűséggel lesz olyan sorrend az adatbázisban, amely egyszerű véletlenszerűen megfelel a lekérdezésnek. Összefoglalva: minél kisebb a lekérdezés és minél nagyobb az adatbázis, annál nagyobb az esély a hamis eredményre, és ezt méri E.

d_kennetz
2019-02-15 21:41:27 UTC
view on stackexchange narkive permalink

Persze, tehát kezdje úgy, hogy az úgynevezett bitscore, ami normalizálódik a 2 szekvencia egymáshoz igazításából számított pontszámhoz, amely a következő egyenlettől függ. független az adatbázis méretétől:

(lambda * S - ln (k)) / (ln) 2

Ezután a helyi robbanás p értéke csak:

1/2^bitscore

Tehát ha a bitscore 15, akkor 1 / 32768 igazítás, mielőtt olyan jó vagy jobb pontszámot kapna (nagyon hasonló szekvenciák) ESZKÖZÖL CSAK . Ez a "Véletlenszerűséggel" kérdéssel foglalkozik.

Korábban azt mondtam, hogy a bitscore független az adatbázis méretétől. Az E érték csak a fenti p érték, amelyet az adatbázis méretére normalizáltak (tehát függ a db méretétől) a következő egyenlet:

(lekérdezés hossza * adatbázis hossza * p-érték)

ami kissé leegyszerűsít:

E = (lekérdezés hossza * (db hossz / 2 ^ bitbit)

Remélem, hogy ez segít!

Michael
2019-02-15 04:21:21 UTC
view on stackexchange narkive permalink

Az E kiszámítása a Blast számára jó kérdés.

Két módszer:

  • Használjon méreg- vagy binomiális elosztást.
  • Használjon véletlenszerűsítést

Szerintem annak nem. 1, mert nem. 2 túl sok számítási teljesítményt használna. Tudtam, de valaki kölcsönzött O'Reilly-könyvről a témában.

Az egyik közreműködő tudni fogja, mert gyanítom, hogy genomikai fejlesztőik vannak.



Ezt a kérdést és választ automatikusan lefordították angol nyelvről.Az eredeti tartalom elérhető a stackexchange oldalon, amelyet köszönünk az cc by-sa 4.0 licencért, amely alatt terjesztik.
Loading...