Domanda:
Classificazione dei campioni in base all'espressione genica marcatore
GWW
2017-05-24 20:41:28 UTC
view on stackexchange narkive permalink

Ho alcuni set di geni marcatori che posso classificare i campioni di RNA-seq utilizzando il clustering semi-supervisionato. Vorrei automatizzare il processo, tuttavia, sto lottando per trovare l'algoritmo ideale che potrebbe generare una sorta di punteggio per il set di geni marcatori da un dato campione.

Presumo che questa sia un'analisi standard in molti gruppi, ma non sono sicuro di quali metodi stiano dando buoni risultati nella pratica.

Recentemente c'è stata una domanda simile su Biostars che non ha prodotto risposte: https://www.biostars.org/p/239228/
Sono sorpreso. Sembra un problema così importante. Soprattutto con scRNA-seq che sta guadagnando popolarità.
Dato che hai menzionato i dati scRNA-seq, potresti essere interessato a [Buettner * & al. *] (Https://www.nature.com/nbt/journal/v33/n2/full/nbt.3102.html): " L'analisi computazionale dell'eterogeneità da cellula a cellula nei dati di sequenziamento dell'RNA a cellula singola rivela sottopopolazioni di cellule nascoste ”. Non risolve del tutto il tuo problema, ma mostra alcuni dei problemi associati all'identificazione delle popolazioni cellulari in scRNA-seq in particolare, che sono in gran parte attenuati in bulk RNA-seq.
Una risposta:
Peter Humburg
2017-05-25 04:32:41 UTC
view on stackexchange narkive permalink

Considererei l'utilizzo di firme di espressione genica per classificare i campioni (in particolare i sottotipi di cancro, ma gli stessi principi si applicano ad altri problemi di questo tipo) uno dei problemi classici della bioinformatica. È stato fatto molto lavoro sui metodi per derivare set di geni che forniscono buone prestazioni di classificazione. Questo è leggermente diverso dal tuo problema poiché hai già una firma genica, ma potrebbe comunque rivelarsi utile.

Questi metodi si adatteranno tipicamente a un modello che seleziona un (piccolo) numero di geni dai dati di espressione dell'intero genoma che distinguono tra i tipi / condizioni cellulari in questione, cioè derivano una firma genica. Il modello risultante consente quindi la classificazione di nuovi campioni. Ho avuto successo usando GeneRave per questo scopo (ma nota che è stato progettato per i dati di microarray, non l'ho usato con i dati RNA-seq e non so quanto bene regge lì ). Un documento più recente relativo a questo problema può essere trovato qui.

Quindi come ti aiuta? Un'opzione potrebbe essere quella di adattare uno di questi classificatori ai dati di espressione genica per i geni che già conosci per ottenere un modello che può quindi essere applicato automaticamente a nuovi campioni.

È davvero utile, grazie mille. Li proverò o almeno vedrò come adattare i loro metodi.
Seguendo l'avvertenza di @Peter Humberg di GeneRave progettato per i dati di microarray, potresti `voom` trasformare i tuoi conteggi usando` limma` per renderli * microarray-like *.
Quando devo confrontare l'espressione cDNASeq con il microarray, utilizzo una normalizzazione della lunghezza della trascrizione applicata alla trasformazione VST di DESeq (che chiamo "VSTPk"). Maggiori dettagli possono essere trovati nella sezione metodi del nostro documento Th2 RNASeq: http: //dx.doi.org/10.1084/jem.20160470


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...