validazione di sottopopolazioni identificate di cellule in scRNA-seq

Domanda:

Deffiz

2017-06-03 00:22:35 UTC

view on stackexchange narkive permalink

Nelle analisi dei dati RNA-seq a cellula singola esistono diversi approcci non supervisionati per identificare le sottopopolazioni putative (ad es. come disponibile con i pacchetti Suerat o SCDE).

Esiste un buon modo per convalidare computazionalmente le soluzioni cluster? Metodi diversi possono produrre risultati di clustering leggermente diversi. Come sapere qual è il migliore, ovvero rappresentativo delle sottopopolazioni biologiche?

C'è un po 'di follia nel provare a convalidare computazionalmente metodi computazionali senza un set di dati di verità noto ...

Ho cambiato scRNA in RNA a cellula singola (poiché scRNA significa anche piccolo RNA condizionale).

@Kamil “scRNA-seq” è un nome consolidato per RNA-seq a cellula singola.

Due risposte:

olga

2017-06-03 00:50:22 UTC

view on stackexchange narkive permalink

In questo caso potrebbe essere utile un approccio SC3, clustering del consenso a cellula singola. Mira a raggiungere "alta precisione e robustezza combinando più soluzioni di clustering attraverso un approccio di consenso" https://www.nature.com/nmeth/journal/v14/n5/full/nmeth.4236.html

Alec

2017-06-14 06:38:02 UTC

view on stackexchange narkive permalink

Sebbene i metodi migliori per valutare i cluster consistano nell'usare un set di dati esterno o un set di dati con verità note, esistono numerose metriche di convalida interne che possono essere utilizzate per confrontare soluzioni di clustering senza un altro set di dati.

Ecco alcune metriche:

Indice Davies-Bouldin
Indice Calinski-Harabasz
Deviazione standard radice quadratica media

Molti altri possono essere trovati in questa recensione sul cluster: http://stke.sciencemag.org/content/9/432/re6

Questi interni le metriche di convalida classificano la soluzione di clustering in base a tre misure: compattezza, connessione e separazione. Quando utilizzi queste metriche per confrontare le soluzioni di clustering, assicurati di considerare quale metrica è appropriata per i tuoi risultati poiché alcuni algoritmi funzionano ottimizzando determinate misure.

ⓘ

Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.

a proposito - legalese