Nelle analisi dei dati RNA-seq a cellula singola esistono diversi approcci non supervisionati per identificare le sottopopolazioni putative (ad es. come disponibile con i pacchetti Suerat o SCDE).
Esiste un buon modo per convalidare computazionalmente le soluzioni cluster? Metodi diversi possono produrre risultati di clustering leggermente diversi. Come sapere qual è il migliore, ovvero rappresentativo delle sottopopolazioni biologiche?