He realizado un análisis de enriquecimiento de un grupo de genes. El resultado es una lista de vías y su valor p (las vías se seleccionan porque el valor p < 0,05). La lista todavía es bastante larga, así que quiero reducirla. Para ese propósito, he calculado el coeficiente de dados de las rutas en una matriz $ p $ x $ p $ donde $ p $ es el número de rutas en la lista. Quiero tanto las que son más diferentes (se superponen menos, su coeficiente de Dice es más bajo) como las vías más representativas de las vías más similares (así que si hay un grupo de 5 vías que se superponen sobre 0.8, tome solo una).
¿Cómo puedo seleccionar las vías más representativas?
Existe una herramienta similar para GO, pero se basa en descartar un GO no significativo, mientras que aquí todas las vías iniciales ya son significativas.
Si hago un agrupamiento de las rutas usando la matriz de coeficientes de Dice, no sé dónde (o cómo) cortar.
Intenté usar la altura para seleccionar los caminos. Pero no estoy seguro de la interpretación de la altura.
Algunas otras herramientas que he visto usan un gráfico de escala multidimensional, pero no estoy seguro de si realizarlo y cortar en cierto punto de la primera dimensión ayudaría.