Estoy buscando herramientas para comprobar la calidad de un VCF que tengo de un genoma humano. Me gustaría comparar el VCF con variantes conocidas públicamente en otros genomas humanos, p. Ej. ¿cuántos SNP ya están en las bases de datos públicas, si las inserciones / deleciones están en posiciones conocidas, la distribución de la longitud de inserción / deleción, otros SNV / SV, etc.? Sospecho que hay recursos de proyectos anteriores para verificar SNP e InDels conocidos por subpoblaciones humanas.
¿Qué recursos existen para esto y cómo lo hago?