Ich habe eine Reihe von VCF-Dateien (v4.1) mit strukturellen Variationen einer Reihe von Nichtmodellorganismen erhalten (d. h. es sind keine Varianten bekannt). Ich fand heraus, dass es einige Tools gibt, mit denen man VCF-Dateien wie VCFtools, R-Paket vcfR oder Python-Bibliothek PyVCF bearbeiten kann. Keiner von ihnen scheint jedoch eine kurze Zusammenfassung zu liefern, etwa (vorzugsweise auch nach Größe kategorisiert):
Typ countDEL xINS yINV z ....
Gibt es ein Tool oder eine Funktion, die ich übersehen habe und die Zusammenfassungen dieses Stils erstellt?
Ich weiß, dass die VCF-Datei nur eine Nur-Text-Datei ist und ob ich REF
und sezieren werde ALT
-Spalten Ich sollte in der Lage sein, ein Skript zu schreiben, das die Arbeit erledigt, aber ich hoffte, dass ich es vermeiden könnte, meinen eigenen Parser zu schreiben.
--- edit ---
Bisher scheint es, dass nur das Tool, das Zusammenfassungen erstellen soll (@ gringer-Antwort), nicht mit vcf v4.1 funktioniert. Andere Tools bieten nur eine Teillösung, indem sie bestimmte Variantentypen filtern. Daher akzeptiere ich meine eigenen Parser-Perl / R-Lösungen, bis es ein funktionierendes Tool für Statistiken von vcf mit Strukturvarianten gibt. P. >