medbe
2017-06-03 04:44:45 UTC
BAMファイルをダウンサンプリングしてカバレッジを下げる方法を知っています。 SAMで行をランダムに選択できることは知っていますが、この手順では、ペアの2つの読み取りが常に同時にサンプリングされることを保証できません。ペアリング情報をそのまま維持しながらBAMをダウンサンプリングする方法はありますか?
読み取りをダウンサンプリングすることが役立つ*理由*についてもう少し説明していただけますか?それを行うにはいくつかの異なる方法があり、答えはあなたの目標によって異なります。たとえば、デジタル正規化を実行してゲノムアセンブリの入力読み取り数を減らすことはできますが、その方法は読み取りの定量分析(RNASeqなど)には適していません。