Deze vraag is ook gepost op Biostars
Ik heb de sequentie bepaald van talloze multiplex pools van BS amplicon-seq-bibliotheken afgeleid van menselijke monsters op een MiSeq in de afgelopen weken. Ik heb trim-galore en Bismark gebruikt voor uitlijning en ik vind dat de mapping-efficiëntie erg laag is voor twee pools (respectievelijk 55% & 30%) die beide een cytosine per basesequentie van ongeveer 10-20% gedurende de hele gelezen in hun fastqc-bestanden.
De hoge C-inhoud die zichtbaar is in de fastqc-bestanden doet me denken dat de slechte kaartefficiëntie te wijten is aan een slechte bisulfietconversie, aangezien dit naar verwachting bijna nul zou zijn als de bisulfietconversie daadwerkelijk heeft plaatsgevonden.
Ik ben nieuw in het veld, dus alle hulp wordt zeer op prijs gesteld.