Genom çapında tekrarlanan eleman açıklamaları için herhangi bir RepBase alternatifi var mı?

Konrad Rudolph

2017-06-01 16:11:10 UTC

view on stackexchange narkive permalink

RepeatMasker ile birlikte RepBase kitaplıklarını, özellikle de yeri değiştirilebilen öğeler için genom çapında tekrarlanan öğe ek açıklamaları almak için kullanıyorum.

Bu yeterince iyi çalışıyor ve görünüyor Bu alanda fiili standart olmak.

Ancak, RepBase kullanımıyla ilgili iki sorun var, bu yüzden ben (ve diğerleri) alternatifler arıyordum (şimdiye kadar başarılı olamadık):

RepBase açık veri değildir. Akademik lisans sözleşmeleri, RepBase'den elde edilen verilerin yayılmasını açıkça yasaklayan bir madde içerir. Bunun ne ölçüde bağlayıcı / uygulanabilir olduğu açık değil, ancak kullandığım ve oluşturduğum verilerin en azından bir kısmının yayınlanmasını etkili bir şekilde engelliyor. Bu, açık bilim için kabul edilemez.
- Buna bağlı olarak RepBase'in abonelik modeli, RepBase'i tam otomatikleştirilmiş ardışık düzenlere entegre etmeyi imkansız kılıyor çünkü kullanıcı etkileşimi gerekli. RepBase'e abone olmak ve oturum açma kimlik bilgilerini sağlamak için.
RepBase büyük ölçüde manuel olarak seçiliyor. Bu hem iyi hemde kötü. İyi, çünkü sıra verilerinin manuel olarak iyileştirilmesi genellikle en güvenilir iyileştirme biçimidir. Diğer taraftan, manuel küratörlük doğası gereği önyargılıdır; ve daha da kötüsü, bu önyargıyı ölçmek zordur - bu RepBase yöneticileri tarafından kabul edilmektedir.

Sadece tanımlanmış tekrarlanan kütüphaneleri mi soruyordunuz? Bunu biraz daha geniş bir şekilde kitaplıkları oluşturmak için kullanılan araçlarla ilgili olarak yorumladım (bu, yeni taksonlardan genomlar sıralandığında alakalı hale gelir)

@Chris_Rands Her ikisi de (kitaplıklar ve araçlar). Cevabınız yerinde.

Amaç, açıklamalı tekrarlar kitaplığını oluşturmak mı, yoksa bir genomun tekrarlayan kısımlarını maskelemek mi?

@KamilSJaron TE'ler ile çalışıyorum, bu yüzden (yalnızca) tekrarlanan bir maskelenmiş sekans değil, açıklamalı kitaplığa ihtiyacım var.

Ouch, ancak TE'ler için yalnızca tekrar eden bölgelerin bir alt kümesi için, bunlara açıklama eklemek için özel araçlar vardır ([DNApipeTE] (https://github.com/clemgoub/dnaPipeTE) ve [REPET] (https: //urgi.versailles gibi. inra.fr/Tools/REPET)). Belki soruda belirtebilirsiniz.

@KamilSJaron Nice ve bu bir cevaba değer olabilir. Ayrıca soruyu da güncelleyeceğim. Bununla birlikte, TE'lerin ötesinde tekrar eden unsurları da istiyorum.

Ayrıca RepBase'in, verilerine dayanarak bilgi türeten yayınlara karşı olduğuna emin misiniz? Sağladıkları ham verileri ve dosyaları paylaşmanızı istemiyor olabilirler. Farklı alanlarda çok sayıda alıntı yaptıkları için: https://scholar.google.de/scholar?um=1&ie=UTF-8&lr&cites=11574259945967474319

@story Link verdiğim akademik kullanıcı sözleşmesinde tam anlamıyla öyle söylüyorlar. İşte ilgili alıntı: "Repbase'i (veya Repbase Raporları, Repeat Maps ** ve diğer türetilmiş materyaller, değiştirilmiş olsun ya da olmasın ** da dahil olmak üzere herhangi bir bölümünü araştırma grubunuz dışındaki herhangi birinin kullanımına sunmamayı kabul ediyorsunuz.” Vurgu benim. Aslında, anlaşmadaki bir başka madde teknik olarak imzalamamı bile yasaklıyor çünkü enstitüm kamuya açık veri biriktirmeyi gerektiriyor, bu yüzden muhtemelen bu tür anlaşmaları imzalamama izin verilmiyor. "

Ya bu önceki ifademe katılıyor. Sanırım benim açımdan, veritabanlarından düşünülebilecek olan (orijinal gönderinize göre) tam olarak neyi paylaşmanız gerektiğidir? Bunun özelliklerin sayısını içermeyeceğini düşünüyorum, ancak diziler bir sorun olabilir.

@story Analizimde kullanılan / oluşturulan tüm verileri potansiyel olarak paylaşmam gerekiyor. Bu, özellikle RepBase'den türetilen, kullanılan spesifik tekrar açıklamasını ve bu tekrarlardan potansiyel olarak sekans verilerini içerir.

Bu eski bir soru olabilir, ancak birisi repBase'e yeni, açık, bir alternatif oluşturmaya çalışıyor (ki bu tamamen ticari olarak kar yağıyorum), ya da en azından ben öyle anlıyorum: https://twitter.com/ Değiştirilebilir Adam / durum / 1060519887897067521