Wie werden die Grenzen eines Gens bestimmt?

Frage:

Wie werden die Grenzen eines Gens bestimmt?

ghchinoy

2011-12-19 22:16:43 UTC

view on stackexchange narkive permalink

Welche statistischen Prozesse und Methoden verwenden Genetiker / Molekularbiologen, um zu wissen, wo ein Gen beginnt und wo endet?

Worauf bezieht sich das "Basic" -Tag?

Ich dachte, dass die Frage eher eine grundlegende Frage war, um die Gruppe zu gründen, also habe ich sie _basic_ markiert. Wenn dies kein Protokoll ist, können Sie es gerne entfernen.

@ghchinoy: Ich habe es erneut markiert, vorausgesetzt, es ist ein [Meta-Tag] (http://blog.stackoverflow.com/2010/08/the-death-of-meta-tags/) (obwohl es eine Frage zu Basenpaaren ist)

Nur zur Klarstellung: Wir sprechen hier von * Protein-kodierenden Genen *, richtig? Es gibt viele weitere, für die die Methoden völlig unterschiedlich sind.

@KonradRudolph könnten Sie vielleicht auf die anderen Gentypen und Methoden verweisen? Vielen Dank.

@ghchinoy Nur als Beispiel arbeite ich derzeit an tRNA-Genen. Da sie eine andere Polymerase verwenden, sehen Promotor und Terminationsstelle deutlich anders aus. Das Gleiche gilt für alle anderen nicht-kodierenden RNAs, und dann gibt es Dinge wie Pseudogene und LINEs / SINEs (diese werden normalerweise nicht als Gene betrachtet, aber aufgrund ihrer Ähnlichkeit mit nicht-kodierenden RNA-Genen erschweren sie die Analyse). Dennoch gibt es tatsächlich bioinformatische Methoden, um diese Gene zu finden. Soweit ich weiß, verwenden sie überwiegend die Motivsuche.

Vier antworten:

agrimaldi

2011-12-20 00:02:46 UTC

view on stackexchange narkive permalink

Ich kenne nur einen naiven Ansatz zur Bestimmung der Grenzen eines Gens: RACE-PCR. Es gibt zwei Arten, 3 'und 5' RACE, mit denen die jeweiligen Extremitäten gefunden werden können.

Die Begründung lautet wie folgt:

Sie führen eine Umkehrung durch Transkription des interessierenden Transkripts unter Verwendung eines spezifischen Primers. In diesem Schritt haben Sie eine spezifische einzelsträngige cDNA.
Dann fügen Sie in 5 'der cDNA einen Abschnitt identischer Nukleotide hinzu, der als homopolymerer Schwanz bezeichnet wird.
Schließlich führen Sie eine PCR mit einem spezifischen Primer und einem Universalprimer durch, die den homopolymeren Schwanz erkennen. Sie können Ihre amplifizierte cDNA mit einer Auflösung von 1 bp sequenzieren und herausfinden, wo sie sich im Genom befindet.

Für das 3'RACE ist das Konzept dasselbe, aber der Poly-A-Schwanz wird verwendet, anstatt ihn selbst mit der terminalen Transferase zu erzeugen.

In diesem Dokument finden Sie ein detailliertes Protokoll:

Sambrook J, Russell DW . 2006. Schnelle Amplifikation von 5'-cDNA-Enden (5'-RACE). CSH-Protokolle 2006.

Außerdem enthält der entsprechende Wikipedia-Artikel weitere Details zu den einzelnen Schritten. Beachten Sie jedoch, dass ein Fehler vorliegt: sagte, dass für das 5'-Rennen die terminale Transferase den homopolymeren Schwanz in 3 'anfügt, während sie ihn in 5'

anfügt

-1: Das kann ein guter Ansatz sein, um die Grenzen eines ORF zu erkennen (um ehrlich zu sein, Sie brauchen nicht immer ein RACE, eine einfache PCR kann auch funktionieren), nicht eines Gens. Was ist mit Promotor- und regulatorischen Elementen? Was ist beispielsweise der Vorteil gegenüber einem bioinformatischen Ansatz nach der Sequenzierung?

@nico: Mit der von Ihnen angegebenen Definition hat ein Gen also keine Grenzen.

@nico: Ok, ich verstehe Ihren Standpunkt, aber ich glaube nicht, dass das OP diese Definition eines Gens im Sinn hatte. Ich stimme auch voll und ganz zu, dass neue Technologien wie RNA-seq Ihnen eine umfassendere Antwort auf die Annotation von Genomen geben.

Wir können stundenlang über die korrekte Definition eines Gens diskutieren, aber ich denke, es gibt nicht viel darüber zu diskutieren, dass der Promotor Teil eines Gens ist. Und durch Retrotranskription von mRNA erhalten Sie den Promotor nicht.

Gergana Vandova

2011-12-20 00:20:29 UTC

view on stackexchange narkive permalink

Es gibt verschiedene Software, in die Sie Ihre Sequenz eingeben können (sagen wir die gesamte Genomsequenz) und die für Sie die mutmaßlichen offenen Leserahmen (ORFs) identifizieren können, d. h. die Startcodons und die Stoppcodons. Mithilfe dieser mutmaßlichen Gene können Sie dann mithilfe von BLAST ein Sequenz-Alignment durchführen und anhand der Ergebnisse bestätigen, dass es sich tatsächlich um ORFs handelt. Da dies der statistische Ansatz ist, können Sie Ihre Ergebnisse im Nasslabor überprüfen, wie von agrimaldi vorgeschlagen.

Aber * wie * bestimmen diese Software Gengrenzen? Was suchen sie, das auf eine Gengrenze hinweist?

Vielleicht sollte eine andere Frage speziell darüber gestellt werden, welche programmatischen Techniken verwendet werden? Vielleicht mit einem Bioinformatik-Tag.

@RichardSmith Sie suchen grundsätzlich nach Startcodons (ATG, GTG), die den Beginn des offenen Leserasters (ORF) definieren, und Stoppcodons (TAG, TAA, TGA), die das Ende des ORF definieren, und prüfen auch, ob die Die Anzahl der Basen zwischen dem Startcodon und dem Stoppcodon ist um 3 teilbar.

@ghchinoy Ja, das könnte interessant sein, aber ich denke nicht, dass es komplizierter ist, als ich Richard bereits erklärt habe. Sie können natürlich noch ein paar "Überprüfungen" hinzufügen, die die Software durchführen kann, wie z. B. die Länge des ORF.

KAM

2011-12-24 18:28:09 UTC

view on stackexchange narkive permalink

Wenn Ihr Ziel darin besteht, die Grenzen der Transkriptionseinheit (des Teils der transkribierten DNA) zu definieren, ist die obige Antwort korrekt, obwohl viele Menschen lediglich Homologie für klonierte cDNAs anstelle von RACE-Reaktionen verwenden. Dieser Ansatz hat den Vorteil, dass alternative Spleißformen gleichzeitig definiert werden.

Wenn Ihr Ziel darin besteht, die "Enden" des Gens zu definieren, kann dies nur empirisch und funktional erfolgen, da Kontrollelemente (Grenzen, Enhancer usw.) sind mit Hilfe der Informatik nicht zu erkennen, und selbst wenn man Enhancer findet, ist es nicht sicher, ob diese Enhancer mit bestimmten Genen verwendet werden. Einige Gene können Millionen Basenpaare lang sein, sodass Hunderte anderer Gene eingestreut sind. Der "Goldstandard" zur Definition der Grenzen von Genen besteht darin, den Funktionsverlust-Phänotyp einer Mutation mit einem Transgen zu retten, das das interessierende Gen enthält. Wenn die DNA, die zurück in einen Organismus transformiert wird, den Wildtyp-Zustand einer Mutation eines Gens wiederherstellen kann, wird angenommen, dass sich alle wichtigen Teile dieses Gens innerhalb des Transgens befinden

AnnaF

2011-12-19 23:04:57 UTC

view on stackexchange narkive permalink

Im Allgemeinen sequenzieren Sie das Genom und suchen dann nach Hinweisen. Es gibt normalerweise spezifische Sequenzen vor einem Gen, die dem Translationsgerät helfen, "Hallo, hier fangen wir an" zu erkennen, sowie Regionen, in denen Proteine binden können, die zur Verbesserung oder Hemmung der Translation des Gens verwendet werden.

Computer kann so programmiert werden, dass die Sequenz durchsucht und mögliche Kandidaten für eine genauere Betrachtung angezeigt werden.

ⓘ

Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.

über - juristisches

Loading...