Was ist der genetische Code? Genetischer Code als Möglichkeit, Erbinformationen aufzuzeichnen

Was ist der genetische Code?  Genetischer Code als Möglichkeit, Erbinformationen aufzuzeichnen
Was ist der genetische Code? Genetischer Code als Möglichkeit, Erbinformationen aufzuzeichnen

GENETISCHER CODE, eine Methode zur Aufzeichnung erblicher Informationen in Nukleinsäuremolekülen in Form einer Sequenz von Nukleotiden, die diese Säuren bilden. Eine bestimmte Nukleotidsequenz in DNA und RNA entspricht einer bestimmten Aminosäuresequenz in den Polypeptidketten von Proteinen. Es ist üblich, den Code mit Großbuchstaben des russischen oder lateinischen Alphabets zu schreiben. Jedes Nukleotid wird durch den Buchstaben bezeichnet, mit dem der Name der in seinem Molekül enthaltenen Stickstoffbase beginnt: A (A) – Adenin, G (G) – Guanin, C (C) – Cytosin, T (T) – Thymin; In der RNA ist Uracil anstelle von Thymin U (U). Jedes wird durch eine Kombination aus drei Nukleotiden – einem Triplett oder Codon – kodiert. Kurz gesagt, der Weg der Übertragung genetischer Informationen wird im sogenannten zusammengefasst. Das zentrale Dogma der Molekularbiologie: DNA ` RNA f Protein.

In besonderen Fällen können Informationen von der RNA auf die DNA übertragen werden, jedoch niemals von Proteinen auf Gene.

Die Umsetzung genetischer Informationen erfolgt in zwei Schritten. Im Zellkern wird Informations- oder Matrix-RNA (Transkription) auf DNA synthetisiert. In diesem Fall wird die DNA-Nukleotidsequenz in die mRNA-Nukleotidsequenz „umgeschrieben“ (umkodiert). Anschließend gelangt die mRNA in das Zytoplasma, heftet sich an das Ribosom und darauf wird wie auf einer Matrix die Polypeptidkette des Proteins synthetisiert (Translation). Aminosäuren werden mithilfe von Transfer-RNA in einer Reihenfolge an die im Aufbau befindliche Kette angehängt, die durch die Reihenfolge der Nukleotide in der mRNA bestimmt wird.

Aus vier „Buchstaben“ können Sie 64 verschiedene „Wörter“ (Codons) mit drei Buchstaben bilden. Von den 64 Codons kodieren 61 spezifische Aminosäuren und drei sind für die Vervollständigung der Synthese der Polypeptidkette verantwortlich. Da es 61 Codons pro 20 Aminosäuren gibt, aus denen Proteine ​​bestehen, werden einige Aminosäuren von mehr als einem Codon codiert (sogenannte Code-Degeneration). Diese Redundanz erhöht die Zuverlässigkeit des Codes und des gesamten Mechanismus der Proteinbiosynthese. Eine weitere Eigenschaft des Codes ist seine Spezifität (Eindeutigkeit): Ein Codon kodiert nur eine Aminosäure.

Darüber hinaus überlappt sich der Code nicht – die Informationen werden sequentiell, Triplett für Triplett, in eine Richtung gelesen. Die erstaunlichste Eigenschaft des Codes ist seine Universalität: Er ist in allen Lebewesen gleich – vom Bakterium bis zum Menschen (mit Ausnahme des genetischen Codes der Mitochondrien). Wissenschaftler sehen darin eine Bestätigung der Vorstellung, dass alle Organismen von einem gemeinsamen Vorfahren abstammen.

Dekodierung genetischer Code, d. h. die Bestimmung der „Bedeutung“ jedes Codons und der Regeln, nach denen Informationen gelesen werden, wurde in den Jahren 1961–1965 durchgeführt. und gilt als eine der bemerkenswertesten Errungenschaften der Molekularbiologie.

Der in Codons ausgedrückte genetische Code ist ein System zur Kodierung von Informationen über die Struktur von Proteinen, die allen lebenden Organismen auf dem Planeten innewohnen. Es dauerte ein Jahrzehnt, es zu entschlüsseln, aber die Wissenschaft erkannte, dass es fast ein Jahrhundert lang existierte. Wichtig sind Universalität, Spezifität, Unidirektionalität und insbesondere die Degeneration des genetischen Codes biologische Bedeutung.

Geschichte der Entdeckungen

Das Problem der Kodierung war schon immer ein zentrales Problem in der Biologie. Die Wissenschaft hat sich eher langsam auf die Matrixstruktur des genetischen Codes zubewegt. Seit der Entdeckung der Doppelhelixstruktur der DNA durch J. Watson und F. Crick im Jahr 1953 begann die Phase der Entschlüsselung der eigentlichen Struktur des Codes, die den Glauben an die Größe der Natur weckte. Lineare Struktur Proteine ​​und die gleiche DNA-Struktur implizierten das Vorhandensein eines genetischen Codes als Entsprechung zwischen zwei Texten, die jedoch unter Verwendung geschrieben wurden verschiedene Alphabete. Und wenn das Alphabet der Proteine ​​bekannt war, dann wurden die Zeichen der DNA zum Untersuchungsgegenstand von Biologen, Physikern und Mathematikern.

Es macht keinen Sinn, alle Schritte zur Lösung dieses Rätsels zu beschreiben. Ein direktes Experiment, das bewies und bestätigte, dass eine klare und konsistente Entsprechung zwischen DNA-Codons und Proteinaminosäuren besteht, wurde 1964 von C. Janowski und S. Brenner durchgeführt. Und dann – die Zeit der Entschlüsselung des genetischen Codes in vitro (im Reagenzglas) mithilfe von Proteinsynthesetechniken in zellfreien Strukturen.

Der vollständig entschlüsselte Code von E. Coli wurde 1966 auf einem Biologensymposium in Cold Spring Harbor (USA) veröffentlicht. Dann wurde die Redundanz (Degeneration) des genetischen Codes entdeckt. Was das bedeutet, wird ganz einfach erklärt.

Die Dekodierung wird fortgesetzt

Die Gewinnung von Daten zur Entschlüsselung des Erbcodes war eines der bedeutendsten Ereignisse des letzten Jahrhunderts. Auch heute noch beschäftigt sich die Wissenschaft eingehend mit den Mechanismen molekularer Kodierungen und ihren systemischen Merkmalen sowie dem Zeichenüberschuss, der die Degenerationseigenschaft des genetischen Codes zum Ausdruck bringt. Ein separater Forschungszweig ist die Entstehung und Entwicklung des Systems zur Kodierung von Erbmaterial. Der Nachweis der Verbindung zwischen Polynukleotiden (DNA) und Polypeptiden (Proteinen) gab der Entwicklung der Molekularbiologie Impulse. Und das wiederum zu Biotechnologie, Bioingenieurwesen, Entdeckungen in der Züchtung und im Pflanzenbau.

Dogmen und Regeln

Das wichtigste Dogma der Molekularbiologie ist, dass Informationen von der DNA auf die Boten-RNA und von dort auf das Protein übertragen werden. In umgekehrter Richtung ist eine Übertragung von RNA auf DNA und von RNA auf eine andere RNA möglich.

Aber die Matrix oder Basis bleibt immer DNA. Und alle anderen grundlegenden Merkmale der Informationsübertragung spiegeln diesen Matrixcharakter der Übertragung wider. Nämlich die Übertragung durch die Synthese anderer Moleküle auf der Matrix, die zur Struktur für die Reproduktion erblicher Informationen wird.

Genetischer Code

Die lineare Kodierung der Struktur von Proteinmolekülen erfolgt mithilfe komplementärer Codons (Tripletts) von Nukleotiden, von denen es nur 4 gibt (Adein, Guanin, Cytosin, Thymin (Uracil)), was spontan zur Bildung einer weiteren Nukleotidkette führt . Selbe Nummer und die chemische Komplementarität der Nukleotide ist die Hauptbedingung für eine solche Synthese. Aber wenn ein Proteinmolekül gebildet wird, gibt es keine Qualitätsübereinstimmung zwischen der Menge und der Qualität der Monomere (DNA-Nukleotide sind Proteinaminosäuren). Dies ist der natürliche Erbcode – ein System zur Aufzeichnung der Aminosäuresequenz in einem Protein in einer Nukleotidsequenz (Codons).

Der genetische Code hat mehrere Eigenschaften:

  • Dreiheit.
  • Eindeutigkeit.
  • Direktionalität.
  • Nicht überlappend.
  • Redundanz (Degeneration) des genetischen Codes.
  • Vielseitigkeit.

Geben wir kurze Beschreibung, wobei der Schwerpunkt auf der biologischen Bedeutung liegt.

Dreiheit, Kontinuität und das Vorhandensein von Stoppsignalen

Jede der 61 Aminosäuren entspricht einem Sinn-Triplett (Triplett) von Nukleotiden. Drei Tripletts tragen keine Aminosäureinformationen und sind Stoppcodons. Jedes Nukleotid in der Kette ist Teil eines Tripletts und existiert nicht für sich allein. Am Ende und am Anfang der Nukleotidkette, die für ein Protein verantwortlich ist, befinden sich Stoppcodons. Sie starten oder stoppen die Translation (die Synthese eines Proteinmoleküls).

Spezifität, Nichtüberlappung und Unidirektionalität

Jedes Codon (Triplett) kodiert nur für eine Aminosäure. Jedes Triplett ist unabhängig von seinem Nachbarn und überlappt sich nicht. Ein Nukleotid kann nur in einem Triplett der Kette enthalten sein. Die Proteinsynthese erfolgt immer nur in eine Richtung, die durch Stoppcodons reguliert wird.

Redundanz des genetischen Codes

Jedes Nukleotidtriplett kodiert für eine Aminosäure. Insgesamt gibt es 64 Nukleotide, von denen 61 Aminosäuren kodieren (Sense-Codons) und drei Nonsense-Nukleotide sind, das heißt, sie kodieren keine Aminosäure (Stopp-Codons). Die Redundanz (Degeneration) des genetischen Codes liegt darin, dass in jedem Triplett Substitutionen vorgenommen werden können – radikal (führen zum Austausch einer Aminosäure) und konservativ (verändern die Klasse der Aminosäure nicht). Es ist leicht zu berechnen, dass, wenn 9 Substitutionen in einem Triplett (Position 1, 2 und 3) vorgenommen werden können, jedes Nukleotid durch 4 – 1 = 3 andere Optionen ersetzt werden kann, also die Gesamtzahl Möglichkeiten Die Zahl der Nukleotidsubstitutionen beträgt 61 mal 9 = 549.

Die Degeneration des genetischen Codes zeigt sich darin, dass 549 Varianten viel mehr sind, als zur Kodierung von Informationen über 21 Aminosäuren erforderlich sind. Darüber hinaus führen von 549 Varianten 23 Substitutionen zur Bildung von Stoppcodons, 134 + 230 Substitutionen sind konservativ und 162 Substitutionen sind radikal.

Herrschaft der Entartung und Ausgrenzung

Wenn zwei Codons zwei identische erste Nukleotide haben und die übrigen durch Nukleotide derselben Klasse (Purin oder Pyrimidin) dargestellt werden, dann tragen sie Informationen über dieselbe Aminosäure. Dies ist die Regel der Degeneration oder Redundanz des genetischen Codes. Zwei Ausnahmen sind AUA und UGA – das erste kodiert Methionin, obwohl es Isoleucin sein sollte, und das zweite ist ein Stoppcodon, obwohl es Tryptophan kodieren sollte.

Die Bedeutung von Entartung und Universalität

Es sind diese beiden Eigenschaften des genetischen Codes, die die größte biologische Bedeutung haben. Alle oben aufgeführten Eigenschaften sind charakteristisch für die Erbinformation aller Lebewesen auf unserem Planeten.

Die Degeneration des genetischen Codes hat adaptive Bedeutung, etwa die mehrfache Vervielfältigung des Codes für eine Aminosäure. Darüber hinaus bedeutet dies eine Bedeutungsminderung (Degeneration) des dritten Nukleotids im Codon. Diese Option minimiert Mutationsschäden in der DNA, die zu schwerwiegenden Störungen in der Struktur des Proteins führen. Dies ist ein Schutzmechanismus lebender Organismen auf dem Planeten.

GENETISCHER CODE(Griechisch: genetikos bezogen auf die Herkunft; Syn.: Code, biologischer Code, Aminosäurecode, Proteincode, Code Nukleinsäure ) - ein System zur Aufzeichnung erblicher Informationen in den Nukleinsäuremolekülen von Tieren, Pflanzen, Bakterien und Viren durch abwechselnde Nukleotidsequenzen.

Genetische Informationen (Abb.) von Zelle zu Zelle, von Generation zu Generation, mit Ausnahme von RNA-haltigen Viren, werden durch Reduktion von DNA-Molekülen übertragen (siehe Replikation). Die Umsetzung der DNA-Erbinformationen während des Lebens einer Zelle erfolgt durch drei Arten von RNA: Informations- (mRNA oder mRNA), ribosomale (rRNA) und Transport-RNA (tRNA), die mithilfe des Enzyms RNA-Polymerase auf DNA als a synthetisiert werden Matrix. In diesem Fall bestimmt die Nukleotidsequenz in einem DNA-Molekül eindeutig die Nukleotidsequenz in allen drei RNA-Typen (siehe Transkription). Die Informationen des Gens (siehe), das ein Proteinmolekül kodiert, werden nur von mRNA getragen. Das Endprodukt der Umsetzung erblicher Informationen ist die Synthese von Proteinmolekülen, deren Spezifität durch die Sequenz der darin enthaltenen Aminosäuren bestimmt wird (siehe Übersetzung).

Da DNA oder RNA nur 4 verschiedene stickstoffhaltige Basen enthält [in DNA – Adenin (A), Thymin (T), Guanin (G), Cytosin (C); in RNA - Adenin (A), Uracil (U), Cytosin (C), Guanin (G)], deren Sequenz die Reihenfolge von 20 Aminosäuren im Protein bestimmt, entsteht das Problem der GK, also das Problem der Übersetzung aus einem 4-Buchstaben-Alphabet aus Nukleinsäuren in ein 20-Buchstaben-Alphabet aus Polypeptiden.

Erstmals wurde die Idee der Matrixsynthese von Proteinmolekülen mit einbezogen richtige Vorhersage Eigenschaften einer hypothetischen Matrix wurde 1928 von N. K. Koltsov formuliert. 1944 stellten O. Avery et al. fest, dass DNA-Moleküle für die Übertragung erblicher Merkmale während der Transformation in Pneumokokken verantwortlich sind. 1948 zeigte E. Chargaff, dass in allen DNA-Molekülen eine quantitative Gleichheit der entsprechenden Nukleotide (A-T, G-C) besteht. Im Jahr 1953 kamen F. Crick, J. Watson und M. H. F. Wilkins auf der Grundlage dieser Regel und Daten aus der Röntgenbeugungsanalyse (siehe) zu dem Schluss, dass DNA-Moleküle vorhanden sind Doppelhelix, bestehend aus zwei Polynukleotidsträngen, die durch Wasserstoffbrückenbindungen verbunden sind. Darüber hinaus kann nur T gegen das A einer Kette in der zweiten sein und nur C gegen G. Diese Komplementarität führt dazu, dass die Nukleotidsequenz einer Kette die Sequenz der anderen Kette eindeutig bestimmt. Die zweite wichtige Schlussfolgerung, die sich aus diesem Modell ergibt, ist, dass das DNA-Molekül zur Selbstreproduktion fähig ist.

1954 formulierte G. Gamow das Problem geometrischer Gleichungen in seinem moderne Form. Im Jahr 1957 formulierte F. Crick die Adapter-Hypothese, die darauf hindeutet, dass Aminosäuren nicht direkt, sondern über Vermittler (heute als tRNA bekannt) mit Nukleinsäuren interagieren. In den kommenden Jahren danach werden alle grundlegenden Verbindungen hergestellt allgemeines Schema Die ursprünglich hypothetische Übertragung genetischer Informationen wurde experimentell bestätigt. Im Jahr 1957 wurden mRNAs entdeckt [A. S. Spirin, A. N. Belozersky et al.; Folkin und Astrachan (E. Volkin, L. Astrachan)] und tRNA [Hoagland (M.V. Hoagland)]; 1960 wurde DNA außerhalb der Zelle unter Verwendung vorhandener DNA-Makromoleküle als Matrix synthetisiert (A. Kornberg) und die DNA-abhängige RNA-Synthese wurde entdeckt [S. B. Weiss et al.]. 1961 wurde ein zellfreies System geschaffen, in dem proteinähnliche Substanzen in Gegenwart natürlicher RNA oder synthetischer Polyribonukleotide synthetisiert wurden [M. Nirenberg und Matthaei (J. H. Matthaei)]. Das Problem der Codeerkennung bestand darin, die allgemeinen Eigenschaften des Codes zu untersuchen und ihn tatsächlich zu entschlüsseln, d. h. herauszufinden, welche Kombinationen von Nukleotiden (Codons) bestimmte Aminosäuren kodieren.

Die allgemeinen Eigenschaften des Codes wurden unabhängig von seiner Dekodierung und hauptsächlich davor durch die Analyse der molekularen Muster der Mutationsbildung geklärt (F. Krick et al., 1961; N.V. Luchnik, 1963). Sie laufen auf Folgendes hinaus:

1. Der Code ist universell, d. h. zumindest grundsätzlich für alle Lebewesen identisch.

2. Der Code ist ein Triplett, das heißt, jede Aminosäure wird durch ein Triplett von Nukleotiden kodiert.

3. Der Code ist nicht überlappend, d. h. ein bestimmtes Nukleotid kann nicht Teil von mehr als einem Codon sein.

4. Der Code ist degeneriert, d. h. eine Aminosäure kann durch mehrere Tripletts codiert werden.

5. Informationen über die Primärstruktur des Proteins werden sequentiell aus der mRNA gelesen, beginnend an einem festen Punkt.

6. Die meisten möglichen Tripletts haben einen „Sinn“, das heißt, sie kodieren für Aminosäuren.

7. Von den drei „Buchstaben“ eines Codons haben nur zwei (obligatorisch) eine vorherrschende Bedeutung, während der dritte (optional) deutlich weniger Informationen enthält.

Die direkte Entschlüsselung des Codes würde aus dem Vergleich der Nukleotidsequenz im Strukturgen (oder der darauf synthetisierten mRNA) mit der Aminosäuresequenz im entsprechenden Protein bestehen. Allerdings ist ein solcher Weg technisch noch nicht möglich. Zwei weitere Methoden wurden verwendet: Proteinsynthese in einem zellfreien System unter Verwendung künstlicher Polyribonukleotide bekannter Zusammensetzung als Matrix und Analyse der molekularen Muster der Mutationsbildung (siehe). Der erste brachte früher positive Ergebnisse und spielte historisch gesehen eine große Rolle bei der Entschlüsselung von G. k.

Im Jahr 1961 verwendeten M. Nirenberg und Mattei ein Homopolymer als Matrix – synthetische Polyuridylsäure (d. h. künstliche RNA der Zusammensetzung UUUU...) und erhielten Polyphenylalanin. Daraus folgte, dass das Phenylalanin-Codon aus mehreren U besteht, d. h. im Falle eines Triplett-Codes wird es als UUU entschlüsselt. Später wurden neben Homopolymeren auch Polyribonukleotide verwendet, die aus verschiedenen Nukleotiden bestehen. Gleichzeitig war nur die Zusammensetzung der Polymere bekannt, die Lage der Nukleotide in ihnen war statistisch, daher war die Analyse der Ergebnisse statistisch und lieferte indirekte Schlussfolgerungen. Es gelang recht schnell, für alle 20 Aminosäuren mindestens ein Triplett zu finden. Es stellte sich heraus, dass das Vorhandensein organischer Lösungsmittel, Änderungen des pH-Werts oder der Temperatur, einiger Kationen und insbesondere Antibiotika den Code mehrdeutig machen: Dieselben Codons beginnen, die Aufnahme anderer Aminosäuren zu stimulieren, in einigen Fällen begann ein Codon, bis zu vier zu kodieren verschiedene Aminosäuren. Streptomycin beeinflusste das Lesen von Informationen sowohl in zellfreien Systemen als auch in vivo und war nur bei Streptomycin-empfindlichen Bakterienstämmen wirksam. Bei Streptomycin-abhängigen Stämmen „korrigierte“ es die Ablesung von Codons, die sich infolge der Mutation verändert hatten. Ähnliche Ergebnisse gaben Anlass, an der Richtigkeit der Dekodierung von G. mithilfe eines zellfreien Systems zu zweifeln; Eine Bestätigung war erforderlich, hauptsächlich durch In-vivo-Daten.

Die wichtigsten Daten zu G. in vivo wurden durch Analyse der Aminosäurezusammensetzung von Proteinen in Organismen erhalten, die mit Mutagenen (siehe) mit einem bekannten Wirkungsmechanismus behandelt wurden, beispielsweise Stickstoff, der den Ersatz von C durch U und A durch in verursacht das DNA-Molekül G. Nützliche Informationen bieten auch eine Analyse von Mutationen, die durch unspezifische Mutagene verursacht werden, einen Vergleich von Unterschieden in der Primärstruktur verwandter Proteine ​​in verschiedene Typen, Korrelation zwischen der Zusammensetzung von DNA und Proteinen usw.

Die Entschlüsselung von G. to. basierend auf Daten in vivo und in vitro ergab übereinstimmende Ergebnisse. Später wurden drei weitere Methoden zur Entschlüsselung des Codes in zellfreien Systemen entwickelt: Bindung von Aminoacyl-tRNA (d. h. tRNA mit einer angehängten aktivierten Aminosäure) mit Trinukleotiden bekannter Zusammensetzung (M. Nirenberg et al., 1965), Bindung von Aminoacyl-tRNA mit Polynukleotiden, die mit einem bestimmten Triplett beginnen (Mattei et al., 1966), und die Verwendung von Polymeren als mRNA, bei denen nicht nur die Zusammensetzung, sondern auch die Reihenfolge der Nukleotide bekannt ist (X. Korana et al. , 1965). Alle drei Methoden ergänzen sich und die Ergebnisse stimmen mit Daten aus In-vivo-Experimenten überein.

In den 70ern 20. Jahrhundert Zur besonders zuverlässigen Überprüfung der Ergebnisse der G. k.-Entschlüsselung sind Methoden aufgetaucht. Es ist bekannt, dass Mutationen, die unter dem Einfluss von Proflavin auftreten, im Verlust oder Einbau einzelner Nukleotide bestehen, was zu einer Verschiebung des Leserahmens führt. Im Phagen T4 wurde eine Reihe von Mutationen durch Proflavin verursacht, bei denen sich die Zusammensetzung des Lysozyms veränderte. Diese Zusammensetzung wurde analysiert und mit den Codons verglichen, die aus einem Frameshift entstanden sein sollten. Das Ergebnis war vollständige Compliance. Darüber hinaus konnte mit dieser Methode festgestellt werden, welche Tripletts des degenerierten Codes die einzelnen Aminosäuren kodieren. 1970 gelang es J. M. Adams und seinen Mitarbeitern, G. c. mit einer direkten Methode teilweise zu entschlüsseln: Im Phagen R17 wurde die Basensequenz in einem 57 Nukleotide langen Fragment bestimmt und mit der Aminosäuresequenz seines Hüllproteins verglichen . Die Ergebnisse stimmten vollständig mit denen überein, die mit weniger direkten Methoden erzielt wurden. Somit wurde der Code vollständig und korrekt entschlüsselt.

Die Dekodierungsergebnisse sind in einer Tabelle zusammengefasst. Es gibt die Zusammensetzung von Codons und RNA an. Die Zusammensetzung der tRNA-Anticodons ist komplementär zu den mRNA-Codons, d. h. sie enthalten statt Y A, statt A - U, statt C - G und statt G - C und entsprechen den Codons des Strukturgens (des DNA-Strangs). aus dem Informationen abgelesen werden) mit dem einzigen Unterschied, dass Uracil den Platz von Thymin einnimmt. Von den 64 Tripletts, die durch eine Kombination von 4 Nukleotiden gebildet werden können, haben 61 „Sinn“, d. h. sie kodieren Aminosäuren, und 3 sind „Unsinn“ (bedeutungslos). Es besteht ein ziemlich klarer Zusammenhang zwischen der Zusammensetzung von Tripletts und ihrer Bedeutung, der bei der Analyse der allgemeinen Eigenschaften des Codes entdeckt wurde. In einigen Fällen zeichnen sich Tripletts, die eine bestimmte Aminosäure (z. B. Prolin, Alanin) kodieren, dadurch aus, dass die ersten beiden Nukleotide (obligatorisch) gleich sind und das dritte (optional) alles sein kann. In anderen Fällen (z. B. bei der Kodierung von Asparagin, Glutamin) haben zwei ähnliche Tripletts die gleiche Bedeutung, bei der die ersten beiden Nukleotide zusammenfallen und an der Stelle des dritten ein beliebiges Purin oder ein beliebiges Pyrimidin steht.

Nonsense-Codons, von denen 2 spezielle Namen haben, die der Bezeichnung von Phagenmutanten entsprechen (UAA-Ocker, UAG-Amber, UGA-Opal), obwohl sie keine Aminosäuren kodieren, aber haben sehr wichtig beim Lesen von Informationen durch Kodierung des Endes einer Polypeptidkette.

Das Lesen von Informationen erfolgt in der Richtung von 5 1 -> 3 1 – bis zum Ende der Nukleotidkette (siehe Desoxyribonukleinsäuren). In diesem Fall verläuft die Proteinsynthese von einer Aminosäure mit einer freien Aminogruppe zu einer Aminosäure mit einer freien Carboxylgruppe. Der Beginn der Synthese wird durch die Tripletts AUG und GUG kodiert, die in diesem Fall eine spezifische Ausgangs-Aminoacyl-tRNA, nämlich N-Formylmethionyl-tRNA, umfassen. Dieselben Tripletts kodieren, wenn sie innerhalb der Kette lokalisiert sind, für Methionin bzw. Valin. Die Mehrdeutigkeit wird dadurch beseitigt, dass dem Beginn der Lektüre Unsinn vorausgeht. Es gibt Hinweise darauf, dass die Grenze zwischen Regionen der mRNA, die für verschiedene Proteine ​​kodieren, aus mehr als zwei Tripletts besteht und dass sich die Sekundärstruktur der RNA an diesen Stellen ändert; Dieses Problem wird derzeit erforscht. Kommt innerhalb eines Strukturgens ein Nonsense-Codon vor, so wird das entsprechende Protein nur bis zur Stelle dieses Codons aufgebaut.

Die Entdeckung und Entschlüsselung des genetischen Codes – eine herausragende Errungenschaft der Molekularbiologie – beeinflusste alle biologischen Wissenschaften und markierte in einigen Fällen den Beginn der Entwicklung spezieller großer Abschnitte (siehe Molekulargenetik). Die Wirkung von Gs Entdeckung und der damit verbundenen Forschung wird mit der Wirkung verglichen, die Darwins Theorie auf die biologischen Wissenschaften hatte.

Die Universalität von G. k. ist ein direkter Beweis für die Universalität des Grundlegenden molekulare Mechanismen Leben aller Vertreter organische Welt. Mittlerweile sind große Unterschiede in den Funktionen des genetischen Apparats und seiner Struktur beim Übergang von Prokaryoten zu Eukaryoten und von einzelligen zu mehrzelligen Organismen wahrscheinlich mit molekularen Unterschieden verbunden, deren Erforschung eine der Aufgaben der Zukunft ist. Seit G.K. ist Forschung nur noch eine Frage den letzten Jahren Die Bedeutung der erzielten Ergebnisse für die praktische Medizin ist jedoch nur indirekter Natur und ermöglicht es zunächst, die Natur von Krankheiten, den Wirkmechanismus von Krankheitserregern usw. zu verstehen medizinische Substanzen. Die Entdeckung solcher Phänomene wie Transformation (siehe), Transduktion (siehe), Unterdrückung (siehe) weist jedoch auf die grundsätzliche Möglichkeit hin, pathologisch veränderte Erbinformationen oder deren Korrektur zu korrigieren – die sogenannte. Gentechnik (siehe).

Tisch. GENETISCHER CODE

Erstes Nukleotid des Codons

Zweites Nukleotid des Codons

Drittens, Nukleotidcodon

Phenylalanin

J Unsinn

Tryptophan

Histidin

Glutaminsäure

Isoleucin

Asparaginsäure

Methionin

Asparagin

Glutamin

* Kodiert das Ende der Kette.

** Codiert auch den Anfang der Kette.

Literaturverzeichnis: Ichas M. Biologischer Code, trans. aus Englisch, M., 1971; Archer N.B. Biophysik zytogenetischer Läsionen und genetischer Code, L., 1968; Molekulargenetik, trans. aus dem Englischen, hrsg. A. N. Belozersky, Teil 1, M., 1964; Nukleinsäuren, trans. aus dem Englischen, hrsg. A. N. Belozersky, M., 1965; Watson J.D. Molekularbiologie des Gens, trans. aus Englisch, M., 1967; Physiologische Genetik, hrsg. M. E. Lobasheva S. G., Inge-Vechtomo-va, L., 1976, Bibliogr.; Desoxyribonuklease, Schlüßel des Lebens, hrsg. v„ E. Geissler, B., 1972; Der genetische Code, Gold Spr. Harb. Symp. quant. Biol., v. 31, 1966; W o e s e C. R. Der genetische Code, N. Y. a. o., 1967.

Vorlesung 5. Genetischer Code

Definition des Konzepts

Der genetische Code ist ein System zum Aufzeichnen von Informationen über die Aminosäuresequenz in Proteinen unter Verwendung der Nukleotidsequenz in der DNA.

Da DNA nicht direkt an der Proteinsynthese beteiligt ist, ist der Code in RNA-Sprache geschrieben. RNA enthält Uracil anstelle von Thymin.

Eigenschaften des genetischen Codes

1. Dreifachheit

Jede Aminosäure wird durch eine Sequenz von 3 Nukleotiden kodiert.

Definition: Ein Triplett oder Codon ist eine Sequenz aus drei Nukleotiden, die eine Aminosäure kodieren.

Der Code kann nicht monoplet sein, da 4 (die Anzahl der verschiedenen Nukleotide in der DNA) weniger als 20 beträgt. Der Code kann nicht dublettig sein, weil 16 (die Anzahl der Kombinationen und Permutationen von 4 Nukleotiden von 2) ist kleiner als 20. Der Code kann ein Triplett sein, weil 64 (die Anzahl der Kombinationen und Permutationen von 4 bis 3) beträgt mehr als 20.

2. Entartung.

Alle Aminosäuren, mit Ausnahme von Methionin und Tryptophan, werden von mehr als einem Triplett kodiert:

2 AK für 1 Triplett = 2.

9 AK, je 2 Drillinge = 18.

1 AK 3 Drillinge = 3.

5 AK von 4 Drillingen = 20.

3 AK von 6 Drillingen = 18.

Insgesamt 61 Tripletts kodieren 20 Aminosäuren.

3. Vorhandensein intergener Satzzeichen.

Definition:

Gen - ein DNA-Abschnitt, der eine Polypeptidkette oder ein Molekül kodiert tRNA, RRNA bzwsRNA.

GenetRNA, rRNA, sRNAProteine ​​sind nicht kodiert.

Am Ende jedes Gens, das ein Polypeptid kodiert, befindet sich mindestens eines von drei Tripletts, die RNA-Stoppcodons oder Stoppsignale kodieren. In mRNA haben sie folgende Form: UAA, UAG, UGA . Sie beenden (beenden) die Übertragung.

Herkömmlicherweise gehört das Codon auch zu den Satzzeichen AUG - die erste nach der Leader-Sequenz. (Siehe Vorlesung 8) Er fungiert als Großbuchstabe. In dieser Position kodiert es Formylmethionin (in Prokaryoten).

4. Eindeutigkeit.

Jedes Triplett kodiert nur eine Aminosäure oder ist ein Translationsterminator.

Die Ausnahme ist das Codon AUG . Bei Prokaryoten kodiert es an der ersten Stelle (Großbuchstabe) für Formylmethionin und an jeder anderen Stelle für Methionin.

5. Kompaktheit oder Fehlen intragener Satzzeichen.
Innerhalb eines Gens ist jedes Nukleotid Teil eines signifikanten Codons.

Im Jahr 1961 bewiesen Seymour Benzer und Francis Crick experimentell die Triplettnatur des Codes und seine Kompaktheit.

Die Essenz des Experiments: „+“-Mutation – Insertion eines Nukleotids. „-“-Mutation – Verlust eines Nukleotids. Eine einzelne „+“- oder „-“-Mutation am Anfang eines Gens zerstört das gesamte Gen. Eine doppelte „+“- oder „-“-Mutation zerstört auch das gesamte Gen.

Eine dreifache „+“- oder „-“-Mutation am Anfang eines Gens zerstört nur einen Teil davon. Eine vierfache „+“- oder „-“-Mutation zerstört wiederum das gesamte Gen.

Das Experiment beweist das Der Code wird transkribiert und es gibt keine Satzzeichen im Gen. Das Experiment wurde an zwei benachbarten Phagengenen durchgeführt und zeigte darüber hinaus Vorhandensein von Satzzeichen zwischen Genen.

6. Vielseitigkeit.

Der genetische Code ist für alle auf der Erde lebenden Lebewesen derselbe.

1979 wurde Burrell eröffnet Ideal Code der menschlichen Mitochondrien.

Definition:

„Ideal“ ist ein genetischer Code, bei dem die Degenerationsregel des Quasi-Dublett-Codes erfüllt ist: Wenn in zwei Tripletts die ersten beiden Nukleotide zusammenfallen und die dritten Nukleotide zur gleichen Klasse gehören (beide sind Purine oder beide sind Pyrimidine) , dann kodieren diese Tripletts für die gleiche Aminosäure.

Im Universalcode gibt es zwei Ausnahmen von dieser Regel. Beide Abweichungen vom idealen Code im Universellen beziehen sich auf grundlegende Punkte: den Beginn und das Ende der Proteinsynthese:

Codon

Universal

Code

Mitochondriale Codes

Wirbeltiere

Wirbellosen

Hefe

Pflanzen

STOPPEN

STOPPEN

Mit UA

A G A

STOPPEN

STOPPEN

230 Substitutionen verändern die Klasse der kodierten Aminosäure nicht. zur Zerreißbarkeit.

Im Jahr 1956 schlug Georgiy Gamow eine Variante des überlappenden Codes vor. Gemäß dem Gamow-Code ist jedes Nukleotid, beginnend mit dem dritten im Gen, Teil von 3 Codons. Bei der Entschlüsselung des genetischen Codes stellte sich heraus, dass er nicht überlappend war, d. h. Jedes Nukleotid ist Teil nur eines Codons.

Vorteile eines überlappenden genetischen Codes: Kompaktheit, geringere Abhängigkeit der Proteinstruktur von der Insertion oder Deletion eines Nukleotids.

Nachteil: Die Proteinstruktur ist stark vom Nukleotidersatz und Einschränkungen bei den Nachbarn abhängig.

1976 wurde die DNA des Phagen φX174 sequenziert. Es verfügt über eine einzelsträngige zirkuläre DNA, die aus 5375 Nukleotiden besteht. Es war bekannt, dass der Phage neun Proteine ​​kodiert. Bei 6 von ihnen wurden hintereinander liegende Gene identifiziert.

Es stellte sich heraus, dass es eine Überschneidung gibt. Gen E liegt vollständig innerhalb des Gens D . Sein Startcodon resultiert aus einer Rahmenverschiebung um ein Nukleotid. Gen J beginnt dort, wo das Gen endet D . Startcodon des Gens J überlappt mit dem Stopcodon des Gens D als Ergebnis einer Verschiebung von zwei Nukleotiden. Die Konstruktion wird als „Leserahmenverschiebung“ um eine Anzahl von Nukleotiden bezeichnet, die kein Vielfaches von drei ist. Überlappungen wurden bisher nur für wenige Phagen nachgewiesen.

Informationskapazität der DNA

Auf der Erde leben 6 Milliarden Menschen. Erbliche Informationen über sie
eingeschlossen in 6x10 9 Spermien. Nach verschiedenen Schätzungen hat eine Person 30 bis 50
Tausend Gene. Alle Menschen haben etwa 30 x 10 13 Gene oder 30 x 10 16 Basenpaare, die 10 17 Codons bilden. Die durchschnittliche Buchseite enthält 25 x 10 2 Zeichen. Die DNA von 6x10 9 Spermien enthält Informationen im Volumen von etwa

4x10 13 Buchseiten. Diese Seiten würden die Fläche von 6 NSU-Gebäuden einnehmen. 6x10 9 Spermien nehmen einen halben Fingerhut ein. Ihre DNA nimmt weniger als einen Viertelfingerhut ein.

Der genetische Code verschiedener Organismen weist einige gemeinsame Eigenschaften auf:
1) Dreifachheit. Um beliebige Informationen, auch erbliche Informationen, aufzuzeichnen, wird eine bestimmte Chiffre verwendet, deren Element ein Buchstabe oder ein Symbol ist. Die Sammlung solcher Symbole bildet das Alphabet. Einzelne Nachrichten werden mit einer Kombination von Zeichen geschrieben, die Codegruppen oder Codons genannt werden. Ein bekanntes Alphabet, das nur aus zwei Zeichen besteht, ist der Morsecode. In der DNA gibt es 4 Buchstaben – die Anfangsbuchstaben der Namen stickstoffhaltiger Basen (A, G, T, C), was bedeutet, dass das genetische Alphabet nur aus 4 Zeichen besteht. Was ist eine Codegruppe oder ein Wort eines genetischen Codes? Es sind 20 grundlegende Aminosäuren bekannt, deren Inhalt durch den genetischen Code festgeschrieben werden muss, d. h. 4 Buchstaben müssen 20 Codewörter ergeben. Nehmen wir an, ein Wort besteht aus einem Zeichen, dann erhalten wir nur 4 Codegruppen. Wenn das Wort aus zwei Zeichen besteht, gibt es nur 16 solcher Gruppen, und das reicht eindeutig nicht aus, um 20 Aminosäuren zu kodieren. Daher muss das Codewort mindestens 3 Nukleotide enthalten, was 64 (43) Kombinationen ergibt. Diese Anzahl an Triplettkombinationen reicht völlig aus, um alle Aminosäuren zu kodieren. Somit ist ein Codon des genetischen Codes ein Triplett von Nukleotiden.
2) Entartung (Redundanz) ist eine Eigenschaft des genetischen Codes, die einerseits darin besteht, dass er redundante Tripletts, also Synonyme, und andererseits „bedeutungslose“ Tripletts enthält. Da der Code 64 Kombinationen umfasst und nur 20 Aminosäuren kodiert sind, werden einige Aminosäuren durch mehrere Tripletts kodiert (Arginin, Serin, Leucin – sechs; Valin, Prolin, Alanin, Glycin, Threonin – vier; Isoleucin – drei; Phenylalanin, Tyrosin, Histidin, Lysin, Asparagin, Glutamin, Cystein, Asparaginsäure und Glutaminsäure – zwei; Methionin und Tryptophan – ein Triplett). Einige Codegruppen (UAA, UAG, UGA) tragen überhaupt keine semantische Last, das heißt, es handelt sich um „bedeutungslose“ Tripletts. „Sinnlose“ oder Unsinn-Codons fungieren als Kettenterminatoren – Satzzeichen im genetischen Text – und dienen als Signal für das Ende der Proteinkettensynthese. Diese Code-Redundanz ist von großer Bedeutung für die Erhöhung der Zuverlässigkeit der Übertragung genetischer Informationen.
3) Nicht überlappend. Code-Triplets überlappen sich nie, d. h. sie werden immer zusammen ausgestrahlt. Beim Lesen von Informationen aus einem DNA-Molekül ist es unmöglich, die stickstoffhaltige Base eines Tripletts in Kombination mit den Basen eines anderen Tripletts zu verwenden.
4) Eindeutigkeit. Es gibt keine Fälle, in denen dasselbe Triplett mehr als einer Säure entspricht.
5) Fehlen von Trennzeichen innerhalb des Gens. Der genetische Code wird von einer bestimmten Stelle ohne Kommas gelesen.
6) Vielseitigkeit. U verschiedene Arten In lebenden Organismen (Viren, Bakterien, Pflanzen, Pilze und Tiere) kodieren dieselben Tripletts dieselben Aminosäuren.
7) Speziesspezifität. Die Anzahl und Reihenfolge der stickstoffhaltigen Basen in der DNA-Kette variiert von Organismus zu Organismus.