Kennst du dein Genom?

Life is a DNA
software system. ~Craig Venter~

DNA. Der Baustein unseres Lebens. Alles, was in unserem Körper geschieht ist irgendwie darauf gespeichert. Unsere körpereigene Festplatte, die alle Programme enthält, damit das Betriebssystem „Mensch“ funktioniert. Programme, die wir an unsere Kinder weiterreichen. Manchmal mit kleinen Veränderung: Bugs oder Features? Das wird sich zeigen. Aber was passiert, wenn unser Programmcode in falsche Hände gerät?

Du und ich, wie ähnlich sind wir uns? Wie ähnlich sind unsere Genome? Zu über 99%! Überraschend? Nicht wirklich! Denn grundlegend funktionieren wir doch alle gleich. Tag für Tag müssen unsere Körper die gleichen Funktionen ausführen. Schlafen, verdauen, laufen,… Die Unterschiede zwischen unseren Genomen befinden sich zum Großteil an den Stellen, die man vor ein paar Jahren noch als Müll bezeichnet hat. Nämlich in den Regionen, die nicht in Proteine umgesetzt werden.

Was nun, wenn unser Genom in die falschen Hände gerät? Wie soll das überhaupt passieren? Winzig klein im innersten unserer Zellen verborgen. Aber eben in JEDER unserer Zellen: im Speichel, in jeder Hautschuppe, jedem Haar — DNA-Proben können aus nahezu allen Körpermaterialien gewonnen werden. Aber welche Information lässt sich daraus entnehmen? Was verrät dein Genom über dich?

Dein genetischer Fingerabdruck

Genetischer FingerabdruckIn unserer DNA gibt es ganz kurze oder etwas längere Sequenzen (6 Basenpaare oder bis zu 100 Basenpaare lang), die sich mehrmals hintereinander wiederholen. Wie oft sie sich wiederholen ist von Mensch zu Mensch unterschiedlich: du hast vielleicht nur eine Kopie, ich könnte sogar 30 Wiederholungen haben. Es gibt mehrere solcher Abschnitte auf der DNA, auf denen sich kurze Sequenzen wiederholen. Man nennt sie „Variable Number Tandem Repeats”. Die Anzahl der Wiederholungen einer solchen Sequenz im Genom lässt sich messen. Dafür wird die DNA in Bruchstücke zerlegt. Enthält ein Bruchstück 30 dieser Wiederholungen, dann ist es länger, als das gleiche Bruchstück mit nur einer Wiederholung. Diese Länge kann man messen. Die Bruchstücke fließen dafür eine bestimmte Zeitlang durch ein Gel — längere Bruchstücke fließen langsamer als kurze. Bruchstücke, die solche sich wiederholende Sequenzen enthalten werden mit einem Leuchtmittel markiert. Wenn man diesen Fluss stoppt, findet man die Bruchstücke als leuchtende Banden an unterschiedlichen Stellen im Gel. Untersucht man ein ganzes Genom mit viele Bruchstücken, dann erhält man ein Bandenmuster: den genetischen Fingerabdruck.

Wenn ich jetzt ein solches Bandenmuster deines Erbguts erstelle, was erfahre ich dann über deine Person? Deine Augenfarbe? Deine Körpergröße? Nein. Ein (genetischer) Fingerabdruck enthält kaum Information. Aber ich könnte dich damit identifizieren, denn er ist fast einzigartig. Um eine Person zu identifizieren, werden etwa 8-15 dieser wiederholenden Sequenzen mit Leuchtmittel markiert und ihre Länge gemessen. Die Wahrscheinlichkeit, dass ein anderer Mensch das gleiche Bandenprofil wie du aufweist, liegt bei eins zu mehreren Milliarden. Ist das Bandenmuster gleich, bist du also so gut wie identifiziert.

Luke, ich bin dein Vater

AbstammungstestGanz zufällig ist die Anzahl der Wiederholungen in einem Genom jedoch nicht. Sie wird vererbt. Eure DNA besteht aus zwei Kopien, eine von der Mutter, eine vom Vater. Betrachten wir wieder eine wiederholende Sequenz. Diese Sequenz kann jetzt auf eurem mütterlichen DNA-Strang mit mehr oder weniger Wiederholungen vorkommen, als auf eurem väterlichen DNA-Strang. Für jeden betrachteten Abschnitt kriegen wir also genau genommen nicht nur eine Bande, sondern zwei. Auf dieser Tatsache beruhen Vaterschaftstests. Dafür müssen mindestens 15 solcher DNA-Abschnitte untersucht werden, je mehr, desto aussagekräftiger. Besonders hilfreich ist es, wenn auch das Bandenmuster des anderen Elternteils vorliegt. Besonders genau sind die Tests, wenn man eine Elternschaft ausschließen will: schon wenn drei dieser Abschnitte nicht übereinstimmen, ist eine Elternschaft “praktisch ausgeschlossen”.

Wir lernen lesen

Was ist nun aber mit dem Schlüssel zum menschlichen Programmcode? Um zu verstehen, wie wir funktionieren und was uns gemeinsam als Spezies Mensch und jeden einzelnen von uns als Individuum ausmacht, brauchen wir mehr Information als nur ein Bandenmuster. Wir brauchen den Code: die komplette DNA-Sequenz. Für uns Bioinformatiker ist die DNA eine Zeichenkette aus vier Buchstaben, wobei jeder Buchstabe für eine der Nukleinbasen steht: A für Adenin, G für Guanin, C für Cytosin und T für Thymin. Das menschliche Genom besteht aus drei Milliarden Buchstaben. Diese Zeichenkette ist uns mittlerweile schon seit 15 Jahren bekannt.

The Royal Swedish Academy of Sciences has decided to award the 1980 Nobel Prize in chemistry […] and the other half jointly to Professor Walter Gilbert, Harvard University, USA, and Professor Frederick Sanger, Cambridge University, Great Britain, for their contributions concerning the determination of base sequences in nucleic acids. 

Es begann mit der Erfindung der DNA-Sequenzierung, wofür Walter Gilbert von der Harvard University und Frederick Sanger von der Cambridge University 1980 den Chemie-Nobelpreis bekamen. Sequenzierung bezeichnet das “Lesen” der DNA, also der Nukleotid-Abfolge. Bei der ursprünglichen Methode der Sequenzierung werden die Nukleotide radioaktiv markiert, damit man erkennt, an welcher Stelle sich welches Nukleotid befindet. Leider funktioniert das nicht für eine Kette aus drei Milliarden Nukleotiden, sondern nur für etwa 500-1000 Buchstaben. Man nimmt also kurzerhand die Schrotflinte und zerschießt die DNA in kleine Schnipsel — Shotgun Sequencing nennt sich diese Methode. Mit Schrotflinten auf DNA schießen ist natürlich Quatsch, in Wirklichkeit benutzt man Enzyme oder Ultraschall. Der Name bezieht sich auf die entstehenden Schnipsel, die (genau wie “Schrot”) zufällig sind. Wenn man die Sequenz vorher vervielfältigt hat, dann bekommt man ganz viele einzelne Schnipsel, die sich überlappen und wieder zur vollständigen Sequenz zusammengesetzt werden müssen. Mal wieder ein Puzzle — damit kennen sich Bioinformatiker ja bekanntlich aus.

Das Wettrennen um das menschliche Genom

Das Humangenom in kleinstmöglicher Schriftgröße gedruckt in über hundert Bänden mit je tausend Seiten. (By Russ London, WikiCommons, CC BY-SA 3)

Das Humangenom in kleinstmöglicher Schriftgröße gedruckt in über hundert Bänden mit je tausend Seiten.
(By Russ London, WikiCommons, CC BY-SA 3)

Um die menschliche Zeichenkette vollständig zu lesen, musste man Millionen solcher DNA-Schnipsel sequenzieren. Das war damals ein unglaublicher Aufwand, der nicht von einem einzigen Forschungsinstitut gestemmt werden konnte. Deswegen schlossen sich 1990 weltweit Forscher für das Humangenomprojekt zusammen mit dem Ziel, das menschliche Genom bis 2005 zu entschlüsseln. In den ersten Jahren ging das Projekt eher schleppend voran. Dann kam Craig Venter, gründete seine eigene Firma und behauptete: „Ich mach das schneller und billiger.“ Konkurrenz belebt ja bekanntlich das Geschäft. Im Februar 2001 (vier Jahre früher als erwartet), liefen dann beide gemeinsam über die Ziellinie und veröffentlichten das Humangenom: die einen in Nature, die anderen in Science.

Um ein englisches Buch verstehen zu können, muß man lesen und Englisch können. Sequenzieren entspricht dabei dem Lesenkönnen […].
Dr. Cornelius Courts

In den Medien hieß es daraufhin häufig „Das Humangenom ist entschlüsselt“. Aber was da vor uns lag, war der reine Programmcode. In einer Programmiersprache, die wir kaum verstehen konnten. Seit dem gilt es, den Code zu entschlüsseln. Die Sequenzanalyse ist eines der ältesten Forschungsgebiete der Bioinformatik. Es gibt vieles, das wir schon wissen und vieles, das noch verschlüsselt ist. Wo liegen unsere Gene? Welche Funktion hat welches Gen? Welche Abschnitte sind Müll? Sind sie wirklich Müll? Die Sequenzanalyse wirft immer wieder neue Fragen und Forschungsfelder auf.

Alles eine Frage der Kosten

Elf Jahre und 30 Milliarden US Dollar ist die Bilanz der Sequenzierung des menschlichen Genoms. Zum Vergleich: ein Vaterschaftstest kostet heutzutage etwa 200 Euro und untersucht die DNA von Kind, Mutter und Vater. Keine Gefahr also, dass jemand auf die Idee kommt, meine DNA zu sequenzieren, oder? Wären da nicht die Sequenziermethoden der neuen Generation. Hochdurchsatzsequenzierung erlaubt es uns mittlerweile eine menschliche DNA Sequenz in wenigen Tagen für schlappe 1000 Euro zu lesen. Ist das gefährlich? Wie fast jede Forschung wirft das natürlich ethische Fragen auf. Aber gleichzeitig ermöglicht es uns Unmengen an neuer Perspektiven, insbesondere für die Medizin. Und ein wenig cool wäre es schon auch, das eigene Genom auf SD-Karte in der Tasche zu haben.


Publikationen:

Das könnte dich auch interessieren …

8 Antworten

  1. Mai 3, 2016

    […] ihr, dass Lego-Steine ein super Modell für DNA sind? Natürlich nicht aus chemischer Sicht; aus informatischer Sicht aber schon. Für […]

  2. Juli 27, 2016

    […] als kompletter DNA-Strang gespeichert. Auch hier gebieten die Sequenziermethoden wieder Einhalt, denn sie können nur etwa 500 Nukleotide-lange Sequenzen lesen. Also wird die Datei zerstückelt gespeichert in 117 Nukleotid-langen Sequenzen: 100 Nukleotide […]

  3. September 12, 2016

    […] aus? Zwei große Fragen in der Geschichte der Genetik, die bereits ihre Antworten gefunden haben. Erbgut besteht aus DNA, einer Doppelhelix aus vier verschiedenen Bausteinen (Adenin, Thymin, Guanin … In welcher Reihenfolge diese Bausteine in unserem Erbgut zusammengesetzt sind haben wir gelernt zu […]

  4. September 12, 2016

    […] aus? Zwei große Fragen in der Geschichte der Genetik, die bereits ihre Antworten gefunden haben. Erbgut besteht aus DNA, einer Doppelhelix aus vier verschiedenen Bausteinen (Adenin, Thymin, Guanin … In welcher Reihenfolge diese Bausteine in unserem Erbgut zusammengesetzt sind haben wir gelernt zu […]

  5. September 30, 2016

    […] 2001 hatten wir zum ersten Mal die komplette Sequenz des menschlichen Genoms vor uns liegen. “Das Humangenom ist entschlüsselt” hieß es damals. Wie unwahr. Wir hatten die einzelnen Zeichen entschlüsselt — ja. Nur lag vor uns ein Text über hundert Bände (zu je tausend Seiten) in einer Sprache, die wir kaum verstanden. […]

  6. Oktober 18, 2016

    […] 2001 hatten wir zum ersten Mal die komplette Sequenz des menschlichen Genoms vor uns liegen. „Das Humangenom ist entschlüsselt“ hieß es damals. Wie unwahr. Wir hatten die einzelnen Zeichen entschlüsselt — ja. Nur lag vor uns ein Text über hundert Bände (zu je tausend Seiten) in einer Sprache, die wir kaum verstanden. […]

  7. Juni 26, 2019

    […] auf die „Big Data“-Ebene gehoben. Die wichtigsten Fragen werden heute durch die Sequenzierung viraler Genome und die bioinformatische Analyse dieser Sequenzdaten untersucht, um sie mit […]

  8. August 5, 2019

    […] die reinen Sequenzen, sondern die epigenetischen Informationen. Wie aber gewinnt man diese Daten? DNA-Sequenzierung liefert die Abfolge der Nukleotide, nicht aber die epigenetische Information darüber hinaus. Eine […]

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert