Kleine Moleküle mit großer Wirkung
Kleine Moleküle — insbesondere Naturstoffe — sind die Grundlage der Entwicklung neuer Medikamente, z.B. neuer Antibiotika. Multiresistente Bakterien, gegen die kein uns bekanntes Antibiotikum mehr hilft, werden immer mehr gefürchtet. Um diese Bakterien bekämpfen zu können, braucht man vollkommen neue Antibiotika, deren Entdeckung zunehmend schwieriger wird. Mittels bioinformatischer Methoden lässt sich die Struktur neuer potentieller Wirkstoffe wesentlich schneller entschlüsseln.
Arbeitsgruppe: Prof. Sebastian Böcker, Lehrstuhl für Bioinformatik, FSU Jena
Gefahr durch multiresistente Bakterien
Seit der Entdeckung der antibiotischen Wirksamkeit von Penicillin durch Alexander Fleming (1929) hat man viele durch Bakterien ausgelöste Infektionskrankheiten, wie z.B. Cholera oder Syphilis, durch Antibiotika unter Kontrolle bekommen. Leider haben aber viele Bakterien im Laufe der Jahre Resistenzen gegen ein oder mehrere Antibiotika entwickelt. Dies liegt unter anderem am häufig verantwortungslosen Umgang mit Antibiotika, z.B. beim präventiven Einsatz in der Tierhaltung, als Medikament gegen Viren oder bei vorzeitigem Abbruch der Einnahme. Um multiresistente Bakterien bekämpfen zu können, braucht man vollkommen neue Antibiotika, die jedoch immer seltener auf den Markt kommen.
Die Kraft der Natur nutzen
Zur Herstellung von Medikamenten verwenden Menschen seit jeher Naturstoffe. Zur Entdeckung neuer Antibiotika, macht man sich Gifte zu Nutze, die von Bakterien und Pilzen zur Abwehr gegen andere Bakterienstämme produziert werden. Um diese Wirkstoffe nicht umständlich aus Pflanzen oder Bakterien gewinnen zu müssen, muss man die molekulare Struktur der Wirkstoffe entschlüsseln. Strukturaufklärung von kleinen Molekülen ist ein aufwendiger und kostenintensiver Prozess, der mittels bioinformatischer Methoden wesentlich beschleunigt werden kann.
Waage statt Lupe
Mit klassischen Lichtmikroskopen lassen sich Strukturen dieser Größen- (oder eher Kleinen-)ordnung nicht mehr erkennen. Stattdessen werden die Moleküle gewogen. Solche winzigen Massen lassen sich mit der sogenannten Massenspektrometrie ermitteln. Kennt man die exakte Masse, kann man daraus die Summenformel des Moleküls berechnen. Die Summenformel gibt die Zusammensetzung der Elemente im Molekül an, also wie viele Wasserstoff-, Kohlenstoffatome etc. im Molekül vorkommen. Auch wenn sich die Messtechniken in den letzten Jahren extrem verbessert haben, kann man die Masse leider nicht ganz exakt bestimmen. Beim Berechnen der Summenformel muss man daher einen bestimmten Fehlertoleranzbereich beachten. Durch diesen Fehlertoleranzbereich ergeben sich plötzlich extrem viele Summenformeln, die die ungenaue Masse erklären könnten.
Die Muster der Moleküle
Um die Summenformel dennoch bestimmen zu können, braucht man mehr Information. Deswegen schaut man sich das Isotopenmuster des Moleküls an. Die Elemente auf unserer Erde kommen nämlich in unterschiedlicher Form vor. Zwei Atome des gleichen Elements können unterschiedliche Anzahl an Neutronen enthalten, und haben somit ein unterschiedliches Gewicht. So gibt es z.B. neben dem “normalen” Wasserstoff (kein Neutron) auch schweren Wasserstoff (ein Neutron) und überschweren Wasserstoff (zwei Neutronen), der jedoch radioaktiv und somit instabil ist. Normaler Wasserstoff kommt auf unserem Planeten zu 99.985% vor, schwerer nur zu 0.015%. Durch die unterschiedliche Häufigkeit der Isotopen entsteht im Massenspektrum ein Muster — das Isotopenmuster — das sich für unterschiedliche Moleküle ändert. So kann man zwei Moleküle mit sehr ähnlicher Masse aber unterschiedlicher Summenformel voneinander unterscheiden. Mittels bioinformatischer Methoden, kann man das Isotopenmuster aller möglichen Summenformeln, die die gemessene Masse erklären würden, simulieren und mit dem gemessenen Isotopenmuster vergleichen, um die wahre Summenformel zu bestimmen.
Summenformel vs. Strukturformel
Die Summenformel beschreibt leider noch nicht die Struktur des Moleküls, d.h. die Anordnung der einzelnen Atome. Diese Anordnung bestimmt die chemischen Eigenschaften des Moleküls und somit auch dessen Wirksamkeit als Medikament. Für eine einzelne Summenformel gibt es wiederum Unmengen verschiedener atomarer Anordnungen und somit Unmengen möglicher Strukturformeln.
Zertrümmern für mehr Information
Um mit dem Massenspektrometer mehr Information als nur die Gesamtmasse des Moleküls zu ermitteln, wird das Molekül in Fragmente zerlegt, indem man es z.B. mit anderen Molekülen zusammenstoßen lässt. Die Massen der einzelnen Fragmente werden dann als ein für das Molekül typisches Spektrum erfasst. Experten werten solche Spektren aus, indem sie Diagramme zeichnen, welche die einzelnen Schritte, wie das Molekül bei der Kollision zerbrochen ist, per Hand nachvollziehen. Eine solche manuelle Interpretation ist jedoch umständlich, zeitaufwendig und erfordert Expertenwissen sowie Kenntnis über die Molekülstruktur. Interessant für die Entdeckung neuer Medikamente sind aber genau solche Moleküle, deren Struktur bisher unbekannt ist.
Bäume erklären die Chemie
Um die Analyse von Spektren unbekannter Moleküle in Zukunft zu erleichtern und wesentlich zu beschleunigen, hat die Arbeitsgruppe um Prof. Böcker das Konzept der Fragmentierungsbäume entworfen. Wenn in der Informatik von Bäumen die Rede ist, handelt es sich nicht um einen Baum im biologischen Sinn. Gemeint ist vielmehr das Konzept, das auch Stammbäumen zugrunde liegt. Ein Fragmentierungsbaum ist eine Art Diagramm, welches den Fragmentierungsprozess des Moleküls veranschaulicht – ähnlich der manuellen Interpretation durch einen Experten, nur automatisiert, schnell und ohne Vorwissen. Startend mit der Summenformel des Moleküls beschreibt ein Fragmentierungsbaum nicht nur die Summenformeln der einzelnen Fragmente, sondern auch wie diese Schritt für Schritt aus dem Molekül herausgebrochen wurden. Ein solcher Baum lässt sich in weniger als einer Sekunde berechnen.
Ein bisschen CSI
Dieser Baum dient nun wiederum — zusammen mit dem gemessenen Fragmentierungsspektrum — als Grundlage für die momentan stärkste Strukturformel-Suchmaschine der Welt: CSI:FingerID. Gibt man ihr das Fragmentierungsspektrum eines unbekannten Moleküls, sucht sie damit vollautomatisch in einer Strukturdatenbank, ohne die Spektren der darin enthaltenen Moleküle zu benötigen. Das ist wichtig, denn Spektren sind für neue, unbekannte Wirkstoffe noch nicht gemessen und referenziert wurden. CSI:FingerID beruht auf einem Machine Learning Ansatz. Aus dem gemessenen Spektrum und dem daraus berechneten Fragmentierungsbaum werden Eigenschaften abgelesen, z.B. die Masse des Moleküls und seiner Fragmente oder aber die Ähnlichkeit des Baums zu Bäumen anderer Moleküle. Mittels dieser Eigenschaften lässt sich durch das maschinell erlernte Wissen ein struktureller Fingerabdruck des Moleküls berechnen. Das klingt schon alles ein bisschen nach CSI — ist es auch, nämlich Compound Structure Identification. Mit diesem strukturellen Fingerabdruck kann man dann in der Strukturdatenbank nach dem Molekül suchen, das am wahrscheinlichsten diesen Fingerabdruck erzeugt hat.
Pharmazie, Forensik, Ernährung, Umwelt,… — die Liste ist lang
Neben der Pharmazie, spielt die Identifizierung kleiner Moleküle noch in vielen weiteren Forschungsfeldern eine große Rolle. In der Forensik z.B. testet man auf kleine Moleküle, um Abbauprodukte von Drogen, Giften etc. zu identifizieren. Ähnliches gilt für die Ernährungs- oder Umweltforschung. Aber auch bei der Aufklärung des Stoffwechsels von kaum erforschten Organismen stößt man ständig auf unbekannte Moleküle, die es zu entschlüsseln gilt.
Publikationen:
- Kai Dührkop, Huibin Shen, Marvin Meusel, Juho Rousu and Sebastian Böcker
Searching molecular structure databases with tandem mass spectra using CSI:FingerID.
Proc Natl Acad Sci USA, 112(41):12580-12585, 2015. - Florian Rasche, Aleš Svatoš, Ravi Kumar Maddula, Christoph Böttcher and Sebastian Böcker
Computing fragmentation trees from tandem mass spectrometry data.
Anal Chem, 83(4):1243-1251, 2011. - Sebastian Böcker, Matthias Letzel, Zsuzsanna Lipták and Anton Pervukhin
SIRIUS: Decomposing isotope patterns for metabolite identification.
Bioinformatics, 25(2):218-224, 2009.
Nun veröffentlicht.
Sehr nice!
Herzlichen Glückwunsch zum Blog! Sehr sehr guuut!
Wird mit Interesse verfolgt!