Bäume und Puzzlen — meine Promotion

Vielleicht habt ihr euch beim Lesen meines ersten Beitrags gefragt, warum ich genau dieses Thema für den Anfang gewählt habe. Die Antwort darauf ist einfach: es liegt mir ganz besonders am Herzen und ich stecke tief in der Materie WEIL es mein Promotionsthema war. Vier Jahre lang habe ich mich mit der Berechnung von Fragmentierungsbäumen aus Fragmentmassenspektren beschäftigt. Wenn ich zurück denke, wie ich eigentlich genau an dieses Thema geraten bin, dann muss ich zugeben, dass ich damals noch nicht an der Rettung der Welt durch neue Medikamente interessiert war. Mir ging es viel mehr um die Algorithmik — also die richtige, trockene, theoretische Informatik, die dahinter steckt.

Ein Elektronenstrahl schlägt ein Elektron aus dem Molekül heraus.

Die der Elektronenstossionisation werden Moleküle mit einem Elektronenstrahl beschossen, der ein Elektron aus dem Molekül heraus schlägt. Dadurch wird das Molekül zu einem positiv geladenen, radikalen Ion.

Zuerst habe ich mich damit beschäftigt, wie man Fragmentierungsbäume aus EI-Massenspektren berechnen kann. EI steht für ElektronenstoßIonisation und ist eine der möglichen Methoden ein Molekül zu fragmentieren. Allerdings eine, die aus informatischer Sicht einige Probleme mit sich bringt. Zum Beispiel kennt man die Masse des unzerstörten Moleküls nicht, was die Berechnung eines Fragmentierungsbaums ungemein schwieriger macht. Mit meiner Methode lässt sich so ein Baum für ein Molekül im Durchschnitt in weniger als einer Sekunde berechnen. Das ist übrigens viel schneller, als man so ein Fragmentmassenspektrum überhaupt messen kann.

Die Bäume der Informatiker

Fragmentierungs eines Moleküls

Ein Fragmentierungsbaum ist eine Art Diagramm, welches Schritt für Schritt den Zerfall des Moleküls in einzelne Fragmente veranschaulicht. Der Baum enthält NUR Summenformeln. Die Strukturformeln dienen nur der Veranschaulichung.

Was genau ist denn nun ein Fragmentierungsbaum? Wenn in der Informatik von Bäumen die Rede ist, hat das nicht viel mit Forstwirtschaft zu tun. Bäume sind ein Konzept aus der Graphentheorie — einem Teilgebiet der Mathematik und Informatik. Ein Fragmentierungsbaum ist eine Art Diagramm, welches den Fragmentierungsprozess des Moleküls veranschaulicht. Startend mit der Summenformel des Moleküls beschreibt ein Fragmentierungsbaum nicht nur die Summenformeln der einzelnen Fragmente, sondern auch wie diese Schritt für Schritt aus dem Molekül herausgebrochen wurden.

Wenn Chemiker puzzeln…

Vergleich zwischen zwei Fragmentierungsbäumen

Die Ähnlichkeit zwischen den beiden Aminosäuren Cystin und Methionin spiegelt sich in der Fragmentierungsmustern wider.

Die Information aus dem Fragmentierungsbaum dient Chemikern als Grundlage, um die Struktur des Moleküls wie ein Puzzle zusammenzusetzen. Mir als Informatikerin fehlt da leider das chemische Expertenwissen für dieses Puzzle. Deswegen ging mein Promotionsthema auch noch ein Stück weiter in Richtung Vergleich von Fragmentierungsbäumen. Wenn man die Fragmentierungsbäume von zwei strukturell ähnlichen Molekülen näher betrachtet, stellt man fest, dass sich Ähnlichkeiten zwischen den Molekülen in den Bäumen widerspiegeln. Mittels Baumvergleich kann man also herausfinden, welchen bereits bekannten Molekülen ein neues Molekül ähnelt oder z.B. zu welcher Stoffklasse es gehört: Ist es ein Alkohol, eine Aminosäure oder doch eher ein Zucker? Ich habe Algorithmen entwickelt, um den Fragmentierungsbaum eines unbekannten Moleküls mit tausenden bekannten Molekülen vergleichen zu können.

Zukunftsbasis

Je länger man an so einem Thema arbeitet, desto mehr hinterfragt man den Nutzen seiner Arbeit und ich bin sehr froh, dass Fragmentierungsbäume eine solide Basis für die Strukturaufklärung kleiner Moleküle schaffen konnten. Auch wenn mir die Wichtigkeit des Themas erst gegen Ende der Promotion bewusst wurde. Und auch wenn sich Wissenschaft (mal mehr und mal weniger schnell) weiterentwickelt, sind Fragmentierungsbäume zum Glück immer noch interessant und bilden die Grundlage für viele weitere Arbeiten, über die ich hier sicher noch das ein oder andere Mal berichten werde.


Publikationen:

Franziska Hufsky, Martin Rempt, Florian Rasche, Georg Pohnert, Sebastian Böcker
De Novo Analysis of Electron Impact Mass Spectra Using Fragmentation Trees.
Analytica Chimica Acta, 739, 67-76, 2012.

Fransika Hufsky, Kai Dührkop, Florian Rasche, Markus Chimani, Sebastian Böcker
Fast alignment of fragmentation trees.
Bioinformatics, 28 (12), i265-i273, 2012.

Florian Rasche, Kerstin Scheubert, Franziska Hufsky, Thomas Zichner, Marco Kai, Ales Svatos, Sebastian Böcker
Identifying the unknowns by aligning fragmentation trees.
Analytical Chemistry, 84 (7), 3417-3426, 2012.

Das könnte dich auch interessieren …

2 Antworten

  1. Januar 26, 2016

    […] interessant sind. “Damals” (es ist nun schon wieder zwei Jahre her) waren wir vor allem mit Fragmentierungsbäumen beschäftigt. Die Bäume haben die Arbeit der Chemiker erleichtert, können Strukturen jedoch nicht […]

  2. April 13, 2016

    […] Es begann mit der Erfindung der DNA-Sequenzierung, wofür Walter Gilbert von der Harvard University und Frederick Sanger von der Cambridge University 1980 den Chemie-Nobelpreis bekamen. Sequenzierung bezeichnet das “Lesen” der DNA, also der Nukleotid-Abfolge. Bei der ursprünglichen Methode der Sequenzierung werden die Nukleotide radioaktiv markiert, damit man erkennt, an welcher Stelle sich welches Nukleotid befindet. Leider funktioniert das nicht für eine Kette aus drei Milliarden Nukleotiden, sondern nur für etwa 500-1000 Buchstaben. Man nimmt also kurzerhand die Schrotflinte und zerschießt die DNA in kleine Schnipsel — Shotgun Sequencing nennt sich diese Methode. Mit Schrotflinten auf DNA schießen ist natürlich Quatsch, in Wirklichkeit benutzt man Enzyme oder Ultraschall. Der Name bezieht sich auf die entstehenden Schnipsel, die (genau wie “Schrot”) zufällig sind. Wenn man die Sequenz vorher vervielfältigt hat, dann bekommt man ganz viele einzelne Schnipsel, die sich überlappen und wieder zur vollständigen Sequenz zusammengesetzt werden müssen. Mal wieder ein Puzzle — damit kennen sich Bioinformatiker ja bekanntlich aus. […]

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert