Molekülbaupläne aus dem Computer

Chemie-Preis geht an zwei US-Amerikaner und einen Briten für die Vorhersage der räumlichen Struktur und die Synthese von Eiweißen

  • Steffen Schmidt
  • Lesedauer: 5 Min.
3D-Modell eines an ein anderes Molekül gebundenen Interleukin-Moleküls (lila) im Immunsystem
3D-Modell eines an ein anderes Molekül gebundenen Interleukin-Moleküls (lila) im Immunsystem

Als von immer mehr Lebewesen das komplette Erbmaterial entziffert wurde, sprach man gerne vom Bauplan des Lebens. Doch genau genommen war das nur ein Teil des Bauplans. Es ist bekannt, dass jeweils drei genetische »Buchstaben« (Basen der DNA) für je eine der 20 Aminosäuren codieren, aus denen sich alle Eiweißmoleküle lebender Organismen aufbauen. Doch wenn sich diese Aminosäuren zu einem Eiweißmolekül verbinden, passiert in Bruchteilen von Sekunden etwas Bemerkenswertes: Die verketteten Aminosäuren falten sich in einer ganz bestimmten Form. Diese räumliche Struktur ist entscheidend für ihre biologische Funktion.

Der US-Chemiker Christian Anfinsen (Nobelpreis 1972) fand heraus, dass eine bestimmte Abfolge von Aminosäuren immer die gleiche räumliche Struktur herausbildet. Er vermutete bereits damals in seiner Nobelpreisrede, eines Tages werde es möglich sein, die 3D-Struktur eines jeden Proteins allein aus der Sequenz der Aminosäurebausteine vorherzusagen. Es hat allerdings weitere 50 Jahre gedauert, bis diese Vision wahr wurde.

David Baker

David Baker, geboren 1962 in Seattle, forscht an der University of Washington in Seattle.

Eine Hälfte des diesjährigen Nobelpreises für Chemie geht an die Entwickler des KI-Systems »AlphaFold« – den Briten Demis Hassabis und den US-Amerikaner John Jumper vom Unternehmen Google DeepMind – »für die Vorhersage von Proteinstrukturen«. Die andere Hälfte bekommt der US-Amerikaner David Baker »für computergestütztes Proteindesign«.

Bis zu Beginn des 21. Jahrhunderts gab es nur relativ aufwendige experimentelle Verfahren, um die räumliche Form von Eiweißmolekülen aufzuklären: die Röntgenkristallografie (Nobelpreis 1962), die Kernspinresonanzspektroskopie (Nobelpreis 2002) und de Kryoelektronenmikroskopie (Nobelpreis 2017). Mit diesen Verfahren wurde im Verlauf mehrerer Jahrzehnte von Zehntausenden Forschern die 3D-Struktur von rund 200 000 Proteinen aufgeklärt. Die Daten dieser Proteine dienten nun der Künstlichen Intelligenz als Lernstoff, die mithilfe des Gelernten in wenigen Jahren eine vielfache Zahl von Proteinstrukturen fand.

Demis Hassabis

Demis Hassabis, geboren 1976 in London, ist Geschäftsführer von Google DeepMind in London.

Angefangen hatte diese Entwicklung 1994 mit dem Projekt namens »Critical Assessment of Protein Structure Prediction« (CASP), das sich zu einem Wettbewerb entwickelte. Alle zwei Jahre erhielten Forscher aus der ganzen Welt Zugang zu Aminosäuresequenzen von Proteinen, deren Struktur gerade bestimmt worden war. Die Strukturen wurden jedoch vor den Teilnehmern geheim gehalten. Die Herausforderung bestand darin, die Proteinstrukturen auf Grundlage der bekannten Aminosäuresequenzen vorherzusagen.

Es gab viele Teilnehmer, doch über Jahre erreichte die Trefferquote maximal 40 Prozent. Der Durchbruch gelang erst 2018, als mit DeepMind ein Unternehmen dazustieß, dass zuvor mit Methoden der Künstlichen Intelligenz (KI) auf dem Gebiet strategischer Brettspiele tätig war. Das unter Leitung von Demis Hassabis entwickelte Programm AlphaGo besiegte 2015 erstmals einen Profispieler. Hassabis, selbst Schachspieler, hatte erst Informatik studiert und dann in Neurowissenschaften promoviert. Sein KI-Programm nutzte Lernverfahren, bei denen sogenannte Transformer zum Einsatz kommen. Diese Programmelemente sorgen beim maschinellen Lernen dafür, dass bestimmte Elemente mehr »Aufmerksamkeit« erhalten als andere.

Die bei Go bewährte KI lieferte auch für die Molekülfaltung deutlich bessere Ergebnisse als alle bisherigen Verfahren zur Vorhersage von Eiweißstrukturen. Immerhin 60 Prozent der von AlphaFold prognostizierten Struktur waren korrekt. Den großen Sprung auf über 90 Prozent brachte dann das physikalisch-chemische Wissen von John Jumper, der 2017 zu DeepMind kam. Mit seiner Hilfe entstand AlphaFold2. Der Programmcode und die Trainingsdaten von AlphaFold2 wurden von der Firma 2021 kostenlos offengelegt. In der Folgezeit explodierte die Zahl der wissenschaftlichen Publikationen zu Proteinstrukturen. Jumper, der jüngste Chemie-Nobelpreisträger seit 70 Jahren, zeigte sich im ersten Interview für die Website des Nobelpreises amüsiert, dass er als Physiker im gleichen Jahr den Chemiepreis für Forschungen mithilfe Künstlicher Intelligenz bekommt, in dem zwei andere Physiker für ihre Grundlagenforschung zur KI mit dem Physikpreis geehrt wurden.

John Jumper

John Jumper, geboren 1985 in Little Rock (USA), ist leitender Wissenschaftler von Google DeepMind in London.

Doch schon mehr als 20 Jahre vor dem Einstieg von DeepMind in die Strukturforschung hatte der Biophysiker David Baker ein Softwarewerkzeug namens Rosetta entwickelt, das Proteinstrukturen auf der Grundlage physikalischer Prinzipien modellierte. Vor dem Erfolg von AlphaFold gehörte Rosetta zu den erfolgreichsten Teilnehmern im jährlichen CASP-Wettbewerb. Aber Baker ging es frühzeitig weniger um die Struktur bekannter Proteine als um die Synthese von Proteinen mit einer Wunschstruktur. Um neuartige Moleküle, die beispielsweise als Medikament oder als Bio-Katalysator fungieren können. Einer der so entstandenen Nanopartikel war Basis für einen Covid-19-Impfstoff.

Als AlphaFold2 angekündigt wurde, war noch nicht bekannt, ob das Programm frei nutzbar sein und der Programmcode offengelegt werden würde. Deshalb überarbeitete Bakers Team zusammen mit dem südkoreanischen Computerchemiker Minkyung Baek das bisherige Rosetta. Sie bauten einige der bekannt gewordenen Tricks in ihr Programm ein. Das neue RoseTTAFold lieferte nahezu genauso gute Ergebnisse wie AlphaFold2. Ein ergänzendes Werkzeug half den Wissenschaftlern um Baker, den Entwurf neuartiger Proteine zu vereinfachen.

So revolutionär die KI-Ansätze in der Proteinforschung sind, bleibt doch ein Problem bislang ungelöst, meint Lucie Delemotte von der Königlichen Technischen Hochschule in Stockholm: Die Algorithmen der KI erklären den Mechanismus der Faltung nicht. Baker meint dazu im Interview nach der Bekanntgabe des Nobelpreises: »Das ist eine große Frage. Ich denke, für die vielen Anwendungen, die die Vorhersage von Proteinstrukturen mit sich bringt, ist es nicht so wichtig, wie man dorthin gelangt.«

Die KI macht derzeit ohnehin die klassischen Verfahren nicht gänzlich überflüssig, kann diese aber erheblich vereinfachen. So erläuterte Randy Read von der englischen Universität Cambridge gegenüber dem Fachjournal »Nature«, dass beispielsweise zur Interpretation der Bilder der Röntgenkristallografie eine Anfangsvermutung über die Struktur nötig ist, um die Muster richtig zu übersetzen. Ein historisches Beispiel für ein solches Vorgehen war die Annahme einer Doppelhelix für die Struktur des Erbmoleküls DNA durch James D. Watson und Francis Crick. Mithilfe der KI bekommen die Kristallografen bereits ein fundiertes Grundmodell.

- Anzeige -

Das »nd« bleibt gefährdet

Mit deiner Hilfe hat sich das »nd« zukunftsfähig aufgestellt. Dafür sagen wir danke. Und trotzdem haben wir schlechte Nachrichten. In Zeiten wie diesen bleibt eine linke Zeitung wie unsere gefährdet. Auch wenn die wirtschaftliche Entwicklung nach oben zeigt, besteht eine niedrige, sechsstellige Lücke zum Jahresende. Dein Beitrag ermöglicht uns zu recherchieren, zu schreiben und zu publizieren. Zusammen können wir linke Standpunkte verteidigen!

Mit deiner Unterstützung können wir weiterhin:


→ Unabhängige und kritische Berichterstattung bieten.
→ Themen abdecken, die anderswo übersehen werden.
→ Eine Plattform für vielfältige und marginalisierte Stimmen schaffen.
→ Gegen Falschinformationen und Hassrede anschreiben.
→ Gesellschaftliche Debatten von links begleiten und vertiefen.

Sei Teil der solidarischen Finanzierung und unterstütze das »nd« mit einem Beitrag deiner Wahl. Gemeinsam können wir eine Medienlandschaft schaffen, die unabhängig, kritisch und zugänglich für alle ist.