Eine künstliche Intelligenz hat kürzlich die Struktur aller bekannten Proteine vorhergesagt – genauer als jeder Algorithmus zuvor. Experten sind begeistert. Die Strukturbiologin Janet Thornton vom European Bioinformatics Institute ist vom Aussehen ihres Lieblingsproteins begeistert: „Die Struktur ist so einfach, als würde man das Protein um ein winziges Fass wickeln. Es ist symmetrisch und so schön.”
Struktur definiert Funktion
Proteine sind die winzigen molekularen Maschinen in unseren Zellen, die zum Beispiel Zucker abbauen oder dabei helfen, unser Erbgut zu kopieren. Dabei spielt die dreidimensionale Struktur von Proteinen eine Schlüsselrolle: Je nachdem, wie ein Protein aufgebaut ist, kann es in der Zelle unterschiedliche Aufgaben übernehmen. Die Struktur bestimmt also die Funktion des Proteins. Aus 2D wird 3D 1/2 Legende: Sichel Jeder Buchstabe steht für eine Aminosäure. Und aus der Sequenz eines Proteins errechnet AlphaFold … EMBL-EBI / DeepMind 2/2 Legende: … seine dreidimensionale Struktur. Die unterschiedlichen Farben zeigen, wie sicher der Algorithmus bei der Vorhersage ist. EMBL-EBI / DeepMind Um besser zu verstehen, wie Proteine funktionieren, muss man ihre Strukturen kennen. Allerdings ist es zeitaufwändig, teuer und oft schwierig, Proteinstrukturen im Labor experimentell zu bestimmen. Aus diesem Grund versuchen Forscher schon lange, am Computer genau vorherzusagen, wie ein Protein aussieht.
Das Universum der Proteinstrukturen
Was sie brauchen: die Bauanleitung für ein Protein und einen smarten Algorithmus. Forscher kennen die Bauanleitung aus unserem Genom. DeepMind, das zu Google gehört, liefert jetzt den intelligenten Algorithmus. Mehr als 200 Millionen solcher 3D-Strukturen konnten mehr oder weniger genau vorhergesagt werden. Zusammen mit dem European Bioinformatics Institute hinterlegte er die Daten in einer öffentlich zugänglichen Datenbank. Ein riesiger Datenschatz, so Janet Thornton: „Die Datenbank enthält die Vorhersagen aller Proteine, deren Bauanleitung bekannt ist. Sozusagen das Universum der Proteinstrukturen.“ Eine Vielzahl von Proteinstrukturen 1/5 Mythos: Proteinstrukturen sind sehr unterschiedlich. EMBL-EBI / DeepMind 2/5 Legende: Dank ihrer Struktur … EMBL-EBI / DeepMind 3/5 Legende: … können die spezifischen Aufgaben in der Zelle übernehmen. EMBL-EBI / DeepMind 4/5 Legende: Manchmal können sie verwirrend aussehen oder … EMBL-EBI / DeepMind 5/5 Legende: … schelmisch. EMBL-EBI / DeepMind Ein Meilenstein, findet Torsten Schwede, Professor für Strukturelle Bioinformatik am Biozentrum der Universität Basel. “Da hat es einen Quantensprung gegeben.” Zusammen mit anderen Forschern hat er die AlphaFold-KI auf Herz und Nieren geprüft.
CASP – So wird es getestet
Rahmen öffnen Rahmen schließen
CASP: Kritische Bewertung von Techniken zur Proteinstrukturvorhersage. dt: Kritische Überprüfung von Techniken zur Vorhersage von Proteinstrukturen. Das ist ein Gemeinschaftsexperiment, das seit 1994 alle zwei Jahre durchgeführt wird. Damit können Forscherteams ihre Methoden testen, wie genau sie die Struktur von Proteinen vorhersagen. Der Prozess ist einfach: Sie erhalten die Bauanleitung für die Proteine, die Sie innerhalb eines bestimmten Zeitraums vorhersagen müssen. Ihre Ergebnisse werden dann mit im Labor ermittelten Strukturen verglichen. Mit anderen Worten, wie nah kommen sie sich tatsächlich? AlphaFold hat die letzten beiden Ausgaben des Wettbewerbs gewonnen. Die diesjährigen Ergebnisse werden Mitte Dezember in Antalya, Türkei, bekannt gegeben. Die öffentlich zugängliche Datenbank existiert erst seit kurzem. Ein riesiger Pool an Proteinstrukturen – nur einen Mausklick entfernt. Schwede spricht von einem Paradigmenwechsel: „Er hat zu einer Demokratisierung des Zugangs geführt.“ Jetzt kann jeder zu seinem Webbrowser gehen und bei Bedarf auf die gewünschte Struktur zugreifen.
Die Datenbank wird verwendet
Rahmen öffnen Rahmen schließen
Mehr als eine halbe Million Forscher aus aller Welt haben bereits Zugang zu der Sammlung. Das hilft Forschern im Labor derzeit dabei, schneller zu lernen, wie ein bestimmtes Protein aussieht – und damit genau, wie es funktioniert. Dies sollte nur der Anfang sein. „Wir hoffen, dass diese Strukturen in Zukunft dazu beitragen werden, neue Medikamente gegen einige der schlimmsten Krankheiten zu entwickeln“, sagt Janet Thornton. Die meisten Medikamente wirken durch Bindung an Proteine. Was genau mit einem Protein passiert, kann der AlphaFold-Algorithmus allerdings noch nicht berechnen. Doch genau diese Informationen wären für die Medikamentenentwicklung enorm wichtig.
DeepMind
Rahmen öffnen Rahmen schließen
Das Start-up wurde 2010 in Großbritannien gegründet und vier Jahre später von Google aufgekauft. Das Unternehmen beschäftigt sich seit 2016 mit dem Problem, die Struktur eines Proteins allein anhand seiner Aminosäuresequenz vorherzusagen. Bereits 2018 schnitt AlphaFold von DeepMind bei CASP, einem öffentlichen Wettbewerb, bei dem künstliche Intelligenz danach beurteilt wird, wie gut sie Proteinstrukturen vorhersagt, besser ab als alle anderen Programme. 2020 gewann AlphaFold den Wettbewerb noch deutlicher. Der entsprechende Algorithmus ist seit Juli 2021 öffentlich zugänglich. Seit Ende Juli 2022 konnten Forscher dank einer Datenbank von DeepMind und dem European Bioinformatics Institute auf über 200 Millionen vorhergesagte Proteinstrukturen frei zugreifen. Der Entwickler DeepMind arbeitet bereits beständig daran, Künstliche Intelligenz für das neue Gebiet auszubilden, wie Bioinformatiker Torsten Schwede weiß: „DeepMind sieht das Potenzial in medizinischen Anwendungen von Künstlicher Intelligenz. Dann gibt es eindeutig mehr kommerzielles Interesse.” Die Zukunft wird zeigen, ob DeepMind – oder andere Wettbewerber – in der Lage sein werden, von diesen Fähigkeiten zu profitieren. Mit der Medikamentenentwicklung lässt sich Geld verdienen. Daher wird es spannend bleiben, ob diese medizinisch interessanten Daten weiterhin frei und öffentlich zugänglich sein werden.