DeepMind und EMBL veröffentlichen die vollständigste Datenbank mit vorhergesagten 3D-Strukturen menschlicher Proteine
Die Partner nutzen AlphaFold, das KI-System, um der wissenschaftlichen Gemeinschaft mehr als 350 000 Proteinstrukturvorhersagen, einschließlich des gesamten menschlichen Proteoms, zur Verfügung zu stellen
Karen Arnott/EMBL-EBI
AlphaFold hilft Wissenschaftlern bereits bei der Beschleunigung von Entdeckungen
Die Fähigkeit, die Form eines Proteins rechnerisch aus seiner Aminosäuresequenz vorherzusagen - anstatt sie durch jahrelange, mühsame und oft kostspielige Techniken experimentell zu bestimmen - hilft den Wissenschaftlern bereits jetzt, in Monaten zu erreichen, was früher Jahre dauerte.
"Die AlphaFold-Datenbank ist ein perfektes Beispiel für den positiven Kreislauf der offenen Wissenschaft", sagte EMBL-Generaldirektorin Edith Heard. "AlphaFold wurde mit Daten aus öffentlichen Ressourcen trainiert, die von der wissenschaftlichen Gemeinschaft aufgebaut wurden. Die offene und freie Weitergabe von AlphaFold-Vorhersagen wird es Forschern überall ermöglichen, neue Erkenntnisse zu gewinnen und Entdeckungen voranzutreiben. Ich glaube, dass AlphaFold wirklich eine Revolution für die Biowissenschaften darstellt, so wie es die Genomik vor einigen Jahrzehnten war, und ich bin sehr stolz darauf, dass EMBL DeepMind dabei helfen konnte, den offenen Zugang zu dieser bemerkenswerten Ressource zu ermöglichen."
AlphaFold wird bereits von Partnern wie der Drugs for Neglected Diseases Initiative (DNDi) genutzt, die damit ihre Forschung nach lebensrettenden Heilmitteln für Krankheiten vorantreibt, von denen die ärmeren Teile der Welt unverhältnismäßig stark betroffen sind, und das Centre for Enzyme Innovation (CEI) nutzt AlphaFold, um schnellere Enzyme für das Recycling einiger unserer umweltschädlichsten Einwegkunststoffe zu entwickeln. Für Wissenschaftler, die auf die experimentelle Bestimmung von Proteinstrukturen angewiesen sind, haben die Vorhersagen von AlphaFold dazu beigetragen, ihre Forschung zu beschleunigen. Ein Team an der University of Colorado Boulder beispielsweise nutzt die Vorhersagen von AlphaFold vielversprechend zur Untersuchung von Antibiotikaresistenzen, während eine Gruppe an der University of California San Francisco die Vorhersagen nutzt, um ihr Verständnis der Biologie von SARS-CoV-2 zu verbessern.
Die AlphaFold-Datenbank für Proteinstrukturen
Die AlphaFold-Proteinstrukturdatenbank* basiert auf zahlreichen Beiträgen der internationalen wissenschaftlichen Gemeinschaft sowie auf den hochentwickelten algorithmischen Innovationen von AlphaFold und der jahrzehntelangen Erfahrung von EMBL-EBI bei der gemeinsamen Nutzung der weltweiten biologischen Daten. DeepMind und das Europäische Institut für Bioinformatik (EMBL-EBI) stellen den Zugang zu den Vorhersagen von AlphaFold zur Verfügung, damit andere das System als Werkzeug nutzen können, um die Forschung zu ermöglichen und zu beschleunigen und völlig neue Wege der wissenschaftlichen Entdeckung zu eröffnen.
"Dies wird einer der wichtigsten Datensätze seit der Kartierung des menschlichen Genoms sein", sagte der stellvertretende EMBL-Generaldirektor und EMBL-EBI-Direktor Ewan Birney. "Indem wir die AlphaFold-Vorhersagen der internationalen wissenschaftlichen Gemeinschaft zugänglich machen, eröffnen sich so viele neue Forschungsmöglichkeiten, von vernachlässigten Krankheiten bis hin zu neuen Enzymen für die Biotechnologie und alles dazwischen. Dies ist ein großartiges neues wissenschaftliches Instrument, das die bestehenden Technologien ergänzt und es uns ermöglichen wird, die Grenzen unseres Verständnisses der Welt zu erweitern."
Neben dem menschlichen Proteom enthält die Datenbank zum Start ~350 000 Strukturen von 20 biologisch bedeutenden Organismen wie E. coli, Fruchtfliege, Maus, Zebrafisch, Malariaparasit und Tuberkulosebakterien. Die Erforschung dieser Organismen war Gegenstand unzähliger Forschungsarbeiten und zahlreicher bedeutender Durchbrüche. Diese Strukturen werden es Forschern in den verschiedensten Bereichen - von den Neurowissenschaften bis zur Medizin - ermöglichen, ihre Arbeit zu beschleunigen.
Die Zukunft von AlphaFold
Die Datenbank und das System werden regelmäßig aktualisiert, da wir weiterhin in zukünftige Verbesserungen von AlphaFold investieren. In den kommenden Monaten planen wir, die Abdeckung auf fast alle sequenzierten Proteine, die der Wissenschaft bekannt sind, zu erweitern - über 100 Millionen Strukturen, die den Großteil der UniProt-Referenzdatenbank abdecken.
Um mehr zu erfahren, lesen Sie bitte die Nature-Papiere, die unsere vollständige Methode und das menschliche Proteom beschreiben*, und lesen Sie die Anmerkungen der Autoren*. Sehen Sie sich den Open-Source-Code von AlphaFold an, wenn Sie sich die Funktionsweise des Systems ansehen möchten, und das Colab notebook*, um einzelne Sequenzen auszuführen. Um die Strukturen zu erforschen, besuchen Sie die EMBL-EBI-Datenbank*, die für alle offen und kostenlos ist.