Im Bereich der Biologie dient unsere DNA als umfassendes Codebuch, das wesentliche Anweisungen für das Funktionieren und die Entwicklung des K?rpers enth?lt.
Im Folgenden wird untersucht, wie ein KI-Ableger von Googles DeepMind 89 % von 71 Millionen potenziellen ?Fehlern“ in der DNA klassifiziert hat – ein krasser Gegensatz zu den 0,1 %, die von menschlichen Experten ermittelt wurden.
Das System wird inzwischen von Hunderttausenden von Forschern in 190 L?ndern eingesetzt. Doch zun?chst geht es um die Vorgeschichte.
Wie Protein kodiert und erzeugt wird
Ein wichtiges Kapitel des DNA-Codebuchs betrifft die Bildung von Proteinen, die lebenswichtige Aufgaben wie den Transport von Sauerstoff, die Erleichterung von Verdauung und die Aufrechterhaltung der strukturellen Integrit?t des K?rpers erfüllen. Dieses Kapitel besteht aus etwa 20.000 bis 25.000 Codew?rtern.
Im Laufe der Zeit k?nnen einige dieser Codew?rter besch?digt werden, was zu schweren Anomalien wie Typ-2-Diabetes, Krebs, Mukoviszidose und anderen Erkrankungen führt.
Diese fehlerhaften Codes, die als Missense-Mutationen bezeichnet werden, stellen Genmutationen dar – winzige Pannen, die, wenn sie in unseren Genen vorhanden sind, die Funktion der zugeh?rigen Proteine ver?ndern k?nnen.
Das ist so, als ob ein einziger Buchstabe in einem Wort umgedreht wird und m?glicherweise die gesamte Bedeutung eines Satzes ver?ndert.
Obwohl jeder von uns etwa 9.000 dieser fehlerhaften Codes in seiner DNA tr?gt, sind nicht alle von ihnen sch?dlich.
Genauso wie nicht jeder Tippfehler in einem Artikel dessen Kernaussage grundlegend beeinflusst, sind viele genetische Mutationen gutartig und haben kaum Auswirkungen auf unsere Gesundheit.
W?hrend die in unserem K?rper eingebauten Mechanismen flei?ig an der Korrektur dieser Mutationen arbeiten, wie die sorgf?ltige Rechtschreibprüfung eines Redakteurs, k?nnen nicht alle genetischen Fehler von der Zellmaschinerie unseres K?rpers repariert werden.
Entschlüsselung der genetischen Sprache
Diese genetische Sprache zu verstehen und die Auswirkungen der ?besch?digten Codes“ oder Fehler zu begreifen, ist ein zentrales Anliegen in der biologischen Forschung.
Dieses Unterfangen ist der Schlüssel zur Erschlie?ung fortschrittlicher Diagnosemethoden und zur Entwicklung von Therapien für genetische Krankheiten.
Die Entdeckung von sch?dlichen oder pathogenen Fehlern bietet uns die M?glichkeit, auf unsere Gesundheit und unser Wohlbefinden Einfluss zu nehmen und sicherzustellen, dass das genetische Codebuch so fehlerfrei und kraftvoll wie m?glich bleibt.
Obwohl Biologen seit langem bestrebt sind, die Auswirkungen von Missense-Mutationen zu entschlüsseln, bleibt es aufgrund der begrenzten experimentellen Datenlage weitgehend r?tselhaft.
Die Frage, welche der Millionen m?glichen genetischen Fehler zu einer Krankheit führen k?nnten, ist nach wie vor ungekl?rt.
So wurden beispielsweise von den mehr als 4 Millionen beobachteten Missense-Varianten beim Menschen nur 2 % von Experten als pathogen oder gutartig eingestuft, was etwa 0,1 % aller 71 Millionen potenziellen Missense-Varianten entspricht.
AlphaFold: Neue M?glichkeiten für die biologische Forschung
Im Jahr 2018 gelang DeepMind, der Tochtergesellschaft von Google, eine bahnbrechende Leistung in der biologischen Forschung.
Sie stellte AlphaFold vor, ein System der künstlichen Intelligenz (KI), das in der Lage ist, die 3D-Struktur eines Proteins allein anhand seiner Aminos?uresequenz genau vorherzusagen.
Damit wird das seit langem bestehende ?Proteinfaltungsproblem“ angegangen, eine Herausforderung, die Biologen seit über 50 Jahren vor ein R?tsel stellt.
Proteine sind die grundlegenden Bestandteile des Lebens, weil sie jeden biologischen Prozess steuern. Das Verst?ndnis der Struktur eines Proteins bietet tiefe Einblicke in die genetische Sprache und die Evolution.
AlphaFold wurde an rund 170.000 Proteinen aus der Proteindatenbank trainiert und konnte so Proteinstrukturen entschlüsseln.
Durch den Vergleich von Sequenzen in der Datenbank konnte es die N?he von Aminos?uren in gefalteten Strukturen ableiten und so fundierte Vermutungen über unbekannte Strukturen anstellen.
Diese bahnbrechende Technologie, die nach einigen Wochen maschinellen Lernens mit einer Rechenleistung von 100 bis 200 GPUs erreicht wurde, hat den Bereich der biologischen Forschung ver?ndert.
Eine von AlphaFold erstellte Datenbank mit Proteinstrukturen wird von Millionen von Forschern in 190 L?ndern für verschiedene Aufgaben genutzt, z. B. für das Verst?ndnis von Krankheiten oder die Beschleunigung der Arzneimittelentdeckung.
AlphaMissense: Revolution?re Erkennung von genetischen Fehlern
In Erweiterung des AlphaFold-Modells haben DeepMind-Forscher dieses Modell kürzlich mit der F?higkeit ausgestattet, die Pathogenit?t von Missense-Varianten vorherzusagen.
Zu diesem Zweck wurde AlphaFold auf Kennzeichnungen abgestimmt, die Varianten in menschlichen und eng verwandten Primatenpopulationen unterscheiden.
H?ufig beobachtete Varianten werden als gutartig eingestuft, w?hrend nicht beobachtete Varianten als pathogen klassifiziert werden.
Dieses neu entwickelte Modell, das als AlphaMissense bekannt ist, bietet einen kontinuierlichen Score, mit dem Nutzer einen Schwellenwert für die Variantenklassifizierung entsprechend ihren spezifischen Genauigkeitsanforderungen w?hlen k?nnen.
Die Forscher wiesen in ihrer in der Zeitschrift Science ver?ffentlichten Arbeit nach, dass AlphaMissense 89 % aller 71 Millionen potenziellen Missense-Varianten als wahrscheinlich pathogen oder gutartig einstufte, verglichen mit den 0,1 %, die von menschlichen Experten identifiziert worden waren.
Die Feinabstimmung des vortrainierten AlphaFold reduziert zudem den Bedarf an umfangreichen Trainingsdaten, Rechenzeit und Energieverbrauch.
AlphaMissense-Katalog: Unterstützung der genetischen Forschung
DeepMind hat einen auf den Prognosen des AlphaMissense-Modells basierenden Katalog erstellt und ihn der ?ffentlichkeit zug?nglich gemacht.
Dieser Katalog kann zwar keine direkten Diagnosen stellen, dient aber als wertvolle Ressource für Forscher und Mediziner.
Um festzustellen, ob eine bestimmte Missense-Variante für eine Krankheit verantwortlich sein k?nnte, steht den Forschern nun eine Tabelle mit dem voraussichtlichen Pathogenit?tswert zur Verfügung.
AlphaMissense k?nnte Forschern dabei helfen, den Prozess der Zuordnung von genetischen Mutationen zu Krankheiten zu rationalisieren, indem unwahrscheinliche Optionen schnell ausgeschlossen werden. Au?erdem k?nnte es unser Verst?ndnis für übersehene Aspekte unseres genetischen Codes verbessern.
Dieser offene Katalog kann dazu beitragen, Licht in bisher r?tselhafte Zust?nde zu bringen und den Weg zu genaueren Diagnosen und Behandlungen zu weisen.
Die Forscher von DeepMind betonen jedoch, dass die Vorhersagen nicht isoliert verwendet werden sollten, sondern eher als Leitfaden für die reale Wissenschaft dienen.
DeepMind hat bei der Ver?ffentlichung seines trainierten Modells einen vorsichtigen Ansatz gew?hlt, um einen m?glichen Missbrauch dieser Technologie zu verhindern.
Anstatt das Modell zum sofortigen Download und zur Nutzung zur Verfügung zu stellen, haben sie alle wesentlichen Informationen, einschlie?lich des Computercodes, zug?nglich gemacht, damit andere ihre Arbeit nachahmen k?nnen.
Fazit?
In dem Bestreben, unseren genetischen Code zu verstehen und die Geheimnisse genetischer Krankheiten zu lüften, bietet die AlphaMissense-KI von DeepMind ein innovatives Werkzeug.
Die Klassifizierung von 89 % aller 71 Millionen potenziellen Missense-Varianten, im Vergleich zu den 0,1 %, die bisher erreicht wurden, ist unglaublich – ein Beweis dafür, wie viel wertvolle Arbeit künstliche Intelligenz leisten kann.
Dank der Vorhersage der Pathogenit?t von Missense-Varianten erm?glichen diese Instrumente Forschern und Medizinern, den genetischen Ursprung komplexer Syndrome zu ermitteln.
Der ?ffentlich zug?ngliche AlphaMissense-Katalog ist zwar kein eigenst?ndiges Diagnosetool, stellt aber eine wertvolle Ressource für die genetische Forschung dar und hat das Potenzial, die Verknüpfung von Genmutationen mit Krankheiten zu beschleunigen.
Der vorsichtige Ansatz von DeepMind stellt sicher, dass diese transformative Technologie verantwortungsvoll genutzt wird, indem sie einen offenen Zugang zu wichtigen Informationen gew?hrt und gleichzeitig vor m?glichem Missbrauch schützt.