Was bei der Vorhersage der Arzneiwirkung passiert

Wie kommen Modelle des Maschinellen Lernens in der Arzneimittelforschung zu ihren Vorhersagen? Die Abbildung zeigt die Schritte dieses Prozesses.
Abbildung: Jannik P. Roth und Jürgen Bajorath

Forschungsticker Uni Bonn:

Welcher Arzneimittelkandidat hat die beste Wirksamkeit für eine bestimmte Erkrankung? Solche Vorhersagen werden am Computer bearbeitet – mit Hilfe des Maschinellen Lernens und anderer Ansätze der Künstlichen Intelligenz. Dabei geht es häufig darum, wie gut ein Wirkstoff an ein Zielprotein bindet und dadurch eine bestimmte Wirkungskette im Körper auslöst. Jannik P. Roth und Prof. Dr. Jürgen Bajorath von der Universität Bonn und vom Lamarr Institut für Maschinelles Lernen und Künstliche Intelligenz stellen im Journal “Cell Reports Physical Science” ihre Ergebnisse vor, wie gut solche Modelle des Maschinellen Lernens funktionieren.

UM WAS GEHT ES?
In der Medikamentenentwicklung werden „Machine Learning“-Modelle genutzt, um Vorhersagen darüber zu treffen, ob bestimmte chemische Verbindungen an pharmazeutische Zielproteine binden. Diese und andere Ansätze der künstlichen Intelligenz haben in der Regel „Black Box“-Charakter, denn die Ergebnisse können nicht ohne zusätzliche Computeranalysen verstanden werden. Deshalb entwickeln wir Methoden, um erklären zu können, wie einzelne Vorhersagen erreicht werden. In dieser Studie haben wir ein “Machine Learning“-Modellsystem entwickelt, mit dem akkurate Vorhersagen von Varianten eines Algorithmus formal erklärt und verglichen werden können. Für konsistent korrekte Vorhersagen eines Wirkstoffmoleküls mit einem mehrfach modifizierten „Machine Learning“-Algorithmus werden die Merkmale des Moleküls identifiziert, die die Vorhersagen bestimmen, und diese Merkmale werden dann verglichen.

WAS IST DAS WICHTIGSTE ERGEBNIS?
In unserer Studie haben ähnliche Modelle (algorithmische Varianten) nahezu identische Vorhersagen produziert. Die Erklärungen dieser Vorhersagen mit einer unserer Methoden waren allerdings oft grundverschieden. Die Modelle kommen also aufgrund unterschiedlicher Annahmen zum gleichen Ergebnis. Dieses erschwert die Interpretation von Modellentscheidungen enorm und schränkt damit den praktischen Nutzen ein.

WELCHEN ANSATZ HABEN DIE FORSCHENDEN GEWÄHLT?
Zur Vorhersage der Aktivität potenzieller Medikamente haben wir Varianten des sogenannten SupportVectorMachine (SVM)-Algorithmus generiert – eine in vielen Bereichen etablierte Methode des „Machine Learning“. Um zu klären, was bei der Vorhersage passiert, haben wir ein Konzept aus der Spieltheorie, die sogenannten Shapley-Werte, angepasst und angewendet. Dieses Konzept quantifiziert für jeden Spieler eines Teams den individuellen Beitrag zum finalen Ergebnis. Unserer Analogie folgend sind „Spieler“ einzelne Atome oder Atomgruppen eines Moleküls, und das „Spiel“ ist die Aktivitätsvorhersage.

WAS WAR DIE GRÖSSTE HERAUSFORDERUNG?
Wir haben für diese Analyse eine neue Methode zur exakten und schnellen Berechnung von Shapley-Werten entwickelt. Mit dieser Methode konnten große Datenmengen analysiert und optimale Vergleichbarkeit von Erklärungen verschiedener Modellvarianten erzielt werden.

GIBT ES EINEN ANWENDUNGSBEZUG?
Unsere Methode zur genauen und effektiven Berechnung von Shapley-Werten für SupportVectorMachin-Modelle ist unabhängig vom Anwendungsgebiet und über die pharmazeutische Forschung hinaus generell einsetzbar.

WIE GEHT ES WEITER?
Ein zentrales Ergebnis unserer Studie ist, dass gleich gute „Machine Learning“-Vorhersagen auf sehr unterschiedlichen Wegen erreicht werden können. Die verschiedenen formalen Erklärungen erschweren die Interpretation der Ergebnisse, zum Beispiel aus einer chemischen Perspektive. Weitere Arbeiten werden sich deshalb auf die Vergleichbarkeit und Interpretierbarkeit algorithmischer Erklärungen konzentrieren, um neue methodische Konzepte zur Rationalisierung von „Machine Learning“-Modellen zu entwickeln.

Wissenschaftliche Ansprechpartner:

Prof. Dr. Jürgen Bajorath, LIMES-Institut der Universität Bonn, Bonn-Aachen International Center for Information Technology (B-IT) und Lamarr-Institut für Maschinelles Lernen und Künstliche Intelligenz, Tel. +49 (0)228 7369100, E-Mail: bajorath@bit.uni-bonn.de

Originalpublikation:

Jannik P. Roth, Jürgen Bajorath. Machine Learning Models with Distinct Shapley Value Explanations for Chemical Compound Predictions Decouple Feature Attribution and Interpretation, Cell Reports Physical Science, DOI: 10.1016/j.xcrp.2024.102110, URL: https://doi.org/10.1016/j.xcrp.2024.102110

https://www.uni-bonn.de/de/neues/148-2024

Media Contact

Katrin Piecha Dezernat 8 - Hochschulkommunikation
Rheinische Friedrich-Wilhelms-Universität Bonn

Alle Nachrichten aus der Kategorie: Biowissenschaften Chemie

Der innovations-report bietet im Bereich der "Life Sciences" Berichte und Artikel über Anwendungen und wissenschaftliche Erkenntnisse der modernen Biologie, der Chemie und der Humanmedizin.

Unter anderem finden Sie Wissenswertes aus den Teilbereichen: Bakteriologie, Biochemie, Bionik, Bioinformatik, Biophysik, Biotechnologie, Genetik, Geobotanik, Humanbiologie, Meeresbiologie, Mikrobiologie, Molekularbiologie, Zellbiologie, Zoologie, Bioanorganische Chemie, Mikrochemie und Umweltchemie.

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Parkinson-Medikament verändert durch Eisenmangel das Darmmikrobiom zum Schlechteren

Störung der mikrobiellen Gemeinschaft begünstigt Krankheitserreger im Darm. In einer bahnbrechenden neuen Studie, durchgeführt im Rahmen des FWF-geförderten Exzellenzclusters „Mikrobiomes drive Planetary Health“, haben Wissenschafter*innen der Universität Wien in Zusammenarbeit…

Neues Verfahren zur Rückgewinnung wertvoller Elemente aus Holzasche

Team der Hochschule Rottenburg und der Universität Tübingen erarbeitet Grundlagen zur Aufbereitung des bisherigen Verbrennungsabfalls als Sekundärrohstoff. Die Aschen, die bei der Holzverbrennung in Heiz- und Kraftwerken entstehen, enthalten wertvolle…

Auf der Spur des „Schlüsselproteins“

Neues Forschungsprojekt zur Ursache von Lungenhochdruck bei Herzinsuffizienz. Pulmonale Hypertonie (PH) ist eine schwerwiegende Erkrankung, bei der der Druck in den Blutgefäßen zwischen Herz und Lunge dauerhaft erhöht ist. Besonders…