Künstliche Intelligenz faltet RNA-Moleküle
Für die Funktion vieler Biomoleküle ist ihre dreidimensionale Struktur entscheidend. Daher sind Forschende nicht nur an der Sequenz der Einzelbausteine von Biomolekülen interessiert, sondern auch an ihrer räumlichen Struktur. Mithilfe von Künstlicher Intelligenz (KI) kann man bereits zuverlässig die dreidimensionale Struktur eines Proteins aus dessen Aminosäuresequenz vorhersagen. Für RNA-Moleküle steht diese Technik jedoch erst am Anfang. Forschende der Ruhr-Universität Bochum (RUB) beschreiben in der Zeitschrift „PLOS Computational Biology“ vom 7. Juli 2022 einen Weg, um mit KI die Struktur bestimmter RNA-Moleküle zuverlässig aus ihrer Nukleotidsequenz vorherzusagen.
Für die Arbeiten kooperierten die Teams um Vivian Brandenburg und Prof. Dr. Franz Narberhaus vom Lehrstuhl für Biologie der Mikroorganismen der RUB mit Prof. Dr. Axel Mosig vom Kompetenzbereich Bioinformatik des Bochumer Zentrums für Proteindiagnostik.
Zellumgebung muss berücksichtigt werden
„Oft wird RNA nur als Bote zwischen der genomischen DNA und den Proteinen verstanden“, sagt Axel Mosig. „Aber viele RNA-Moleküle übernehmen zelluläre Funktionen.“ Wichtig dafür ist ihre räumliche Struktur. Ähnliche Bereiche in einer Nukleotidsequenz können sich zusammenlagern und dadurch dreidimensionale Anordnungen bilden.
„Diese Selbstähnlichkeiten in einer RNA-Sequenz zu identifizieren ist wie ein mathematisches Puzzle“, erklärt Vivian Brandenburg. Für dieses Puzzle gibt es ein biophysikalisches Modell mit entsprechenden Vorhersage-Algorithmen. Das Modell kann allerdings nicht die zelluläre Umgebung der RNA berücksichtigen – und diese beeinflusst den Faltungsprozess ebenfalls. „Würde die RNA isoliert in wässriger Lösung schwimmen, könnte das Modell die Struktur sehr präzise vorhersagen“, so Brandenburg. Aber in einer lebenden Zelle sind viele andere Bestandteile enthalten.
Hier kommt die Künstliche Intelligenz ins Spiel. Diese kann anhand von bekannten Strukturen subtile Muster lernen, die sich aus der zellulären Umgebung ergeben. Diese Erkenntnisse könnte die KI dann in ihre Strukturvorhersagen einbeziehen. Für den Lernprozess braucht die KI aber ausreichend Trainingsdaten – und die fehlen in der Praxis eigentlich.
Trainingsdaten mit einem Trick gewinnen
Um das Problem der fehlenden Trainingsdaten zu lösen, bediente sich das Bochumer Team eines Tricks: Die Forschenden arbeiteten mit bekannten RNA-Struktur-Motiven. Mit einer Art Rückwärtsgang konnten sie aus den Energiemodellen dieser Strukturen fast beliebig viele Nukleotidsequenzen generieren, die in diese räumlichen Strukturen falten würden. Mithilfe dieses sogenannten inversen Faltens erzeugten die Wissenschaftlerinnen und Wissenschaftler viele Paare aus Nukleotidsequenzen und Strukturen, mit denen sie die KI trainieren konnten.
Neue Strukturen zuverlässig vorhersagbar
Anschließend konfrontierten die Forschenden die KI mit einer neuen Aufgabe: Sie musste die Struktur von bestimmten bakteriellen RNA-Molekülen vorhersagen. Diese Moleküle – Transkriptions-Terminatoren genannt – sind in Bakterien wichtige Stopp-Signale bei der Übersetzung genomischer DNA. Oft sind sie, wie viele andere RNA-Moleküle mit wichtigen zellulären Funktionen, im Erbgut versteckt und schwierig von Bereichen mit anderen Funktionen zu unterscheiden.
Die Künstliche Intelligenz konnte die typische Struktur der Transkriptions-Terminatoren, die an eine Haarnadel erinnert, zuverlässig erkennen und vorhersagen. Das konnte das Forschungsteam anhand von öffentlich zugänglichen experimentellen Daten nachweisen.
„Während KI-Ansätze bei der Vorhersage von Proteinstrukturen mittlerweile fast unumgänglich sind, steht die Entwicklung bei RNA-Strukturen erst am Anfang“, fasst Axel Mosig zusammen.
Wissenschaftliche Ansprechpartner:
Prof. Dr. Axel Mosig
Kompetenzbereich Bioinformatik
Zentrum für Proteindiagnostik
Ruhr-Universität Bochum
Tel.: +49 234 32 18133
E-Mail: axel.mosig@bph.rub.de
Originalpublikation:
Vivian Brandenburg, Franz Narberhaus, Axel Mosig: Inverse folding based pre-training for the reliable identification of intrinsic transcription terminators, in: PLOS Computational Biology, 2022, DOI: 10.1371/journal.pcbi.1010240
Media Contact
Alle Nachrichten aus der Kategorie: Biowissenschaften Chemie
Der innovations-report bietet im Bereich der "Life Sciences" Berichte und Artikel über Anwendungen und wissenschaftliche Erkenntnisse der modernen Biologie, der Chemie und der Humanmedizin.
Unter anderem finden Sie Wissenswertes aus den Teilbereichen: Bakteriologie, Biochemie, Bionik, Bioinformatik, Biophysik, Biotechnologie, Genetik, Geobotanik, Humanbiologie, Meeresbiologie, Mikrobiologie, Molekularbiologie, Zellbiologie, Zoologie, Bioanorganische Chemie, Mikrochemie und Umweltchemie.
Neueste Beiträge
Spitzenforschung in der Bioprozesstechnik
Das IMC Krems University of Applied Sciences (IMC Krems) hat sich im Bereich Bioprocess Engineering (Bioprozess- oder Prozesstechnik) als Institution mit herausragender Expertise im Bereich Fermentationstechnologie etabliert. Unter der Leitung…
Datensammler am Meeresgrund
Neuer Messknoten vor Boknis Eck wurde heute installiert. In der Eckernförder Bucht, knapp zwei Kilometer vor der Küste, befindet sich eine der ältesten marinen Zeitserienstationen weltweit: Boknis Eck. Seit 1957…
Rotorblätter für Mega-Windkraftanlagen optimiert
Ein internationales Forschungsteam an der Fachhochschule (FH) Kiel hat die aerodynamischen Profile von Rotorblättern von Mega-Windkraftanlagen optimiert. Hierfür analysierte das Team den Übergangsbereich von Rotorblättern direkt an der Rotornabe, der…