Informationstechnologie

21.04.2020

Proteinforschung: Künstliche Intelligenz hilft Proteine erkennen

Im Hochdurchsatz sollen Proteine identifiziert werden. © Julian Uzskoreit

Veränderungen in Proteinen können die Ursache für Krankheiten wie Krebs, Alzheimer oder Parkinson sein. Zwei neue Projekte in der Proteinforschung der Ruhr-Universität Bochum (RUB) sollen die Analyse im Hochdurchsatz treffsicherer und schneller machen.

Die Medizinische Fakultät der RUB fördert in ihrem Forum-Förderprogramm die Vorbereitung einer breiteren Datenbasis zum Abgleich veränderter Proteine mit rund 66.000 Euro.

Das Bundesministerium für Bildung und Forschung gibt 230.000 Euro für ein darauf aufbauendes Projekt, in dem Deep-Learning-Methoden helfen sollen, die Proteinerkennung effizienter zu machen.

Erkannt wird nur, was in der Datenbank ist

Die Massenspektrometrie ist eine Standardmethode für die Analyse von Proteinen. Proteine aus komplexen Proben werden zunächst vorverdaut und in Stücke geschnitten. Die Stücke, sogenannte Peptide, werden dann im Hochdurchsatz analysiert, indem die gemessenen Spektren mit theoretischen Spektren von Peptiden in einer Datenbank verglichen werden.

„Mit diesem Ansatz kann man aber nur die Peptide identifizieren, die auch in der zugrunde liegenden Datenbank enthalten sind“, verdeutlicht Projektleiter Dr. Julian Uszkoreit. Varianten oder unbekannte Peptide werden nicht erkannt.

Mehr Daten, größere Unschärfe

Eine Vielzahl von bekannten Varianten ist in der meistgenutzten Datenbank, der Uniprot KB, sogar schon verzeichnet. Allerdings werden sie nur selten bei der Identifikation von Peptiden verwendet. Zum einen ist das Herunterladen der nötigen Daten für Endnutzer kompliziert.

Zum anderen führt die Berücksichtigung aller Varianten zu einer stark vergrößerten Suchdatenbank und damit zu statistischen Problemen: Da man beim Abgleich der gemessenen Spektren mit denen der Datenbank nur statistische Wahrscheinlichkeiten einer Übereinstimmung ermittelt, wird die Suche bei einer sehr großen Datenbank unschärfer.

„Man findet einfach immer ein Spektrum, das einigermaßen passt, und muss deswegen den Schwellenwert für einen Treffer erhöhen“, erläutert Uszkoreit. „Im Endeffekt kann man dadurch weniger Peptide statistisch signifikant identifizieren.“

Im Forum-Projekt „Verbesserung der MS/MS-basierten Peptididentifikation durch die Nutzung annotierter Sequenzvarianten und -modifikationen“ wollen die Forscher ein Tool entwickeln, das den Export der großen Datenbank vereinfacht. Außerdem wollen sie das Problem der Unschärfe angehen.

Ihr Ansatz dafür ist wesentlich rechenaufwändiger als der bisherige, weswegen das Team auf eine cloudbasierte Lösung setzt. „Für diesen Ansatz muss eine Datenbank mit allen berücksichtigten verdauten Peptiden erstellt werden“, so Julian Uszkoreit

. „In dieser Datenbank kann nach den Gewichten der Peptide gesucht werden, was bis dato nicht möglich ist und nicht nur für die beschriebene Anwendung nützlich ist, sondern einen erheblichen Mehrwert für die gesamte Proteomics-Community haben kann.“

Auch ganz neue Peptidsequenzen erkennen

Das Projekt „Deep Learning for Protein Variants Detection“, kurz Deprovideo, setzt genau dort an und soll helfen, die großen Datenmengen der Proteindatenbank schneller und treffsicherer zu nutzen. Dabei hilft die Methode des Deep Learning. „Es gibt schon Suchmaschinen, weil vorhersagbar ist, wo die Ausschläge im Spektrum für ein bestimmtes Peptid sind“, erklärt Dr. Martin Eisenacher, der Leiter des Projekts.

„Wir wollen dahin kommen, dass man durch eine Vorhersage davon, wie hoch diese Ausschläge sind, eine sensitivere Peptididentifizierung ermöglicht.“

Spezielle Deep-Learning-Algorithmen sollen helfen, die Peptidsequenzen von aufgenommenen Spektren ohne Datenbankinformationen mittels einer sogenannten De-novo-Strategie zu identifizieren.

Hierdurch können bisher unbekannte Varianten bestimmt werden, welche womöglich weder aus genetischen Varianten hervorgehen noch durch andere Proteomikmethoden bestimmt werden konnten.

Die Algorithmen sollen mit großen Datenmengen trainiert werden, die in öffentlichen Datenbanken liegen. So sollen die Spektren von möglichst vielen Maschinen erkannt werden können.

Alle im Projekt erstellten Softwaretools und Modelle werden der Allgemeinheit zur Verfügung gestellt.

Pressekontakt

Dr. Julian Uszkoreit
Medizinisches Proteom-Center
Medizinische Fakultät
Ruhr-Universität Bochum
Tel.: +49 234 32 18109
E-Mail: julian.uszkoreit@rub.de

Media Contact

Meike Drießen Ruhr-Universität Bochum

Weitere Informationen:

https://news.rub.de/wissenschaft/2020-04-21-proteinfoschung-kuenstliche-intelligenz-hilft-proteine-erkennen

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

WGP bringt bestehende KI-Lösungen in industrielle Anwendung

11.11.2024 / Informationstechnologie

Flexible Strahlformung-Plattform optimiert LPBF-Prozesse

07.11.2024 / Informationstechnologie

Warum einfache Algorithmen überraschend gut funktionieren

07.11.2024 / Informationstechnologie

Neue Materialien für eine leistungsfähigere optische Datenübertragung

07.11.2024 / Informationstechnologie

Zurück zur Startseite

Kommentare (0) Antworten abbrechen

Neueste Beiträge

Biowissenschaften Chemie

Selen-Proteine: Neuer Ansatzpunkt für die Krebsforschung

Eine aktuelle Studie der Uni Würzburg zeigt, wie ein wichtiges Enzym in unserem Körper bei der Produktion von Selen-Proteinen unterstützt – für die Behandlung von Krebs bei Kindern könnte diese…

15.11.2024

Verkehr Logistik

Pendler-Bike der Zukunft

– h_da präsentiert fahrbereiten Prototyp des „Darmstadt Vehicle“. Das „Darmstadt Vehicle“, kurz DaVe, ist ein neuartiges Allwetter-Fahrzeug für Pendelnde. Es ist als schnelle und komfortable Alternative zum Auto gedacht, soll…

15.11.2024

Biowissenschaften Chemie

Neuartige Methode zur Tumorbekämpfung

Carl-Zeiss-Stiftung fördert Projekt der Hochschule Aalen mit einer Million Euro. Die bisherige Krebstherapie effizienter gestalten bei deutlicher Reduzierung der Nebenwirkungen auf gesundes Gewebe – dies ist das Ziel eines Projekts…

15.11.2024

Erhalten Sie Fördermittel für Ihre Innovationen!

Svenja Heimerl

NACHRICHTEN & BERICHTE

Aktuelle News

Selen-Proteine: Neuer Ansatzpunkt für die Krebsforschung

Pendler-Bike der Zukunft

Neuartige Methode zur Tumorbekämpfung

Entwicklung macht Betonieren zuverlässiger, sicherer und sparsamer

Proteinforschung: Künstliche Intelligenz hilft Proteine erkennen

Media Contact

Weitere Informationen:

WGP bringt bestehende KI-Lösungen in industrielle Anwendung

Flexible Strahlformung-Plattform optimiert LPBF-Prozesse

Warum einfache Algorithmen überraschend gut funktionieren

Neue Materialien für eine leistungsfähigere optische Datenübertragung

Kommentare (0) Antworten abbrechen

Neueste Beiträge

Selen-Proteine: Neuer Ansatzpunkt für die Krebsforschung

Pendler-Bike der Zukunft

Neuartige Methode zur Tumorbekämpfung