Der Rechner erkennt die Strukturformel

Forscher am Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI haben eine Software entwickelt, die chemische Strukturdarstellungen erkennt, rekonstruiert und in ein maschinenlesbares Format umwandelt. „chemoCR“, so der Name der innovativen Lösung, wird künftig gemeinsam mit der Münchner Firma InfoChem GmbH weiter entwickelt und vermarktet.

Die automatische Erschließung graphischer chemischer Strukturinformationen durch Software ist eines der herausragenden Probleme in der chemisch-pharmazeutischen Forschung. Publikationen und Patente enthalten Strukturformeln typischerweise als Bild. Für einen Chemiker ist das kein Problem. Häufig genügt sein schneller Blick, um chemische Strukturen einzuordnen. Für Computer sind solche Strukturen jedoch nur eine Anhäufung von Pixeln.

Mit der Software „chemoCR“ ist es nun erstmals möglich, in hohem Durchsatz aus den umfangreichen Sammlungen wissenschaftlicher Publikationen und aus Millionen von Patenten die in Bildern vorliegende chemische Strukturinformation in ein maschinenlesbares Format zu überführen. Die Computer werden dadurch in die Lage versetzt, die in chemisch-pharmazeutischen Patenten enthaltene Strukturinformation zu durchsuchen.

„Wir haben insgesamt drei Jahre an Forschungs- und Entwicklungsarbeit in dieses Projekt investiert und sind vom großen Interesse in der chemischen und pharmazeutischen Industrie positiv überrascht worden“, sagt Dr. Marc Zimmermann, Leiter der Entwicklung von „chemoCR“ am Fraunhofer SCAI. Die Partnerschaft mit InfoChem, einem weltweit etablierten Partner der chemischen und pharmazeutischen Industrie im Bereich chemischer Information, bezeichnet er als einen Meilenstein bei der Vermarktung der Software.

Das Potenzial von „chemoCR“ schätzen beide Partner als sehr hoch ein: „Heute zeichnen Chemiker in Indien, Russland oder anderen Billiglohnländern Strukturformeln per Hand ab und pflegen sie manuell in Datenbanken ein. Die damit verbundene Wertschöpfung geht momentan in diese aufstrebenden Länder. Mit „chemoCR“ können wir diesen Rekonstruktionsschritt jetzt per Computer schneller und billiger ausführen“, unterstreicht Dr. Peter Löw, Geschäftsführer der InfoChem.

„Mit unserer Software lassen sich erstmals Millionen von Patenten nach der in Bildern enthaltenen chemischen Strukturinformation durchsuchen. Wir eröffnen hierdurch neue Möglichkeiten, Patentansprüche auf Stoffe und Syntheseverfahren zu untersuchen. Damit adressieren wir ein Alltagsproblem der chemischen und pharmazeutischen Industrie“, ergänzt Prof. Dr. Martin Hofmann-Apitius, Leiter der Abteilung Bioinformatik am Fraunhofer-Institut SCAI.

Die Abteilung Bioinformatik am Fraunhofer-Institut SCAI in Sankt Augustin erforscht und entwickelt neue Lösungen in drei Bereichen der angewandten, biomedizinischen Informatik: Informationsextraktion und Semantische Textanalyse, Angewandte Chemoinformatik sowie Datengrid und Grid-Infrastruktur. Dabei arbeitet die Abteilung eng mit der Wirtschaft zusammen, um deren Wettbewerbsfähigkeit durch innovative Ansätze zu verbessern. Zu den Partnern und Kunden gehören sowohl die forschende Pharmaindustrie, als auch Biotechnologieunternehmen und Software-Häuser aus der Life-Science-Informatik.

Die InfoChem GmbH, München gehört zu den führenden Software-Anbietern im Bereich chemischer Struktur- und Reaktionsdatenverwaltung. Seit ihrer Gründung 1989 steht InfoChem für innovative Entwicklungen in der Chemie-Information und Chemoinformatik. Dabei liegen die Schwerpunkte in der Entwicklung und Vermarktung von Software für die effiziente Speicherung, Verwaltung, der Prozessierung sowie der Suche von chemischen Strukturen und Reaktionen in großen Datenbeständen. Hauptprodukte sind die InfoChem Fast Search Engine (ICFSE), die Chemie Cartridge für Oracle (ICCARTRIDGE) und der Reaktions-Klassifizierungsalgorithmus CLASSIFY. Ein weiterer Schwerpunkt liegt auf der Pflege und Weiterentwicklung der Struktur- und Reaktionsdatenbank SPRESI, die online unter dem Portal SPRESIweb recherchiert werden kann und Zugriff auf 5 Millionen Strukturen und Reaktionen erlaubt.

Seit 1991 gehört die InfoChem GmbH mit 80 Prozent zur Springer Science + Business Media. InfoChem zählt sowohl die großen Chemie- und Pharmaunternehmen als auch aufstrebende Start-up Firmen zu ihren Kunden.

Ansprechpartner:
Prof. Dr. Martin Hofmann-Apitius
Abteilungsleiter Bioinformatik
Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI
Schloss Birlinghoven, 53754 Sankt Augustin
E-Mail: martin.hofmann-apitius@scai.fraunhofer.de
Telefon: 02241-14-2802, Fax.: 02241-14-2656
Dr. Valentina Eigner-Pitto
InfoChem GmbH
Landsberger Straße 408 / V
81241 München
E-Mail: ve@infochem.de
Telefon: 089-583002, Fax: 089-5803839

Media Contact

Michael Krapp, idw

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Sensoren für „Ladezustand“ biologischer Zellen

Ein Team um den Pflanzenbiotechnologen Prof. Dr. Markus Schwarzländer von der Universität Münster und den Biochemiker Prof. Dr. Bruce Morgan von der Universität des Saarlandes hat Biosensoren entwickelt, mit denen…

3D-Tumormodelle für Bauchspeicheldrüsenkrebsforschung an der Universität Halle

Organoide, Innovation und Hoffnung

Transformation der Therapie von Bauchspeicheldrüsenkrebs. Bauchspeicheldrüsenkrebs (Pankreaskarzinom) bleibt eine der schwierigsten Krebsarten, die es zu behandeln gilt, was weltweite Bemühungen zur Erforschung neuer therapeutischer Ansätze anspornt. Eine solche bahnbrechende Initiative…

Leuchtende Zellkerne geben Schlüsselgene preis

Bonner Forscher zeigen, wie Gene, die für Krankheiten relevant sind, leichter identifiziert werden können. Die Identifizierung von Genen, die an der Entstehung von Krankheiten beteiligt sind, ist eine der großen…