Wissenschaftliches Rechnen erfolgreich reproduzieren

Data Centre am MDC. Bild: MDC

Ein Eckpfeiler der Wissenschaft ist, dass Experimente und Ergebnisse reproduzierbar sein müssen. Soweit die Theorie. In der Praxis ist dieses Ziel mitunter schwer zu erreichen. Denn gerade die experimentellen Rahmenbedingungen moderner Hochdurchsatzverfahren sind nicht nur teuer, sondern das Resultat jahrelanger äußerst sorgfältiger Arbeit.

Dass komplexe, maßgeschneiderte Computerprogramme oft die Analyse und Interpretation von Daten übernehmen, macht es noch schwerer, die Ergebnisse einer Forschungsgruppe unabhängig nachzuvollziehen.

Guix – eine freie Software, die Rechenumgebungen exakt und vollständig reproduzieren kann – könnte bei der Lösung dieses Problem helfen, sagt Ludovic Courtès vom Nationalen Forschungsinstitut für Informatik und Automatisierung in Frankreich (Inria).

Er arbeitet zusammen mit Ricardo Wurmus vom Berlin Institute for Medical Systems Biology (BIMSB) am Max-Delbrück-Centrum für Molekulare Medizin, sowie Kolleginnen und Kollegen des Utrecht Bioinformatics Center am Universitätsklinikums Utrecht und anderen Institutionen daran, Guix in den Dienst der wissenschaftlichen Reproduzierbarkeit zu stellen.

Erfassung kompletter Software-Umgebungen

Die National Science Foundation in den USA und Fachzeitschriften wie Nature legen auf die freie Verfügbarkeit von Quellcode und größtmögliche Reproduzierbarkeit mittlerweile großen Wert. „Doch ob ein Experiment reproduzierbar ist, hängt auch davon ab, ob sich die Softwareumgebung reproduzieren lässt“, sagt Courtès. „Besonders schwierig wird es, wenn Hochleistungsrechner erforderlich sind.“

Guix, das Teil des GNU-Projektes ist, löst mehrere Probleme auf einen Schlag. Es macht Nutzer von der Software-Verwaltung durch Administratoren unabhängig, sie können Softwareumgebung ganz an ihre Bedürfnisse anpassen.

Das Programm hat auch Vorteile gegenüber beliebten „Containerlösungen“, die vergleichbar sind mit einem neuen Computer, auf dem bereits alles vorinstalliert ist, sagt Courtés. „Das funktioniert nur so lange, bis kleine experimentelle Änderungen vorgenommen werden, um eine neue Hypothese zu testen. Und das geschieht häufig in der Forschung.“

Die Guix-Software basiert auf der Idee, Software-Umgebungen eindeutig zu beschreiben, ähnlich einer mathematischen Funktion. So lassen sich alle Beziehungen von Programmen untereinander charakterisieren und diese auf das Bit genau reproduzieren. Auf diese Weise vereinigt Guix zwei Anforderungen an eine wissenschaftliche Software-Umgebung: Reproduzierbarkeit und individuelle Anpassung.

Guix für Wissenschaftler

Allerdings wurde Guix ursprünglich nicht für das wissenschaftliche Hochleistungsrechnen (engl. high performance computing, HPC) konzipiert. Daher arbeiten Wissenschaftlerinnen und Wissenschaftler von MDC, Inria und ihren Partnern an Funktionen, die Guix auf Rechen-Clustern lauffähig machen, um auch dort reproduzierbare Arbeitsabläufe zu etablieren. Außerdem passen sie Programme an das Guix-System an und stellen sie als Pakete zur Verfügung.

„Vor Guix war die Installation von wissenschaftlicher Software zwangsläufig ad-hoc“, sagt Ricardo Wurmus. „Forschungsgruppen haben ihre eigenen Softwarevarianten kompiliert, sie statisch in bestehenden Systemen verlinkt und gehofft, dass sich nichts ändert. Denn die Verwaltung von Softwareumgebungen war praktisch unmöglich. Heute managen wir mit Guix nicht nur eine Umgebung je Forschungsgruppe. Wir verwenden es auf allen Ebenen: Gruppe, Benutzer, Workflow und so weiter.“

Das Projekt soll zwei Jahre laufen. In dieser Zeit wollen sie Software-Reproduzierbarkeit an ihren Institutionen erreicht haben. Courtès sagt: „Mit Guix machen wir einen großen Schritt hin zu einem grundlegen wissenschaftlichen Ziel. Davon wollen wir alle überzeugen, die auf Hochleistungs-Rechner angewiesen sind.“

Das Max-Delbrück-Centrum für Molekulare Medizin (MDC)

Das Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft (MDC) wurde 1992 in Berlin gegründet. Es ist nach dem deutsch-amerikanischen Physiker Max Delbrück benannt, dem 1969 der Nobelpreis für Physiologie und Medizin verliehen wurde. Aufgabe des MDC ist die Erforschung molekularer Mechanismen, um die Ursachen von Krankheiten zu verstehen und sie besser zu diagnostizieren, verhüten und wirksam bekämpfen zu können. Dabei kooperiert das MDC mit der Charité – Universitätsmedizin Berlin und dem Berlin Institute of Health (BIH) sowie mit nationalen Partnern, z.B. dem Deutschen Zentrum für Herz-Kreislauf-Forschung (DHZK), und zahlreichen internationalen Forschungseinrichtungen. Am MDC arbeiten mehr als 1.600 Beschäftigte und Gäste aus nahezu 60 Ländern; davon sind fast 1.300 in der Wissenschaft tätig. Es wird zu 90 Prozent vom Bundesministerium für Bildung und Forschung und zu 10 Prozent vom Land Berlin finanziert und ist Mitglied in der Helmholtz-Gemeinschaft deutscher Forschungszentren. http://www.mdc-berlin.de/

https://guix-hpc.bordeaux.inria.fr/ Die Website des Guix-HPC-Projekts
https://insights.mdc-berlin.de/de/2017/09/wissenschaftliches-rechnen-erfolgreich… Diese Meldung bei MDC Insights
https://www.inria.fr/en/centre/bordeaux/news/towards-reproducible-software-envir… Detaillierte Informationen in der Pressemitteilung des Nationalen Forschungsinstitut für Informatik und Automatisierung in Frankreich (Inria)

Media Contact

Annette Tuffs Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Neue Erkenntnisse zur Blütezeit-Regulation

Einfluss von Kohlenstoff- und Stickstoff-Signalwegen auf Blütenrepressoren bei Arabidopsis. In einer aktuellen Publikation in der Fachzeitschrift Plant Physiology hat ein internationales Forschungsteam, dem unter anderem Dr. Justyna Olas als eine…

Wenn Hepatitis-E-Viren Nervenzellen angreifen

Hepatitis-E-Viren (HEV) verursachen normalerweise Leberinfektionen. Sie können aber auch andere Organe befallen und insbesondere neurologische Erkrankungen auslösen. Über die Details ist noch wenig bekannt. Ein Forschungsteam um Michelle Jagst und…

Was T-Zellen im Tumor müde macht

Detaillierte Analyse im Journal Blood von Extramedullären Läsionen beim multiplen Myelom und neue Therapieansätze. Die extramedulläre Erkrankung (EMD) ist ein Hochrisikofaktor beim Multiplen Myelom. Angela Riedel und Leo Rasche vom…