Schnell und zuverlässig große Datenmengen sichern

Informatiker der Universität Jena entwickeln neues Modell zur Datensicherung

Jena In vielen Bereichen der Wirtschaft spielen heute Datenbanken eine entscheidende Rolle, um mit sehr großen Datenmengen effizient und sicher umgehen zu können. Von den Großbanken, mit ihren Millionen von Kontobewegungen pro Tag, die in Datenbanken sicher aufgezeichnet werden müssen, bis hin zu Datenbanken in der Genforschung, wo riesige Informationsmengen erzeugt und aufbewahrt werden. Solche Daten sind Teil des Kapitals dieser Unternehmen und müssen daher sorgfältig geschützt werden. Sie dürfen unter keinen Umständen, z. B. bei einem Stromausfall oder Computerabsturz, verloren gehen. Wie sie schnell und zuverlässig gesichert und nach Störungen wiederhergestellt werden können, haben jetzt Informatiker der Friedrich-Schiller-Universität Jena untersucht.

Man benutzt in der industriellen Praxis Verfahren, wie sie auch am heimischen PC üblich sind: Von wichtigen Daten werden regelmäßig Sicherungskopien angefertigt (Backup). Im Fehlerfall ist man dann in der Lage, die Datenbank von der Sicherungskopie aus wiederherzustellen (Restore). Allerdings umfassen industrielle Datenbanken mehrere Millionen oder gar Milliarden Datensätze, so dass eine Sicherung viele Stunden dauern kann. Die normale Datenbanknutzung wird dabei behindert oder es reicht der geplante Zeitraum, etwa in den Nachtstunden, gar nicht mehr aus, um die Datensicherung fertig zu stellen.

In Praxis und Wissenschaft existieren natürlich Lösungsvarianten für diese Problematik, beispielsweise indem man nur Teile der Datenbanken sichert. „Trotz allem ist die schiere Menge der zu kopierenden Daten der begrenzende Faktor“, erklärt der Jenaer Informatiker Christoph Gollmick. Er setzt darauf, Parallelität bei Sicherung und Wiederherstellung auszunutzen. Dabei wird nicht nur auf einer Festplatte gespeichert, sondern gleichzeitig auf mehreren Festplatten parallel, womit ein deutlicher Zeitvorteil erzielt wird.

Wie steuert man aber in der Praxis das Kopieren einer Datenbank, die auf 50 oder mehr Festplatten gespeichert ist und deren Sicherungskopie auf 16 Festplatten verteilt werden soll? In welcher Reihenfolge geht man vor, und wie stellt man sicher, dass im Fehlerfall auch das Wiederherstellen schnell geht? Diese und weitere Fragen wurden von Jenaer Informatikern erstmalig wissenschaftlich untersucht.

Am Lehrstuhl für Datenbanken und Informationssysteme der Friedrich-Schiller-Universität haben Christoph Gollmick und Dr. Uta Störl nun verschiedene Verfahren entwickelt und getestet, um paralleles Sichern und paralleles Wiederherstellen geeignet durchzuführen. Ein Referenzsystem für die Untersuchungen war dabei das Datenbankprodukt „DB2“ der Firma IBM, einem langjährigen Partner des Lehrstuhls. Mit Hilfe eines neu entwickelten Puffer-Prozess-Modells sind die Jenaer Informatiker in der Lage, alle möglichen Varianten für das parallele Sichern und Wiederherstellen zu programmieren. Diese Flexibilität erlaubt es, nicht nur schnelle Verfahren, sondern auch Robustheit gegenüber Störungen anzubieten. So kann eine lang laufende Sicherung z. B. auch dann fortgesetzt werden, wenn bei einem der parallel eingesetzten Sicherungsgeräte die Elektronik ausfällt.

Die beiden Jenaer Informatiker – Dr. Uta Störl arbeitet nach abgeschlossener Promotion mittlerweile bei der Dresdner Bank in Frankfurt – hoffen, dass ihre Verfahren bald in kommerzielle Datenbankprodukte einfließen, da diese, wie ihre Recherchen zeigten, paralleles Sichern und paralleles Wiederherstellen meist nur rudimentär beherrschen.

Kontakt:
Dipl.-Inf. Christoph Gollmick
Institut für Informatik der Universität Jena
Ernst-Abbe-Platz 2, 07743 Jena
Tel. 03641/946367
Fax: 03641/946302
E-Mail: gollmick@informatik.uni-jena.de

Media Contact

Axel Burchardt idw

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Sensoren für „Ladezustand“ biologischer Zellen

Ein Team um den Pflanzenbiotechnologen Prof. Dr. Markus Schwarzländer von der Universität Münster und den Biochemiker Prof. Dr. Bruce Morgan von der Universität des Saarlandes hat Biosensoren entwickelt, mit denen…

3D-Tumormodelle für Bauchspeicheldrüsenkrebsforschung an der Universität Halle

Organoide, Innovation und Hoffnung

Transformation der Therapie von Bauchspeicheldrüsenkrebs. Bauchspeicheldrüsenkrebs (Pankreaskarzinom) bleibt eine der schwierigsten Krebsarten, die es zu behandeln gilt, was weltweite Bemühungen zur Erforschung neuer therapeutischer Ansätze anspornt. Eine solche bahnbrechende Initiative…

Leuchtende Zellkerne geben Schlüsselgene preis

Bonner Forscher zeigen, wie Gene, die für Krankheiten relevant sind, leichter identifiziert werden können. Die Identifizierung von Genen, die an der Entstehung von Krankheiten beteiligt sind, ist eine der großen…