Wie sich die „Sintflut der Daten“ beherrschen lässt

Mit jedem Click im World Wide Web und jedem Schnappschuss mit einer Digitalkamera wächst die Menge der Daten, die gespeichert und ausgewertet werden kann. Das Wachstum ist so groß, dass Experten heute bereits von der „Sintflut der Daten“ sprechen.

„Dabei geht es nicht allein darum, dass immer mehr Daten ausgewertet werden müssen“, sagt Prof. Dr. Joachim Giesen von der Friedrich-Schiller-Universität Jena. „Die gespeicherten Daten werden auch immer komplexer“, weiß der Inhaber des Lehrstuhls für Theoretische Informatik II. So nehme zum Beispiel nicht nur die Anzahl der gespeicherten Digitalfotos zu, sondern auch deren Auflösung. Ein mögliches Maß für die Komplexität von Daten ist ihre Dimensionalität. Die Dimension eines Digitalfotos ist z. B. gerade die Anzahl seiner Pixel. Will man solche Daten auswerten, steht man früher oder später vor einem Problem: „Der Rechenaufwand wächst meistens viel schneller in der Anzahl der Dimensionen als in der Anzahl der Datenpunkte“, sagt Joachim Giesen. „Selbst die schnellsten Rechner stoßen bei hochdimensionalen Problemen unweigerlich an ihre Grenzen.“

Die Kunst, dem sogenannten „Fluch der Dimensionen“ zu entkommen, bestehe darin, niedrigdimensionale Strukturen in hochdimensionalen Daten zu finden, die für die Lösung des jeweiligen Problems entscheidend sind, so der Jenaer Geometrie-Experte. Genau dies ist das Ziel des neuen Forschungsprojekts „Computational Geometric Learning“. Prof. Giesen koordiniert den internationalen Forschungsverbund von zehn Gruppen aus sechs europäischen Ländern. Die EU fördert das Vorhaben in den kommenden drei Jahren mit insgesamt 2,4 Millionen Euro, etwa 380.000 davon fließen nach Jena.

In vielen Anwendungen ist die Anzahl der relevanten Dimensionen sehr klein im Vergleich zur Dimensionalität der Daten. Ausgenutzt wird das heute schon z. B. in der Komprimierung von Audio- oder Bilddaten, die im reduzierten MP3- oder JPEG-Format gespeichert und übertragen werden. Die Jenaer Informatiker und ihre Projektpartner werden versuchen, niedrigdimensionale Strukturen auch in anderen hochdimensionalen Daten ausfindig zu machen. „Es geht darum, universelle Algorithmen zu entwickeln, mit denen sich auch sehr komplexe Daten in angemessener Zeit analysieren lassen“, unterstreicht Prof. Giesen. Während sein Jenaer Team dabei vor allem an den Grundlagen arbeitet, wollen andere Projektpartner die neu entwickelten Algorithmen anwenden und auf ihre Praxistauglichkeit testen, etwa in der Analyse der Konfigurationsräume von Robotern, der Analyse möglicher dreidimensionaler Strukturen von Eiweiß-Molekülen oder der Verteilung der Galaxien in unserem Universum.

Im Laufe des Projekts wollen die Informatiker u. a. die Open Source Softwarebibliothek CGAL (Computational Geometry Algorithms Library) um Algorithmen zur Lösung hochdimensionaler Fragestellungen erweitern. „Über diese Bibliothek ist die schnelle Verbreitung der Projektergebnisse zu anderen Wissenschaftlern und Anwendern möglich“, sagt Prof. Giesen.

Kontakt:
Prof. Dr. Joachim Giesen
Institut für Informatik der Friedrich-Schiller-Universität Jena
Ernst-Abbe-Platz 2
D-07743 Jena
Tel.: 03641 / 946310
E-Mail: joachim.giesen[at]uni-jena.de

Media Contact

Dr. Ute Schönfelder idw

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Größte bisher bekannte magnetische Anisotropie eines Moleküls gemessen

An der Berliner Synchrotronstrahlungsquelle BESSY II ist es gelungen, die größte magnetische Anisotropie eines einzelnen Moleküls zu bestimmen, die jemals experimentell gemessen wurde. Je größer diese Anisotropie ist, desto besser…

Tsunami-Frühwarnsystem im Indischen Ozean

20 Jahre nach der Tsunami-Katastrophe… Dank des unter Federführung des GFZ von 2005 bis 2008 entwickelten Frühwarnsystems GITEWS ist heute nicht nur der Indische Ozean besser auf solche Naturgefahren vorbereitet….

Resistente Bakterien in der Ostsee

Greifswalder Publikation in npj Clean Water. Ein Forschungsteam des Helmholtz-Instituts für One Health (HIOH) hat die Verbreitung und Eigenschaften von antibiotikaresistenten Bakterien in der Ostsee untersucht. Die Ergebnisse ihrer Arbeit…