Erkennen Sie die Melodie?
Wer ein bestimmtes Musikstück sucht, aber den genauen Titel des Liedes nicht weiß, hat es schwer. Fraunhofer-Forscher stellen auf der CeBIT (13.-20. März in Hannover) Systeme vor, die helfen die Wunschmusik zu finden.
Wer kennt das nicht: Man hört im Radio ein paar Takte eines Liedes und schon geht einem die Melodie nicht mehr aus dem Kopf. Doch leider hat der Radiomoderator weder den Titel noch den Interpreten angesagt. So ist es leider fast unmöglich, sich das Musikstück als CD zu besorgen. Auf das vorgesummte Lied reagieren die Plattenverkäufer mit verständnislosem Kopfschütteln. Wie praktisch wäre es, man könnte online auf eine Datenbank zugreifen, singt ein paar Takte und schon wird das gesuchte Lied, samt Informationen über Titel, Interpret und Komponist auf die Festplatte geladen.
Ferne Zukunftsmusik? Nicht für die Wissenschaftler der Fraunhofer-Arbeitsgruppe für Elektronische Medientechnologie AEMT aus Ilmenau. Die Arbeitsgruppe des Fraunhofer-Instituts für Integrierte Schaltungen IIS, Bereich Angewandte Elektronik beschäftigen sich mit einem System zur Melodieerkennung durch »Query by Humming« (frei übersetzt: Anfragen durch Summen). Benutzer müssen nur ein Lied ins Mikrofon singen und schon sucht die Software das Stück heraus. Ähnlich wie bei Internetsuchmaschinen liefert das
System eine Ergebnisliste. Das Lied, das der gesungenen Melodie am ähnlichsten ist, steht an erster Stelle. Der Interessent erhält Informationen über Titel, Sänger, Komponist, Liedtext, Aufnahmejahr und -ort des gesuchten Liedes. »Um das gesuchte Lied zu finden, werden die durch die gesungene Melodie hervorgerufenen Schallwellen von einem Computer zu einer Notensequenz resynthetisiert. Die gefundenen Tonhöhen und Zeitinformationen werden quasi wieder in Noten zurückübersetzt«, erläutert Dr. Frank Klefenz vom AEMT das Prinzip der Melodieerkennung. Mit Hilfe eines leistungsfähigen Algorithmus wird dann das passende Musikstück aus der Datenbank herausgesucht.
Auf der Messe stellen Experten des Fraunhofer-Instituts für Integrierte Schaltungen IIS in Erlangen noch ein weiteres System zur Musikerkennung vor. AudioID ist ein Verfahren zur automatischen Identifikation von Audio-Daten. Dazu wird ihm eine Aufnahme (CD, Kassette, MP3-Datei o.ä.) des Musikstücks vorgespielt. Bereits nach einer »Zuhörzeit« von wenigen Sekunden erkennt das System das gespielte Tonmaterial sicher und kann dabei auch problemlos zwischen verschiedenen Versionen des gleichen Songs unterscheiden. In der Lernphase werden die besonderen Merkmale eines Stücks extrahiert und als Zusatzinformation zu dem Musikstück abgespeichert. »AudioID entnimmt dem Lied sozusagen einen Fingerabdruck«, erläutern Dr. Jürgen Herre und Gerad Moser vom IIS. Mittlerweile haben die Wissenschaftler eine Datenbank mit ca. 100 000 Musikstücken angelegt. Neben dem jeweiligen »Fingerabdruck« sind immer auch Informationen zum Interpreten, Komponisten, Titel des Songs sowie zur Aufnahme abgespeichert. Die Fingerabdruck-basierte Technologie eröffnet eine Vielzahl von neuen Anwendungen, unter anderem in den Bereichen Musikverkauf, Rundfunkbeobachtung sowie zum Schutz musikalischer Urheberrechte.
Was mit Musik geht, funktioniert auch mit Sprachdaten. Wissenschaftler des Fraunhofer-Instituts für Medienkommunikation IMK entwickeln Methoden, die gesprochene Dokumente wie Nachrichten oder Bundestagsdebatten automatisch segmentieren, klassifizieren und nach bestimmten Themen und Stichworten in einer Datenbank ablegen. »Dazu setzen wir vorhandene Spracherkennungssysteme ein«, erläutert Dr. Joachim Köhler vom IMK. Den Beiträgen werden bestimmte Schlagworte sowie Informationen zum Redner als Metadaten zugeordnet. Mit dem System können zum Beispiel alle Bundestagsreden zum Thema »Bundeswehreinsatz in Afghanistan« herausgesucht werden. Es zeigt automatisch an, welche Abgeordneten sich zu der Thematik geäußert haben. Auf Wunsch kann sich der Interessent den entsprechenden Redemitschnitt vorspielen lassen.
Mit ihren Arbeiten haben die Experten des IIS, AEMT und IMK auch einen Beitrag zum neuen internationalen Standard MPEG-7 geleistet. Der Standard legt eine gemeinsame Beschreibungssprache für Multimedia-Daten fest. Er soll in Zukunft das Finden von Audio- und Videodaten im Internet so leicht machen wie die Textrecherche.
Media Contact
Alle Nachrichten aus der Kategorie: Messenachrichten
Neueste Beiträge
Wirksamkeit von Metformin zur primären Krebsprävention
Eine Studie der Deutschen Krebshilfe bietet Menschen mit Li-Fraumeni-Syndrom neue präventive Strategien: Forschende der Medizinischen Hochschule Hannover (MHH) untersuchen in einer neuen Wirksamkeitsstudie erstmals, ob das krebsfreie Überleben bei LFS-Betroffenen…
Innovative Algorithmen für eine nachhaltige und flexible KI
Die Entwicklung und der Einsatz künstlicher Intelligenz verschlingen jede Menge Ressourcen. Das neue BMBF-geförderte Forschungsprojekt COMFORT will das ändern. Verantwortlich dafür ist der Würzburger Mathematiker Leon Bungert. Keine Frage: Das…
Neue Rezeptur für Gleistragplatten
Mit einem Material aus recycelten Kunststoffen und alten Rotorblättern soll die betonlastige Eisenbahninfrastruktur in Deutschland modernisiert werden. Sie unterhalten sich über Mischungen, Mischungsverhältnisse und Zusatzstoffe und es klingt, als seien…