Computer als Dolmetscher
Manche Technik findet man durch Zufall. Stößt man bei einer Internetsuche auf fremdsprachige Webseiten, so erhält man gelegentlich das Angebot „Diese Seite übersetzen“. Mit ein wenig Phantasie lässt sich aus der häufig nicht perfekten Übersetzung erahnen, was da wohl in fremder Sprache gestanden hat. So kann man sich schon heute mit maschineller Übersetzung schnell und billig einen Überblick verschaffen. Maschinelle Übersetzung bringt also Vorteile für die Wirtschaft, insbesondere für den Mittelstand, aber auch für das politische und kulturelle Zusammenwachsen Europas.
Im vereinigten Europa, in dem es mittlerweile 23 Amtssprachen gibt, aber nur etwa jeder zweite Einwohner eine Fremdsprache hinreichend gut spricht, gäbe es viele Einsatzmöglichkeiten für einen künstlichen Simultanübersetzer. Dazu müsste allerdings nicht Geschriebenes in Geschriebenes übersetzt werden, sondern Gesprochenes in Gesprochenes – eine noch höhere Herausforderung, da sich zur Schwierigkeit der Übersetzung nun noch die Unsicherheit bei der Umsetzung von Sprache in Text (der Spracherkennung) gesellt. Das europäische Forschungsprojekt TC-STAR (Technology and Corpora for Speech to Speech Translation), in dem zwölf internationale Partner kooperieren, arbeitet seit nun fast drei Jahren an diesem Thema.
TC-STAR forscht am Thema des maschinellen Simultandolmetschers, der das gesprochene Wort in eine andere Sprache übersetzt. Als Beispielaufgabe übersetzt der Computer Debatten im Europäischen Parlament vom Englischen ins Spanische und vom Spanischen ins Englische. Das Besondere dabei ist, so Professor Hermann Ney, Inhaber des Lehrstuhls für Informatik 6 der RWTH Aachen, „TC-STAR ist das erste Verbundprojekt, das sich mit der Übersetzung gesprochener Sprache nicht in einer künstlichen kleinen Domäne beschäftigt, sondern in einer unbeschränkten Domäne.“ So reichen die Themen nicht nur von Fischereifragen zu Frauenrechten, sondern sie können sich auch aus aktuellem Anlass verschieben – etwa aus Anlass der Klimadebatte. Die Wissenschaftler bringen dem Computer dabei nur bei, wie er aus gegebenen Daten – Sprachaufnahmen, Aussprachewörterbüchern, vorliegenden übersetzten Texten – Wissen über die Sprache erwirbt, also lernt; aber was er lernt, das ergibt sich aus den vorliegenden Sprachdaten. So ist es denn auch möglich, ein System für die Übersetzung vom Englischen ins Spanische mit geringen Anpassungen und natürlich den geeigneten Daten für die Übersetzung vom Arabischen ins Englische fit zu machen.
Zum Abschluss des Projektes treffen sich die Experten vom 28.-30. März noch einmal zu einem Workshop an der RWTH Aachen und besprechen unter Beteiligung externer Forschungsgruppen unter anderem aus USA, Japan und China die Ergebnisse der alljährlichen Evaluierung. Dabei werden die beteiligten Systeme und Verfahren systematisch und objektiv bewertet, Fehler gezählt und ausgewertet. Ein bisschen Wettkampfstimmung liegt auch in der Luft, aber das wesentliche Ziel der Evaluierung liegt darin, unter den vielen Ansätzen die erfolgreichsten zu identifizieren – die werden dann nämlich von den anderen Forschungsgruppen übernommen, um das Innovationstempo zu steigern. Die objektive Bewertung hat auch Vorteile für die Geldgeber des Projekts, an dem sich mit etwa 11 Millionen Euro die Europäische Union und mit etwa 7 Millionen Euro international führende Technologieunternehmen wie IBM, Siemens, Nokia und Sony beteiligt haben. Unter den wissenschaftlichen Institute und Universitäten sind in Deutschland die RWTH Aachen und die Universität Karlsruhe beteiligt. Der Gastgeber des Workshops, der Lehrstuhl für Informatik 6 der RWTH unter Leitung von Professor Hermann Ney, hat sich vor allem auf die Themenfelder Spracherkennung und maschinelle Übersetzung spezialisiert.
Trotz der deutlichen Fortschritte in der Sprachtechnologie brauchen professionelle Übersetzer übrigens keine Konkurrenz zu fürchten, zumindest für die nächsten ein bis zwei Jahrzehnte. Sie arbeiten in Bereichen, in denen es auf genaues Übersetzen und auf sprachliche Feinheiten ankommt, eine Grobübersetzung also nicht ausreicht. Im Gegenzug werden sich maschinelle Übersetzungen in Bereichen etablieren, in denen man bislang auf eine Übersetzung aus Zeit- und Kostengründen schlicht verzichten musste.
Wer sich für diese Thematik interessiert, sei auf den über das Portal der Europäischen Union erhältlichen Report „Sprachtechnologien für Europa“ hingewiesen, der die Fragestellung kurzweilig und kompetent abhandelt.
Weitere Informationen über das TC-STAR-Projekt gibt es unter www-i6.informatik.rwth-aachen.de und www.tc-star.org sowie bei Volker Steinbiß unter der Telefonnummer 0179-6679918 oder per E-Mail an steinbiss@informatik.rwth-aachen.de . Über ihn kann auch die Druckausgabe des Reports „Human Language Technologies for Europe“ bestellt werden. Den Report gibt es im Internet unter http://europa.eu/languages/de/document/88.
Media Contact
Alle Nachrichten aus der Kategorie: Seminare Workshops
Neueste Beiträge
Größte bisher bekannte magnetische Anisotropie eines Moleküls gemessen
An der Berliner Synchrotronstrahlungsquelle BESSY II ist es gelungen, die größte magnetische Anisotropie eines einzelnen Moleküls zu bestimmen, die jemals experimentell gemessen wurde. Je größer diese Anisotropie ist, desto besser…
Tsunami-Frühwarnsystem im Indischen Ozean
20 Jahre nach der Tsunami-Katastrophe… Dank des unter Federführung des GFZ von 2005 bis 2008 entwickelten Frühwarnsystems GITEWS ist heute nicht nur der Indische Ozean besser auf solche Naturgefahren vorbereitet….
Resistente Bakterien in der Ostsee
Greifswalder Publikation in npj Clean Water. Ein Forschungsteam des Helmholtz-Instituts für One Health (HIOH) hat die Verbreitung und Eigenschaften von antibiotikaresistenten Bakterien in der Ostsee untersucht. Die Ergebnisse ihrer Arbeit…