Nicht in der Übersetzung verloren: KI erhöht Genauigkeit der Gebärdenspracherkennung

KI-System analysiert subtile Hand- und Gesichtsgesten zur Gebärdenspracherkennung.

Hinzufügen von Daten wie Hand- und Gesichtsausdrücken sowie skelettalen Informationen über die Position der Hände im Verhältnis zum Körper zu den Informationen über die allgemeinen Bewegungen des Oberkörpers des Zeichners verbessert die Worterkennung. Bildnachweis: Osaka Metropolitan University

Zusätzliche Daten können helfen, subtile Gesten, Handpositionen und Gesichtsausdrücke zu unterscheiden

Die Komplexität der Gebärdensprachen

Gebärdensprachen wurden von Nationen weltweit entwickelt, um dem lokalen Kommunikationsstil zu entsprechen, und jede Sprache besteht aus Tausenden von Zeichen. Dies hat es schwierig gemacht, Gebärdensprachen zu lernen und zu verstehen. Der Einsatz von künstlicher Intelligenz zur automatischen Übersetzung der Zeichen in Worte, bekannt als Gebärdenspracherkennung auf Wortebene, hat nun durch die Arbeit einer von der Osaka Metropolitan University geleiteten Forschungsgruppe eine Genauigkeitssteigerung erfahren.

Es geht um Genauigkeit

Frühere Forschungsmethoden konzentrierten sich darauf, Informationen über die allgemeinen Bewegungen des Zeichners zu erfassen. Die Genauigkeitsprobleme entstanden durch unterschiedliche Bedeutungen, die sich aus den feinen Unterschieden in der Handform und der Beziehung in der Position der Hände und des Körpers ergeben konnten.

Associate Professor Katsufumi Inoue und Associate Professor Masakazu Iwamura von der Graduate School of Informatics arbeiteten mit Kollegen, darunter am Indian Institute of Technology Roorkee, zusammen, um die Genauigkeit der KI-Erkennung zu verbessern. Sie fügten Daten wie Hand- und Gesichtsausdrücke sowie skelettale Informationen über die Position der Hände relativ zum Körper den Informationen über die allgemeinen Bewegungen des Oberkörpers des Zeichners hinzu.

„Wir konnten die Genauigkeit der Gebärdenspracherkennung auf Wortebene im Vergleich zu herkömmlichen Methoden um 10-15 % verbessern“, erklärte Professor Inoue. „Darüber hinaus erwarten wir, dass die von uns vorgeschlagene Methode auf jede Gebärdensprache anwendbar ist, was hoffentlich zu einer verbesserten Kommunikation mit sprech- und hörgeschädigten Menschen in verschiedenen Ländern führen wird.“

Über OMU
Die Osaka Metropolitan University, eine der größten öffentlichen Universitäten Japans, wurde in Osaka gegründet und setzt sich dafür ein, die Zukunft der Gesellschaft durch „Konvergenz des Wissens“ und die Förderung von Forschung auf Weltniveau zu gestalten. Für weitere Forschungsnachrichten besuchen Sie https://www.omu.ac.jp/en/

Originalveröffentlichung
Mizuki Maruyama; Shrey Singh; Katsufumi Inoue; Partha Pratim Roy; Masakazu Iwamura; Michifumi Yoshioka
Zeitschrift: IEEE Access
Artikel Titel: Word-Level Sign Language Recognition With Multi-Stream Neural Networks Focusing on Local Regions and Skeletal Information
Artikel Veröffentlichungsdatum: 11. November 2024
DOI: 10.1109/ACCESS.2024.3494878

Medienkontakt
Yung-Hsiang Kao
Osaka Metropolitan University
E-Mail: koho-ipro@ml.omu.ac.jp

Quelle: EurekAlert!

Medienkontakt

Yung-Hsiang Kao

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Menschen vs Maschinen – Wer ist besser in der Spracherkennung?

Sind Menschen oder Maschinen besser in der Spracherkennung? Eine neue Studie zeigt, dass aktuelle automatische Spracherkennungssysteme (ASR) unter lauten Bedingungen eine bemerkenswerte Genauigkeit erreichen und manchmal sogar die menschliche Leistung…

Forscherin Claudia Schmidt analysiert durch Gletscherschmelze beeinflusste Wasserproben arktischer Fjorde.

Brechen des Eises: Gletscherschmelze verändert arktische Fjordökosysteme

Die Regionen der Arktis sind besonders anfällig für den Klimawandel. Es mangelt jedoch an umfassenden wissenschaftlichen Informationen über die dortigen Umweltveränderungen. Forscher des Helmholtz-Zentrums Hereon haben nun an Fjordsystemen anorganische…

Genetische Analyse zeigt neue Risikofaktoren für Depression in verschiedenen Bevölkerungsgruppen

Globale Studie identifiziert Gene für Depressionen in verschiedenen Ethnien

Neue genetische Risikofaktoren für Depression wurden erstmals in allen großen Weltbevölkerungen identifiziert und ermöglichen es Wissenschaftler*innen, das Risiko für Depression unabhängig von der ethnischen Zugehörigkeit vorherzusagen. Die bislang größte und…