Nicht in der Übersetzung verloren: KI erhöht Genauigkeit der Gebärdenspracherkennung
Zusätzliche Daten können helfen, subtile Gesten, Handpositionen und Gesichtsausdrücke zu unterscheiden
Die Komplexität der Gebärdensprachen
Gebärdensprachen wurden von Nationen weltweit entwickelt, um dem lokalen Kommunikationsstil zu entsprechen, und jede Sprache besteht aus Tausenden von Zeichen. Dies hat es schwierig gemacht, Gebärdensprachen zu lernen und zu verstehen. Der Einsatz von künstlicher Intelligenz zur automatischen Übersetzung der Zeichen in Worte, bekannt als Gebärdenspracherkennung auf Wortebene, hat nun durch die Arbeit einer von der Osaka Metropolitan University geleiteten Forschungsgruppe eine Genauigkeitssteigerung erfahren.
Es geht um Genauigkeit
Frühere Forschungsmethoden konzentrierten sich darauf, Informationen über die allgemeinen Bewegungen des Zeichners zu erfassen. Die Genauigkeitsprobleme entstanden durch unterschiedliche Bedeutungen, die sich aus den feinen Unterschieden in der Handform und der Beziehung in der Position der Hände und des Körpers ergeben konnten.
Associate Professor Katsufumi Inoue und Associate Professor Masakazu Iwamura von der Graduate School of Informatics arbeiteten mit Kollegen, darunter am Indian Institute of Technology Roorkee, zusammen, um die Genauigkeit der KI-Erkennung zu verbessern. Sie fügten Daten wie Hand- und Gesichtsausdrücke sowie skelettale Informationen über die Position der Hände relativ zum Körper den Informationen über die allgemeinen Bewegungen des Oberkörpers des Zeichners hinzu.
„Wir konnten die Genauigkeit der Gebärdenspracherkennung auf Wortebene im Vergleich zu herkömmlichen Methoden um 10-15 % verbessern“, erklärte Professor Inoue. „Darüber hinaus erwarten wir, dass die von uns vorgeschlagene Methode auf jede Gebärdensprache anwendbar ist, was hoffentlich zu einer verbesserten Kommunikation mit sprech- und hörgeschädigten Menschen in verschiedenen Ländern führen wird.“
Über OMU
Die Osaka Metropolitan University, eine der größten öffentlichen Universitäten Japans, wurde in Osaka gegründet und setzt sich dafür ein, die Zukunft der Gesellschaft durch „Konvergenz des Wissens“ und die Förderung von Forschung auf Weltniveau zu gestalten. Für weitere Forschungsnachrichten besuchen Sie https://www.omu.ac.jp/en/
Originalveröffentlichung
Mizuki Maruyama; Shrey Singh; Katsufumi Inoue; Partha Pratim Roy; Masakazu Iwamura; Michifumi Yoshioka
Zeitschrift: IEEE Access
Artikel Titel: Word-Level Sign Language Recognition With Multi-Stream Neural Networks Focusing on Local Regions and Skeletal Information
Artikel Veröffentlichungsdatum: 11. November 2024
DOI: 10.1109/ACCESS.2024.3494878
Medienkontakt
Yung-Hsiang Kao
Osaka Metropolitan University
E-Mail: koho-ipro@ml.omu.ac.jp
Quelle: EurekAlert!
Medienkontakt
Alle Nachrichten aus der Kategorie: Informationstechnologie
Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.
Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.
Neueste Beiträge
Menschen vs Maschinen – Wer ist besser in der Spracherkennung?
Sind Menschen oder Maschinen besser in der Spracherkennung? Eine neue Studie zeigt, dass aktuelle automatische Spracherkennungssysteme (ASR) unter lauten Bedingungen eine bemerkenswerte Genauigkeit erreichen und manchmal sogar die menschliche Leistung…
Brechen des Eises: Gletscherschmelze verändert arktische Fjordökosysteme
Die Regionen der Arktis sind besonders anfällig für den Klimawandel. Es mangelt jedoch an umfassenden wissenschaftlichen Informationen über die dortigen Umweltveränderungen. Forscher des Helmholtz-Zentrums Hereon haben nun an Fjordsystemen anorganische…
Globale Studie identifiziert Gene für Depressionen in verschiedenen Ethnien
Neue genetische Risikofaktoren für Depression wurden erstmals in allen großen Weltbevölkerungen identifiziert und ermöglichen es Wissenschaftler*innen, das Risiko für Depression unabhängig von der ethnischen Zugehörigkeit vorherzusagen. Die bislang größte und…