MT@BZ

Maschinelle Übersetzung an Südtiroler Institutionen (Pilotstudie)

  • Deutsch
  • English
  • Italiano
  • Project duration: May 2021 - December 2022
  • Project status: ongoing

Das Projekt besteht aus einer Vorstudie zur maschinellen Übersetzung (MT) an Südtiroler Institutionen, wie die Freie Universität Bozen, die Landesverwaltung, usw. Keine der genannten Institutionen setzt bereits eine angepasste MT-Software ein, jedoch haben sie hohe Übersetzungsansprüche, zum Teil sich wiederholende und einheitlich aufgebaute Texte sowie besondere Bedürfnisse bezüglich der spezifischen deutschen Sprachvarietät. Der Einsatz eines angepassten maschinellen Übersetzungssystems könnte daher einen Fortschritt in ihren Übersetzungsprozessen darstellen. Dafür braucht man eine große Menge zweisprachiger Segmente, idealerweise mehrere Hunderttausend bis zu einer Million. 

In diesem Sinne werden in diesem Projekt die Möglichkeiten untersucht, parallele Korpora aus institutionellen Dokumenten aufzubauen. Für den Aufbau der Korpora sind bereits alinierte Texte (d. h. Übersetzungsspeicher) notwendig bzw. werden sie für Projektzwecke gesammelt und aliniert. Eine alternative Möglichkeit wäre ein automatisierter Prozess (z. B. Web-Crawler), der die Mitarbeit von IT-Personal erfordern würde. In beiden Fällen werden Kontakte und eine Zusammenarbeit mit der jeweiligen Institution angestrebt. Teil der Pilotstudie sind auch die Suche nach einer für die geplante Anpassung (customization) am besten geeignete Software sowie der Kontakt mit ausländischen Institutionen, die bereits ähnliche Experimente durchführen, um einen wissenschaftlichen Austausch anzuregen.

Das Projektergebnis werden ein oder mehrere parallele Korpora sein, mit der Absicht diese in eine ausgewählte MT-Software für die Customization einzuspeisen. Ziel der Pilotstudie ist es auch ein größeres Forschungsprojekt zur maschinellen Übersetzung für Südtiroler Institutionen zu planen und es bei internationalen Finanzierungsprogrammen einzureichen (z. B. Interreg).

Publications
Adapting machine translation for under-resourced languages: a first attempt for institutional German in South Tyrol
De Camillis F, Contarino AG (2021)
Vortrag

Conference: PaCor 2021 | Vitoria-Gasteiz | 23.6.2021 - 25.6.2021

https://hdl.handle.net/10863/17781

Anpassungsbedarf aus der Sicht einer etwas besonderen Nutzergruppe
Chiocchetti E (2019)
Vortrag

Conference: Workshop NMT-Diagnose | Hildesheim | 12.12.2019 - 12.12.2019

https://hdl.handle.net/10863/12453

Project Team
1 - 4

Projects

1 - 9
Project

ITACA

Textkohärenz in der italienischen Bildungssprache

Duration: September 2020 - June 2022Funding: Provincial P.-L.P. 14. Research ...

view all

Institute's Projects

Institute