MT@BZ

Maschinelle Übersetzung an Südtiroler Institutionen (Pilotstudie)

  • Deutsch
  • English
  • Italiano
  • Project duration: May 2021 - December 2022
  • Project status:
    Approval by the Scientific Committee

Das Projekt besteht aus einer Vorstudie zur maschinellen Übersetzung (MT) an Südtiroler Institutionen, wie die Freie Universität Bozen, die Landesverwaltung, usw. Keine der genannten Institutionen setzt bereits eine angepasste MT-Software ein, jedoch haben sie hohe Übersetzungsansprüche, zum Teil sich wiederholende und einheitlich aufgebaute Texte sowie besondere Bedürfnisse bezüglich der spezifischen deutschen Sprachvarietät. Der Einsatz eines angepassten maschinellen Übersetzungssystems könnte daher einen Fortschritt in ihren Übersetzungsprozessen darstellen. Dafür braucht man eine große Menge zweisprachiger Segmente, idealerweise mehrere Hunderttausend bis zu einer Million. 

In diesem Sinne werden in diesem Projekt die Möglichkeiten untersucht, parallele Korpora aus institutionellen Dokumenten aufzubauen. Für den Aufbau der Korpora sind bereits alinierte Texte (d. h. Übersetzungsspeicher) notwendig bzw. werden sie für Projektzwecke gesammelt und aliniert. Eine alternative Möglichkeit wäre ein automatisierter Prozess (z. B. Web-Crawler), der die Mitarbeit von IT-Personal erfordern würde. In beiden Fällen werden Kontakte und eine Zusammenarbeit mit der jeweiligen Institution angestrebt. Teil der Pilotstudie sind auch die Suche nach einer für die geplante Anpassung (customization) am besten geeignete Software sowie der Kontakt mit ausländischen Institutionen, die bereits ähnliche Experimente durchführen, um einen wissenschaftlichen Austausch anzuregen.

Das Projektergebnis werden ein oder mehrere parallele Korpora sein, mit der Absicht diese in eine ausgewählte MT-Software für die Customization einzuspeisen. Ziel der Pilotstudie ist es auch ein größeres Forschungsprojekt zur maschinellen Übersetzung für Südtiroler Institutionen zu planen und es bei internationalen Finanzierungsprogrammen einzureichen (z. B. Interreg).

Publications
Adapting machine translation for under-resourced languages: a first attempt for institutional German in South Tyrol
De Camillis F, Contarino AG (2021)
Vortrag

Konferenz: PaCor 2021 | Vitoria-Gasteiz | 23.6.2021 - 25.6.2021

https://hdl.handle.net/10863/17781

Anpassungsbedarf aus der Sicht einer etwas besonderen Nutzergruppe
Chiocchetti E (2019)
Vortrag

Konferenz: Workshop NMT-Diagnose | Hildesheim | 12.12.2019 - 12.12.2019

http://hdl.handle.net/10863/12453

Projekt Team
1 - 4

Projects

1 - 8
Project

ITACA

Textkohärenz in der italienischen Bildungssprache

Duration: September 2020 - October 2021Funding:
Provincial P.-L.P. 14. Research projects (Province BZ funding /Project)

view all

Institute's Projects

Institut
Eurac Research logo

Eurac Research ist ein privates Forschungs-Zentrum mit Sitz in Bozen, Südtirol. Unsere Forscher kommen aus einer Vielzahl von wissenschaftlichen Bereichen und aus allen Teilen der Welt. Gemeinsam widmen sie sich dem, was ihr Beruf und ihre Berufung ist – die Zukunft gestalten.

Was wir tun

Unsere Forschung befasst sich mit den größten Herausforderungen, vor denen wir in Zukunft stehen: Menschen brauchen Gesundheit, Energie, gut funktionierende politische und soziale Systeme und ein intaktes Umfeld. Dies sind komplexe Fragen, und wir suchen nach Antworten in der Interaktion zwischen vielen verschiedenen Disziplinen. Unsere Forschungsarbeit umfasst dabei drei Hauptthemen: lebensfähige Regionen, Vielfalt als lebensförderndes Merkmal, eine gesunde Gesellschaft.

Great Place To Work
ISO 9001 / 2015
ISO 9001:2015
05771/0
ISO 27001
ISO 27001:2013
00026/0
ORCID Member

Gemäß der Verordnung (EU) 2016/679 teilen wir Ihnen mit, dass diese Webseite eigene technische Cookies und Cookies Dritter verwendet, damit Sie effizient navigieren und die Funktionen der Webseite einwandfrei nutzen können. Wenn Sie weiterhin auf diesen Seiten surfen oder auf „OK“ klicken, stimmen Sie der Cookie-Nutzung zu. Weitere Informationen zu den verwendeten Cookies, und zu ihrer Deaktivierung finden Sie unter:

Privacy Policy