Spricht der Computer unsere Sprache?
Home |
Focus |
Sprachtechnologie |
Spricht der Computer unsere Sprache?
 |
Die Computerlinguistin Verena Lyding arbeitet am EURAC-Institut für Fachkommunikation und Mehrsprachigkeit. Im November des vergangenen Jahres hat sie die Tagung "Lesser Used Languages and Computer Linguistics II" an der EURAC organisiert. Im Interview spricht sie über die Rolle der Computerlinguistik und wie Minderheitensprachen gefördert und gestärkt werden können. | Frau Lyding, welche Rolle spielt die Technologie in der Sprachwissenschaft? Die Technologie unterstützt die Sprachwissenschaft. Sucht zum Beispiel ein Linguist nach einem bestimmten sprachlichen Phänomen oder nach allgemeinen Regelmäßigkeiten kann er am Computer mit automatisierten Suchfunktionen große Korpora, sprich Textsammlungen durchforsten und analysieren. Dadurch wird seine Arbeit extrem erleichtert. In der computerlinguistischen Forschung selbst wird der Computer eingesetzt um Sprache automatisch aufzuschlüsseln aber auch um Systeme wie Rechtschreibprüfungs- oder automatische Textzusammenfassungsprogramme für den Endnutzer zu entwickeln.
Seit wann beschäftigt sich die Computerlinguistik mit weniger verbreiteten Sprachen? Die Computerlinguistik hat sich schon immer auch mit weniger verbreiteten Sprachen beschäftigt, da das Interesse an Sprache sich auf alle Sprachen bezieht. Bei weniger verbreiteten Sprachen ist nur die technologische Unterstützung weniger ausgeprägt.
Wie kann man die geringere technologische Unterstützung erklären? Die Disziplin der automatischen Sprachverarbeitung stammt aus dem englischsprachigem Raum, vor allem aus den USA. Neue Anwendungen werden oft zuerst für die englische Sprache entwickelt und dann später auch für weniger verbreitete Sprachen adaptiert.
Wie sieht die Situation in Südtirol aus? Gibt es computerlinguistische Projekte für das Südtirolerische? In Südtirol laufen derzeit verschiedene Projekte. Für das Südtiroler Deutsch erarbeiten wir am EURAC-Institut für Fachkommunikation und Mehrsprachigkeit seit zweieinhalb Jahren das Korpus Südtirol, indem wir Texte des geschriebenen Deutsch in Südtirol sammeln, archivieren und aufbereiten. Das ist die erste Initiative, die systematisch das Südtirolerische mit computerlinguistischen Methoden erfasst. Das Projekt ist als Pilot-Studie gestartet. Nachdem nun die erste Phase abgeschlossen ist, soll im Folgeprojekt damit begonnen werden im großen Rahmen Textsammlungen aus z.B. Zeitungen und belletristischen Werken in das System einzuspeisen.
Gibt es auch Projekte für die ladinische Sprache? Für die ladinische Sprache hat zum Beispiel das Ladinische Institut Micurà de Rü ein Online-Wörterbuch erstellt, das Giovanni Miscì unter anderem auch auf der Tagung „Lesser Used Languages and Computer Linguistics II" im vergangenen November vorgestellt hat. Außerdem steht auf ihrer Webseite ein Rechtschreibprüfungsprogramm für drei Varianten des Ladinischen (Grödnerisch, Fassanisch und Badiot) zur Verfügung (http://scl.ladinternet.smallcodes.org/applications/cort/site/index.jsp) .
Wie wichtig ist es, dass auch Minderheitensprachen computerlinguistisch erfasst werden? Wenn man Sprachen untersucht, dann ist es interessant so viele verschiedene Sprachen wie möglich zu betrachten. Die deutsche Sprache hat zum Beispiel eine ganz andere Struktur und Feinheiten als eine afrikanische Sprache wie zum Beispiel das Zulu. Das praktische Interesse ist aber, dass man durch die Computerlinguistik Minderheitensprachen stärken möchte, indem man beispielsweise Online-Wörterbücher zur Verfügung stellt. So werden diese kleineren Sprachen attraktiver, zugänglicher und können vollwertig in allen Lebenslagen verwendet werden.
Das Interview führte Stefanie Gius.
|