​​​​​​​​​​​​​​​​​​Youtube.jpgFacebook_2015.pngTwitter.jpg​​​​Linkedin ​JOB​​S​​CALLS​​​​​​​​PR​ESS​​​​​​RESTRICT​ED AREA
Skip Navigation LinksHome > Willkommen > Forschung > Projekte > projectDetails

 ProjectDetail

OPATCH - Offene Plattform für Zugriff auf und Analyse von Kulturdokumenten in Textform Projektziele Projektbeschreibung Background Partner Publikationen und Vorträge Finanzierung Kontakt Projektziele Ziel des Projektes OPATCH ist es, einen nachhaltigen Beitrag zum Zugriff und der Verwendung von Textsammlungen für unterschiedliche Nutzergruppen zu leisten. Das Projekt untersucht, wie neueste Technologien aus der Computerlinguistik, Korpuslinguistik, Statistik und Informationsvisualisierung zusammengebracht und weiterentwickelt werden können, um eine Umgebung zu schaffen, die es ermöglicht, in Textsammlungen zu recherchieren sowie sie nach inhaltlichen und linguistischen Kriterien zu analysieren und Texte sowie daraus abgeleitete Informationen anzuzeigen. Dieses Anliegen des Projekts lässt sich im Kern in zwei Forschungs- und Entwicklungsfragen formulieren:
— Wie können neueste Methoden und Verfahren aus der Computerlinguistik und Informationstechnologie zusammengebracht werden, um vereinfachte und zugleich vertiefte Zugangsmöglichkeiten zu Textsammlungen zu schaffen?
— Wie kann darauf aufbauend ein homogener Zugriff auf heterogene Datenquellen implementiert werden und welche Verfahren zur Datenaufbereitung sind notwendig, um dem Endnutzer die Funktionen unabhängig vom zugrundeliegenden Datenformat zur Verfügung zu stellen?
Im Hinblick auf diese Grundfragen soll im Rahmen des Projekts OPATCH eine Plattform entwickelt werden, die eine multifunktionale Basis für den Zugriff auf sowie die Analyse von Textsammlungen bietet. Die Plattform unterstützt über facettierte Textsuchen hinaus auch Visualisierungen und Werkzeuge zur statistischen und kontrastiven sprachlichen Analyse - von der sprachlichen Ebene bis zur Ebene der gesamten Sammlung (z.B. Zeitverläufe, geographische Informationen, etc.). Einmal entwickelt und der Öffentlichkeit zur Verfügung gestellt, können an die Plattform unterschiedliche Anwendungen angebunden werden, die auf spezielle Nutzerbedürfnisse ausgerichtete Suchumgebungen und Interfaces implementieren.
Projektbeschreibung

Im digitalen Zeitalter stehen Textdokumente vermehrt und in großen Mengen in elektronischer Form zur Verfügung. Gleichermaßen haben sich automatische Verfahren zur Sprachverarbeitung und Informationsextraktion rasant weiterentwickelt.
Das Projekt OPATCH setzt an der Stelle an, wo der Mensch ins Spiel kommt und diese digitalen Daten für sich nutzen möchte. OPATCH entwickelt eine Plattform zur Recherche in digitalen Textsammlungen. Diese Plattform wird sowohl ein Portal für historische Zeitungen, als auch eine Korpusanwendung mit visuellem Interface anbieten.
Es wird untersucht wie neueste Technologien aus der Computerlinguistik, Statistik und Informationsvisualisierung zusammengebracht und weiterentwickelt werden können, um eine hochentwickelte Suchumgebung für diverse Nutzergruppen zu schaffen. Ziel und Ergebnis des Projektes ist dabei,  es der breiten Öffentlichkeit, Schülern und Lehrkräften sowie Wissenschaftlern zu ermöglichen auf einfache und effektive Weise in historischen und gegenwärtigen Kulturdokumenten zu recherchieren.
Durchgeführt wird das Projekt OPATCH vom Institut für Fachkommunikation und Mehrsprachigkeit der Europäischen Akademie Bozen in Kooperation mit der Landesbibliothek Dr. Friedrich Teßmann, sowie dem Institut für Corpuslinguistik und Texttechnologie der Österreichischen Akademie der Wissenschaften.

Das Projekt wird finanziert von der Autonomen Provinz Bozen - Südtirol, Abteilung Bildungsförderung, Universität und Forschung, Landesgesetz vom 13. Dezember 2006, Nr. 14 ''Forschung und Innovation".

Den vollständigen Projektantrag können Sie hier einsehen.

Die Web-Plattform ist hier.

Background Daten in Textform spielen im digitalen Zeitalter eine größere Rolle denn je. Anders als früher können große Mengen textueller Daten auf kleinem Raum digital gespeichert, verarbeitet und weitergegeben werden. Darüber hinaus haben Disziplinen wie die Computerlinguistik, Korpuslinguistik und Informationswissenschaft Methoden entwickelt, diese Daten automatisch zu verarbeiten und mit Zusatzinformationen, wie Metadaten oder linguistischen Annotationen, anzureichern. Kurz, dem Menschen steht sowohl ein umfangreiches Angebot an textuellem Datenmaterial als auch ein weiter Katalog an Methoden und Technologien zu deren Verarbeitung zur Verfügung.
Was zur Nutzung dieser reichen Basis jedoch häufig fehlt, sind geeignete Instrumente, die diese Methoden und Technologien in nutzerfreundlichen Systemen verbinden. Erst durch derartige Systeme wird der breiten Öffentlichkeit ermöglicht, einfach, funktional und flexibel aus den genannten Datenschätzen Nutzen zu ziehen.
Partner

Landesbibliothek Dr. Friedrich Teßmann
Dr. Johannes Andresen

Österreichische Akademie der Wissenschaften, Institut für Corpuslinguistik und Texttechnologie (ICLTT)
Univ.-Prof. Mag. Dr. Gerhard Budin

Publikationen und Vorträge

Michel Généreux, Egon W. Stemle, Verena Lyding and Lionel Nicolas. Correcting OCR errors for German in Fraktur font. First Italien Conference on Computational Linguistics. Pisa 9-10 December, 2014. (Artikel) (Poster)

Historische Zeitungen im digitalen Zeitalter — I giornali storici nell’era digitale 27.10.2014 Eurac Bozen Bolzano. (PDF)

Finanzierung

Das Projekt wird finanziert von der Autonomen Provinz Bozen - Südtirol, Abteilung Bildungsförderung, Universität und Forschung, Landesgesetz vom 13. Dezember 2006, Nr. 14 ''Forschung und Innovation".

 

Kontakt
Verena Lyding
+39 0471 055 127
verena.lyding@eurac.edu
Andrea Abel
+39 0471 055 121
andrea.abel@eurac.edu

​​​

​​​​​​​​​​​​​​​​​​​​​​​​​QUICK LINKS
ANERKENNUNGEN

 
WIE SIE UNS ERREICHEN

EURAC_map.jpg
 
KONTAKT

Viale Druso, 1 / Drususallee 1
39100 Bolzano / Bozen - Italy
Tel: +39 0471 055 055
Fax: +39 0471 055 099
Email: info@eurac.edu
Partita IVA: 01659400210
Newsletter​           P​rivacy
Host of the Alpine Convention