Im digitalen Zeitalter stehen Textdokumente vermehrt und in großen Mengen in elektronischer Form zur Verfügung. Gleichermaßen haben sich automatische Verfahren zur Sprachverarbeitung und Informationsextraktion rasant weiterentwickelt.
Das Projekt OPATCH setzt an der Stelle an, wo der Mensch ins Spiel kommt und diese digitalen Daten für sich nutzen möchte. OPATCH entwickelt eine Plattform zur Recherche in digitalen Textsammlungen. Diese Plattform wird sowohl ein Portal für historische Zeitungen, als auch eine Korpusanwendung mit visuellem Interface anbieten.
Es wird untersucht wie neueste Technologien aus der Computerlinguistik, Statistik und Informationsvisualisierung zusammengebracht und weiterentwickelt werden können, um eine hochentwickelte Suchumgebung für diverse Nutzergruppen zu schaffen. Ziel und Ergebnis des Projektes ist dabei, es der breiten Öffentlichkeit, Schülern und Lehrkräften sowie Wissenschaftlern zu ermöglichen auf einfache und effektive Weise in historischen und gegenwärtigen Kulturdokumenten zu recherchieren.
Durchgeführt wird das Projekt OPATCH vom Institut für Fachkommunikation und Mehrsprachigkeit der Europäischen Akademie Bozen in Kooperation mit der Landesbibliothek Dr. Friedrich Teßmann, sowie dem Institut für Corpuslinguistik und Texttechnologie der Österreichischen Akademie der Wissenschaften.
Das Projekt wird finanziert von der Autonomen Provinz Bozen - Südtirol, Abteilung Bildungsförderung, Universität und Forschung, Landesgesetz vom 13. Dezember 2006, Nr. 14 ''Forschung und Innovation".
Den vollständigen Projektantrag können Sie hier einsehen.
Die Web-Plattform ist hier.
Landesbibliothek Dr. Friedrich Teßmann
Dr. Johannes Andresen
Österreichische Akademie der Wissenschaften, Institut für Corpuslinguistik und Texttechnologie (ICLTT)
Univ.-Prof. Mag. Dr. Gerhard Budin
Michel Généreux, Egon W. Stemle, Verena Lyding and Lionel Nicolas. Correcting OCR errors for German in Fraktur font. First Italien Conference on Computational Linguistics. Pisa 9-10 December, 2014. (Artikel) (Poster)
Historische Zeitungen im digitalen Zeitalter — I giornali storici nell’era digitale 27.10.2014 Eurac Bozen Bolzano. (PDF)
Das Projekt wird finanziert von der Autonomen Provinz Bozen - Südtirol, Abteilung Bildungsförderung, Universität und Forschung, Landesgesetz vom 13. Dezember 2006, Nr. 14 ''Forschung und Innovation".