kontakt | site map | impressum           6.7.2008
Logo EURAC  
  NEWS ARCHIV    
      Veranstaltungen    
      Kurse    
      Forschung    
      Neuerscheinungen    
      Stellenangebote    
SUCHE IN EURAC.EDU  
 

250 Millionen ‚running words" machten den Anfang 
Home  |  Focus  |  Korpuslinguistik für alle  |   

Das AAC-Austrian Academy Corpus der Österreichischen Akademie der Wissenschaften (ÖAW) ist ein texttechnologisches Forschungsprogramm. Es basiert auf der Grundlage einer umfangreichen und komplex strukturierten Sammlung von digitalen Volltexten zur deutschen Sprache und Literatur im Untersuchungszeitraum 1848 bis 1989.


Gründung im europäischen Jahr der Sprachen 2001
Die Gründung des AAC erfolgte im Rahmen einer internationalen Initiative im europäischen Jahr der Sprachen, getragen von der Berlin-Brandenburgischen Akademie der Wissenschaften, der Schweizerischen Akademie der Geistes- und Sozialwissenschaften und der ÖAW. In einer gemeinsamen Erklärung wurde die Notwendigkeit in den Blickpunkt gerückt, die deutsche Sprache in ihrer kulturellen Entwicklung in unterschiedlichen staatlichen Kontexten zu erforschen und ihre vielfältigen Lexikon- und Textqualitäten mittels informationstechnologischer Verfahren für die Nachwelt aufzubereiten und zu erhalten. Träger der aus dieser Erklärung resultierenden grenzüberschreitenden Zusammenarbeit wurden das DWDS Berlin, das Schweizer Textcorpus (DWDS-CH, Basel) und das AAC in Wien. Alle drei Forschungseinrichtungen haben sich inzwischen mit jeweils eigenen Programmschwerpunkte etabliert, die gemeinsamen Zielsetzungen werden mittels einer Online-Plattform verfolgt, die den einheitlichen Zugriff auf die einzelnen Teilcorpora ermöglicht. Im Juni 2006 hat sich die Freie Universität Bozen als vierter Partner der Kooperation angeschlossen.  

Inhaltliche und methodische Schwerpunkte des AAC      
 
AAC-Container
Das AAC stellt die Basis für die Umsetzung innovativer texttechnologischer Anwendungen und für die Verfolgung philologischer und kulturwissenschaftlicher Forschungsinteressen dar. Die Aufbauphase des Programms (2001-06) diente zunächst der Generierung der AAC-Textsammlung im Umfang von mehr als 250 Millionen ‚running words'. Rund 130 Gesamtausgaben historischer literarischer Zeitschriften, Zeitungen, Essays, politische Reden und Pamphlete, Reiseliteratur, Kochbücher aber auch wissenschaftliche Texte, Rechtstexte und religiöse Schriften aus dem Untersuchungszeitraum wurden gescannt, digitalisiert, annotiert und in den AAC-Bestand integriert. Bis 2012 wird - die entsprechende finanzielle und personelle Ausstattung vorausgesetzt - die Umsetzung dieses Textbestandes in den AAC-Container abgeschlossen werden. Damit soll die Textsammlung des AAC im Rahmen der rechtlichen Möglichkeiten schrittweise online zugänglich gemacht werden.

Disziplinäre Offenheit
Die Arbeit an den Textcorpora hat jedoch auch Aspekte in den Blick gerückt, die über die 2001 formulierten Ziele hinausgehen. Wissenschaftlich fundierte, elektronische Textcorpora dienen nicht nur der Erhaltung und Dokumentation des kulturellen Wissens, sondern regen auch zu innovativen Fragestellungen und der Entwicklung neuer Methoden in den Sprach-, Kultur-, Gesellschafts- und Informationswissenschaften an. Das AAC hat innerhalb der international primär linguistisch determinierten Corpusforschung von Beginn an eine disziplinäre Öffnung zur Textedition und Sicherung der digitalen Textqualität verfolgt und bei der Auswahl der Mitarbeiterinnen und Mitarbeiter stets Kompetenzen aus verschiedenen Wissenschaftsgebieten kombiniert.

Texttechnologie
In der Projektumsetzung bildet die Texttechnologie einen wesentlichen methodischen und theoretischen Schwerpunkt, dessen Grundlagen bereits in der Aufbauphase des AAC mitentwickelt wurden.

Als Forschungsbereich hat die Texttechnologie Schnittstellen zur Corpuslinguistik, zum Bereich "Computing in the Humanities", zur informationstechnologischen und anwendungsorientierten Forschung, zu philologischer Methodik sowie zum Web-Design. Das Programm des AAC erhebt damit den Anspruch, Schnittstellen zwischen geisteswissenschaftlichen Methoden und Prinzipien und informationstechnologischen Anwendungen zu schaffen.

Projekte
Über die Entwicklung des AAC-Containers hinaus verfolgt das AAC seinen anwendungsorientierten Anspruch mit der Umsetzung von Teilprojekten aus den einzelnen Gebieten des Forschungsprogramms, die sowohl für interne Forschungen als auch für Gastforscher zur Verfügung stehen bzw. stehen werden. Genannt seien offline verfügbare thematisch annotierte Corpora (etwa zum Schaffen Johann Nepomuk Nestroys) oder parallele Textcorpora, in denen fremdsprachige Texte im Original mit mehreren deutschen Übersetzungen aliniert werden.
Einer größeren Öffentlichkeit hat sich das AAC jedoch vor allem im Bereich elektronischer Ausgaben präsentiert. So wurde im Jänner 2007 mit der AAC-Fackel der gesamte, 22.586 Seiten umfassende Text von Karl Kraus' berühmter Zeitschrift „Die Fackel" in Form einer innovativen digitalen Edition online gestellt. Über 17.000 Registrierungen allein im ersten halben Jahr beweisen, dass auch die Grundlagenforschung in den Geisteswissenschaften ganz konkrete Anwendungen liefern kann, die von großem Interesse für die allgemeine Öffentlichkeit sind.
Als Folgeprojekt in diesem Tätigkeitsfeld des AAC wird im Oktober 2007 eine digitale Edition der literarischen Zeitschrift „Der Brenner" online gehen, Editionen der Zeitschriften „Der Sozialdemokrat" und „Der Gegen-Angriff" sind derzeit in Vorbereitung.

 

Evelyn Breiteneder ist wissenschaftliche Mitarbeiterin an der Österreichischen Akademie der Wissenschaften und die Leiterin des AAC - Austrian Academy Corpus.


 
Copyright © EURAC 2008 Seite versenden Seite drucken Seitenanfang