DAMICO

Data Mining in der Korpuslinguistik

  • Deutsch
  • English
  • Italiano
  • Project duration: September 2016 - December 2021
  • Project status:
    Eingabemodus

In ihrem Doktoratsprojekt zum Thema “Data-Mining in Corpus Linguistscs“ versucht Jennifer-Carmen Frey zwischen Informatik und Linguistik zu vermitteln und aktuelle Methoden aus dem Data-Mining und deren Anwendbarkeit für die Korpuslinguistik zu analysieren. Im Zuge des Projektes sollen dem Stand der Technik entsprechende Methoden der Datenanalyse, (vornehmlich mittels maschinellen Lernens) an korpuslinguistische Fragestellungen und Projekte angepasst und anhand von prototypischen Implementationen evaluiert werden. Zentrale Fragestellungen des Projekts sind, ob Data-Mining Methoden der Korpuslinguistik dienlich sein können, weil sie a) bestehende Forschungsergebnisse reproduzieren und somit validieren können und b) weitere linguistisch relevante Zusammenhänge anhand der bestehenden Informationen in den untersuchten Korpora aufdecken und somit den Linguisten auf weitere Forschungsfragen aufmerksam machen können. Die Ergebnisse des Projekts umfassen eine Auswahl passender Methoden sowie eine eingehende Evaluation und Diskussion ihres Potenzials und ihrer Schwächen. Zudem sollen die im Projekt erstellten Prototypen für die Nutzung von anderen, nicht zwangsläufig technisch orientierten, Korpuslinguisten als Plug-Ins für populäre Korpus-Software zur Verfügung gestellt werden.

Publications
Using Data Mining to Repurpose German Language Corpora. An evaluation of data-driven analysis methods for corpus linguistics
Frey J (2020)
Doktorarbeit (PhD)
Lexikalische Komplexität im Kontext holistischer Textbewertungen
Frey JC (2020)
Vortrag

Konferenz: Mehrsprachigkeit und Lernerkorpora | Bolzano | 13.2.2020 - 13.2.2020

https://hdl.handle.net/10863/14953

Comparison of Automatic vs. Manual Language Identification in Multilingual Social Media Texts
Frey JC, Stemle E, Doğruöz AS (2019)
Buchkapitel
Building computer-mediated communication corpora for socio-linguistic analysis

http://hdl.handle.net/10863/10130

The myth of the Digital Native? Analysing language use of different generations in Facebook
Frey JC, Glaznieks A (2018)
Beitrag in Konferenzband
The Myth of the Digital Native: Analysing language use of different generations on Facebook
Frey JC, Glaznieks A (2018)
Beitrag in Konferenzband

Konferenz: 6th Conference on CMC and Social Media Corpora for the Humanities (cmccorpora18) | Antwerp | 17.9.2018 - 18.9.2018

Weitere Informationen: https://www.uantwerpen.be/images/uantwerpen/container49896/f ...

https://hdl.handle.net/10863/8093

Was wir bewerten, wenn wir Schülertexte bewerten: Menschliche Bewertungen und digitale Zugänge zu ihren empirischen Spuren
Frey JC (2018)
Vortrag

Konferenz: Expertenworkshop MIT.Qualität | Mannheim | 18.6.2018 - 19.6.2018

The myth of the Digital Native: Analysing language use of different generations on Facebook
Frey JC, Glaznieks A (2018)
Vortrag

Konferenz: 6th Conference on CMC and Social Media Corpora for the Humanities (cmccorpora18) | Antwerp | 17.9.2018 - 18.9.2018

Sociolinguistic research using the DiDi corpus of South Tyrolean CMC: From corpus-based research designs to computational linguistic challenges
Frey CF, Stemle EW, Glaznieks A (2018)
Vortrag

Konferenz: 44. Österreichische Linguistiktagung 2018 (ÖLT2018) | Innsbruck | 26.10.2018 - 28.10.2018

Measuring Text Quality in the Digital Age: The Project “MIT.Qualität”
Glaznieks A, Linthe M, Frey JC (2018)
Vortrag

Konferenz: 1st Literary Summit | Porto | 1.11.2018 - 3.11.2018

A data mining approach to digital age
Frey J (2017)
Forlì
Vortrag

Konferenz: DIT Postgraduate Research Workshop | Forlì | 6.7.2016 - 6.7.2016

DiDi: A multilingual corpus of non-public South Tyrolean computer-mediated communication
Frey J (2016)
Lancaster
Vortrag

Konferenz: UCREL Summer School in corpus-based NLP | | 10.7.2016 - 15.7.2016

Partner
Universität Bologna, Dipartimento di Interpretazione e Traduzione Forlì
Projekt Team
1 - 1

Projects

1 - 9
Project

ITACA

Textkohärenz in der italienischen Bildungssprache

Duration: September 2020 - December 2021Funding:
Provincial P.-L.P. 14. Research projects (Province BZ funding /Project)

view all

Institute's Projects

Institut
Eurac Research logo

Eurac Research ist ein privates Forschungs-Zentrum mit Sitz in Bozen, Südtirol. Unsere Forscher kommen aus einer Vielzahl von wissenschaftlichen Bereichen und aus allen Teilen der Welt. Gemeinsam widmen sie sich dem, was ihr Beruf und ihre Berufung ist – die Zukunft gestalten.

Was wir tun

Unsere Forschung befasst sich mit den größten Herausforderungen, vor denen wir in Zukunft stehen: Menschen brauchen Gesundheit, Energie, gut funktionierende politische und soziale Systeme und ein intaktes Umfeld. Dies sind komplexe Fragen, und wir suchen nach Antworten in der Interaktion zwischen vielen verschiedenen Disziplinen. Unsere Forschungsarbeit umfasst dabei drei Hauptthemen: lebensfähige Regionen, Vielfalt als lebensförderndes Merkmal, eine gesunde Gesellschaft.

Great Place To Work
ISO 9001 / 2015ISO 9001:2015
05771/0
ISO 27001ISO 27001:2013
00026/0
ORCID Member

Gemäß der Verordnung (EU) 2016/679 teilen wir Ihnen mit, dass diese Webseite eigene technische Cookies und Cookies Dritter verwendet, damit Sie effizient navigieren und die Funktionen der Webseite einwandfrei nutzen können. Wenn Sie weiterhin auf diesen Seiten surfen oder auf „OK“ klicken, stimmen Sie der Cookie-Nutzung zu. Weitere Informationen zu den verwendeten Cookies, und zu ihrer Deaktivierung finden Sie unter:

Privacy Policy