DAMICO

Data mining nella linguistica dei corpora

  • Deutsch
  • English
  • Italiano

Nell’ambito del suo progetto di dottorato, “Data mining nella linguistica dei corpora”, Jennifer-Carmen Frey mira a collegare i campi delle scienze informatiche e delle scienze linguistiche, esplorando i recenti metodi di data-mining e il loro valore per la ricerca sui corpora. Nel quadro di un caso di studio di natura esplorativa, i metodi di analisi dei dati di ultima generazione basati sull’apprendimento automatico (machine learning) saranno adattati alle esigenze della linguistica dei corpora e poi valutati tramite implementazioni prototipiche sulla ricerca corpora esistente. L’approccio mira principalmente ad appurare se i metodi di data-mining sono in grado di a) generare (e quindi verificare) i risultati di ricerca finora ottenuti e b) guidare il linguista verso ulteriori modelli, interessanti dal punto di vista linguistico, che emergono dai dati. I risultati del lavoro, la valutazione e la discussione sulle potenzialità e sui limiti delle tecniche di data mining corpus-driven, così come l’offerta delle implementazioni in forma di plug-in ready-to-use per i software più diffusi di analisi dei corpora, mostreranno se e come le tecniche di data mining possono essere utili alla ricerca nell’ambito della linguistica dei corpora generale.

Publications
Lexikalische Komplexität im Kontext holistischer Textbewertungen
Frey JC (2020)
Presentazione

Conference: Mehrsprachigkeit und Lernerkorpora | Bolzano | 13.2.2020 - 13.2.2020

https://hdl.handle.net/10863/14953

Using Data Mining to Repurpose German Language Corpora. An evaluation of data-driven analysis methods for corpus linguistics
Frey J (2020)
Tesi di dottorato (PhD)

https://hdl.handle.net/10863/17321

Comparison of Automatic vs. Manual Language Identification in Multilingual Social Media Texts
Frey JC, Stemle E, Doğruöz AS (2019)
Contributo in un libro
Building computer-mediated communication corpora for socio-linguistic analysis

https://hdl.handle.net/10863/10130

The myth of the Digital Native? Analysing language use of different generations in Facebook
Frey JC, Glaznieks A (2018)
Contributo in atti di convegno
Was wir bewerten, wenn wir Schülertexte bewerten: Menschliche Bewertungen und digitale Zugänge zu ihren empirischen Spuren
Frey JC (2018)
Presentazione

Conference: Expertenworkshop MIT.Qualität | Mannheim | 18.6.2018 - 19.6.2018

The myth of the Digital Native: Analysing language use of different generations on Facebook
Frey JC, Glaznieks A (2018)
Presentazione

Conference: 6th Conference on CMC and Social Media Corpora for the Humanities (cmccorpora18) | Antwerp | 17.9.2018 - 18.9.2018

Sociolinguistic research using the DiDi corpus of South Tyrolean CMC: From corpus-based research designs to computational linguistic challenges
Frey CF, Stemle EW, Glaznieks A (2018)
Presentazione

Conference: 44. Österreichische Linguistiktagung 2018 (ÖLT2018) | Innsbruck | 26.10.2018 - 28.10.2018

Measuring Text Quality in the Digital Age: The Project “MIT.Qualität”
Glaznieks A, Linthe M, Frey JC (2018)
Presentazione

Conference: 1st Literary Summit | Porto | 1.11.2018 - 3.11.2018

The Myth of the Digital Native: Analysing language use of different generations on Facebook
Frey JC, Glaznieks A (2018)
Contributo in atti di convegno

Conference: 6th Conference on CMC and Social Media Corpora for the Humanities (cmccorpora18) | Antwerp | 17.9.2018 - 18.9.2018

Ulteriori informazioni: https://www.uantwerpen.be/images/uantwerpen/container49896/f ...

https://hdl.handle.net/10863/8093

A data mining approach to digital age
Frey J (2017)
Forlì
Presentazione

Conference: DIT Postgraduate Research Workshop | Forlì | 6.7.2016 - 6.7.2016

DiDi: A multilingual corpus of non-public South Tyrolean computer-mediated communication
Frey J (2016)
Lancaster
Presentazione

Conference: UCREL Summer School in corpus-based NLP | | 10.7.2016 - 15.7.2016

Our partners
1 - 1
  • Università di Bologna, Dipartimento di Interpretazione e Traduzione Forlì

Project Team
1 - 1

Projects

1 - 9
Project

ITACA

Coerenza nell'ITAliano Accademico

Duration: - Funding: Provincial P.-L.P. 14. Research ...

view all

Institute's Projects

Institute

Science Shots Eurac Research Newsletter

Get your monthly dose of our best science stories and upcoming events.

Choose language