ThakBong, un corpus per le ricerche interdisciplinari - PARTE II
Home |
Focus |
Linguistic Corpora for all |
Il passo dall'indagine all'approccio corporale e l'apertura di quest'ultimo approccio ad altre scienze sociali è stato possibile solo grazie all'evoluzione tecnologica di questi ultimi 10 anni. Il GPS ci dà la posizione delle tombe e permette di verificare i dati in situ. Con la fotografia digitale è possibile conservare e condividere dati prima che siano annotati. I riferimenti alle foto vengono organizzate in una struttura XML. Questa struttura di base del corpus contiene come elementi principali luoghi, cimiteri, tombe e lapidi, il tipo di relazione che intercorre fra di loro e le foto associate. Gli elementi vengono annotati, trascrivendo forma e contenuto degli elementi semiotici delle tombe e delle lapidi. Infine è Internet lo strumento per l'annotazione collaborativa, la consultazione e la distribuzione del corpus. Un tempo il ricercatore andava sul campo per rilevare dati precisi con carta e penna per uno scopo ben definito: in siffatto modo era difficile poter riutilizzare i dati o approfondirli senza tornare sul campo. Adesso, il corpus non solo è annotato e può essere verificato ma è anche possibile, basandosi sulla struttura XML e sulle fotografie, rimpiegare tali elementi per progetti diversi o a scopo di paragone e ciò senza aver bisogno di tornare sul campo o di incontrare fisicamente l'autore del corpus iniziale. Partito a giugno 2007, il progetto ci ha condotto in una ventina di cimiteri a Taiwan, più di 2500 tombe sono state fotografate con circa due foto ciascuna. Un migliaio di lapidi sono già state annotate su XML per gli scopi della nostra ricerca, ma cominciano ad essere presi in considerazione anche vari elementi esterni (nomi, sesso, tipo di calendario). Per garantire la rappresentatività del corpus, calcoliamo la relazione fra le tombe di una regione, e il numero di abitanti di questa regione come peso statistico di ciascuna tomba. Così possiamo anche trattare le sottoparti del corpus che hanno bisogno di un campionamento più denso per aver sufficienti dati di un fenomeno che compare solo in una frazione del corpus, per esempio un gruppo etnico, religioso ecc. Progetti dello stesso tipo in Cina o in diverse comunità cinesi oltremare in Asia (Vietnam, Indonesia, Malesia) ed Europa (Francia, Italia) sono iniziati o lo saranno fra poco.
Oliver STREITER, National University of Kaohsiung, Taiwan.
Yoann GOUDIN, National Cheng Kung University, Taiwan.
|