contact | site map | imprint           19.3.2010
Logo EURAC  
  NEWS ARCHIVE    
      Events    
      Education courses    
      On research    
      New print releases    
      Job openings    
SITE SEARCH  
 

ThakBong, un corpus per le ricerche interdisciplinari - PARTE II 
Home  |  Focus  |  Linguistic Corpora for all  |   

Il passo dall'indagine all'approccio corporale e l'apertura di quest'ultimo approccio ad altre scienze sociali è stato possibile solo grazie all'evoluzione tecnologica di questi ultimi 10 anni. Il GPS ci dà la posizione delle tombe e permette di verificare i dati in situ. Con la fotografia digitale è possibile conservare e condividere dati prima che siano annotati. I riferimenti alle foto vengono organizzate in una struttura XML. Questa struttura di base del corpus contiene come elementi principali luoghi, cimiteri, tombe e lapidi, il tipo di relazione che intercorre fra di loro e le foto associate. Gli elementi vengono annotati, trascrivendo forma e contenuto degli elementi semiotici delle tombe e delle lapidi. Infine è Internet lo strumento per l'annotazione collaborativa, la consultazione e la distribuzione del corpus.
Un tempo il ricercatore andava sul campo per rilevare dati precisi con carta e penna per uno scopo ben definito: in siffatto modo era difficile poter riutilizzare i dati o approfondirli senza tornare sul campo. Adesso, il corpus non solo è annotato e può essere verificato ma è anche possibile, basandosi sulla struttura XML e sulle fotografie, rimpiegare tali elementi per progetti diversi o a scopo di paragone e ciò senza aver bisogno di tornare sul campo o di incontrare fisicamente l'autore del corpus iniziale.
Partito a giugno 2007, il progetto ci ha condotto in una ventina di cimiteri a Taiwan, più di 2500 tombe sono state fotografate con circa due foto ciascuna. Un migliaio di lapidi sono già state annotate su XML per gli scopi della nostra ricerca, ma cominciano ad essere presi in considerazione anche vari elementi esterni (nomi, sesso, tipo di calendario). Per garantire la rappresentatività del corpus, calcoliamo la relazione fra le tombe di una regione, e il numero di abitanti di questa regione come peso statistico di ciascuna tomba. Così possiamo anche trattare le sottoparti del corpus che hanno bisogno di un campionamento più denso per aver sufficienti dati di un fenomeno che compare solo in una frazione del corpus, per esempio un gruppo etnico, religioso ecc.
Progetti dello stesso tipo in Cina o in diverse comunità cinesi oltremare in Asia (Vietnam, Indonesia, Malesia) ed Europa (Francia, Italia) sono iniziati o lo saranno fra poco.

Oliver STREITER, National University of Kaohsiung, Taiwan.

Yoann GOUDIN, National Cheng Kung University, Taiwan.


 
   


ThakBong, un corpus per le ricerche interdisciplinari - parte II

 

 
   


Link di approfondimento:

- Pagina principale del progetto ThakBong

- XML per l'annotazione delle lapidi: TSML, the Tomb Stone Markup Language 

- Oliver Streiter, Yoann Goudin & Leonhard Voltmer. From Tombstones to Corpora: STML for Research on Language, Culture, Identity and Gender Differences. Paclic21, the 21st Pacific Asia Conference on Language, Information and Computing. Nov. 1-3 2007, Seoul

 

 
 
Copyright © EURAC 2010 Send page Print page Top of page