La rappresentazione del dato testuale: codifica del testo e linguaggi di marcatura; struttura delle risorse testuali ed esplorazione dei dati; i corpora orali e l'analisi della lingua parlata: fondamenti pragmatici e funzioni della prosodia.
E Cresti. A. Panunzi, "Introduzione ai corpora dell'italiano", Bologna, Mulino, 2013.
A. Lenci, S. Montemagni, V. Pirrelli, "Testo e computer. Elementi di linguistica computazionale", Roma, Carocci, 2005, 2014(7).
Approfondimenti:
K. Aijmer, Ch. Rühlemann,"Corpus Pragmatics. A Handbook", Cambridge, CUP, 2014.
C. Bazzanella, "Linguistica e pragmatica del linguaggio. Un'introduzione", Roma/Bari, Laterza, 2015(5).
T. McEnery, A. Hardie, "Corpus Linguistics", Cambridge, CUP, 2012.
T. Raso, H. Mello (eds), "Spoken Corpora and Linguistic Studies", Amsterdam/Philadelphia, Benjamins, 2014.
P. Sorianello, "Prosodia. Modelli e ricerca empirica", Roma, Carocci, 2003, 2014(3).
Obiettivi Formativi
Conoscenza delle problematiche fondamentali affrontate dalla linguistica dei corpora, in particolare nell'analisi della lingua parlata.
Acquisizione delle capacità di base per l'utilizzo di strumenti informatici di analisi linguistica e del testo.
Prerequisiti
Conoscenze di base in linguistica generale.
Metodi Didattici
Lezioni faccia a faccia; esercitazioni di analisi linguistica e creazione di corpora.
Altre Informazioni
Saranno disponibili le slides del corso.
Modalità di verifica apprendimento
Esame orale.
Programma del corso
(1) La codifica del testo: codifica a basso livello; codifica ad alto livello; linguaggi di mark-up. (2) Il corpus come fonte di dati linguistici: campionamento e rappresentatività; costruzione di un corpus; distribuzione del lessico e liste di frequenza; esplorazione del corpus: concordanze, collocazioni, espressioni regolari. (3) I corpora di parlato: il trattamento dei dati orali; analisi della lingua parlata: pragmatica e prosodia.