SCIENZE UMANISTICHEScienze del testo per le professioni digitali Anno accademico 2024/2025
9796687 - STATISTICS IN CORPUS LINGUISTICS A - Z
Docente: MARCO VENUTI
Risultati di apprendimento attesi
Secondo i descrittori
di Dublino gli studenti dovranno, alla fine del corso, acquisire:
1) Conoscenza e
comprensione: Comprendere le basi della Corpus Linguistics; Comprendere le basi
della statistica in relazione all’analisi quantitativa della lingua; Conoscere
l’utilizzo del software LancsBox; Conoscere l’utilizzo degli Stats tools
online.
2) Capacità di
applicare conoscenza e comprensione: Saper identificare ed utilizzare gli
strumenti e le misure statistiche appropriate ai diversi tipi di analisi
quantitative a partire dagli specifici obiettivi identificati.
3) Autonomia di
giudizio: Dimostrare di saper raccogliere, analizzare ed interpretare dati testuali
da un contesto complesso e di saper adottare la soluzione progettuale più
efficiente, motivando in modo appropriato tutte le scelte necessarie per lo
svolgimento del progetto.
4) Abilità
comunicative: Saper spiegare ed argomentare in modo chiaro le diverse fasi dell’analisi
svolta, facendo riferimento alla terminologia appropriata.
5) Capacità di
apprendimento: Tramite i concetti, le nozioni e le capacità acquisite durante
il corso, saper intraprendere gli studi successivi con un alto grado di
autonomia.
Modalità di svolgimento dell'insegnamento
Lezioni frontali e attività seminariali pratiche in lingua inglese.
Prerequisiti richiesti
Conoscenza della lingua inglese di un livello B2, nozioni di base
linguistica generale, o di filosofia del linguaggio o di semiotica.
Frequenza lezioni
Obbligatoria.
Contenuti del corso
Dopo un’introduzione ai corpora e alle nozioni di base riferite alla
creazione di corpora, il corso introdurrà, con regolari sessioni pratiche,
l’uso di software per l’analisi statistica della lingua inglese in merito a: a)
l’analisi del lessico, attraverso i concetti di collocation, keywords e lexical
density; b) un approccio lessico-grammaticale alla descrizione linguistica; c)
l’analisi della variazione in termini di registro linguistico; d) studi
sociolinguistici e stilistici; e) confronti diacronici.
Testi di riferimento
Brezina, Vaclav 2018 Statistics in Corpus
Linguistics. A Practical Guide, Cambridge University Press, pp. 296.
Baker, Paul, 2010, “Will Ms ever be as
frequent as Mr? A corpus-based comparison of gendered terms across four diachronic
corpora of British English”. In:
Gender and Language. 4/1, pp.125-149.
I
materiali per le esercitazioni pratiche con software di interrogazione di
corpora verranno resi disponibili tramite STUDIUM
Si ricorda che, ai
sensi dell’art. 171 della legge 22 aprile 1941, n. 633 e successive
disposizioni, fotocopiare libri in commercio, in misura superiore al 15% del
volume o del fascicolo di rivista, è reato penale.
Per ulteriori
informazioni sui vincoli e sulle sanzioni all’uso illecito di fotocopie, è possibile
consultare le Linee guida sulla gestione dei diritti d’autore nelle università
(a cura della Associazione Italiana per i Diritti di Riproduzione delle opere
dell’ingegno - AIDRO).
I testi di riferimento
possono essere consultati in Biblioteca
Verifica dell'apprendimento
Modalità di verifica dell'apprendimento
1) Prova pratica: prima della fine del corso, studenti
e studentesse costruiranno un corpus da interrogare con gli strumenti appresi
durante le lezioni. In tre prove in itinere, ciascuna alla fine di un ciclo di
6 lezioni, verranno valutati: a) i criteri di selezione dei testi, b) la
raccolta dei dati testuali e l’accuratezza l’eventuale dettaglio dell’annotazione,
c) l’identificazione di una valida ipotesi di ricerca
2) Prova
scritta: alla fine del corso, studenti e studentesse presentano una relazione
(3000/4000 parole) in cui verranno presentati e discussi i risultati dell’analisi
svolta sul corpus costruito. Verrà valutato il livello di dettaglio dell’analisi
ed i suoi risultati anche in base alle scelte fatte in fase di costruzione del
corpus
3) Prova orale: discussione sulla relazione presentata;
verranno valutati elementi non emersi o non sufficientemente chiari presenti
nella relazione
Per la valutazione
dell’esame si terrà conto della padronanza dei contenuti e delle competenze
acquisite, dell’accuratezza linguistica e proprietà lessicale, nonché della
capacità argomentativa dimostrata dal/la candidato/a.
Esempi di domande e/o esercizi frequenti
Criteri di Costruzione del Corpus; Scelta del
tool più appropriato; Scelta dell’approccio statistico più appropriato; Ipotesi
di ricerca.
English version