Il modulo di laboratorio annesso al corso teorico mira a fornire una esperienza pratica di analisi dei dati. I principali strumenti utilizzati sono il linguaggio Python, le librerie per il calcolo scientifico dello stack di scipy e altre note librerie di analisi dei dati basate su Python, e i notebook di Jupyter nelle loro varie declinazioni (in locale, Google Colab e Kaggle).
Gli obiettivi del corso sono:
Lezioni frontali in aula e lavoro individuale degli studenti in aula con l'ausilio del calcolatore.
Qualora l'insegnamento venisse impartito in modalità mista o a distanza, potranno essere introdotte le necessarie variazioni rispetto a quanto dichiarato in precedenza, al fine di rispettare il programma previsto e riportato nel syllabus.
Il corso prevede i seguenti prerequisiti curriculari, che devono essere soddisfatti precedentemente al sostenimento dell’esame:
La frequenza non è obbligatoria, ma fortemente consigliata.
Il corso è articolato in sei moduli principali:
Capitoli dei seguenti libri:
Materiale didattico condiviso dal docente mediante Microsoft Teams (codice del Team: i87g4nb).
Argomenti | Riferimenti testi | |
---|---|---|
1 | Introduzione al corso | Materiale didattico messo a disposizione dal docente, specifici capitoli dei testi consigliati. |
2 | Principali concetti di analisi dei dati | Materiale didattico messo a disposizione dal docente, specifici capitoli dei testi consigliati. |
3 | Statistica descrittiva e rappresentazione grafica dei deti | Materiale didattico messo a disposizione dal docente, specifici capitoli dei testi consigliati. |
4 | Incertezza e dati come osservazioni di eventi casuali | Materiale didattico messo a disposizione dal docente, specifici capitoli dei testi consigliati. |
5 | Distribuzione di probabilità | Materiale didattico messo a disposizione dal docente, specifici capitoli dei testi consigliati. |
6 | Introduzione alla inferenza statistica: generalizzare alla popolazione | Materiale didattico messo a disposizione dal docente, specifici capitoli dei testi consigliati. |
7 | Associazione di due variabili | Materiale didattico messo a disposizione dal docente, specifici capitoli dei testi consigliati. |
8 | Introduzione alla inferenza causale | Materiale didattico messo a disposizione dal docente, specifici capitoli dei testi consigliati. |
9 | Semplici tecniche di inferenza causale per analizzare dati osservazionali | Materiale didattico messo a disposizione dal docente, specifici capitoli dei testi consigliati. |
10 | Clustering e density estimation | Materiale didattico messo a disposizione dal docente, specifici capitoli dei testi consigliati. |
11 | Riduzione della dimensionlaità | Materiale didattico messo a disposizione dal docente, specifici capitoli dei testi consigliati. |
12 | Analisi dei dati predittiva | Materiale didattico messo a disposizione dal docente, specifici capitoli dei testi consigliati. |
13 | Modelli probabilistici per la classificazione | Materiale didattico messo a disposizione dal docente, specifici capitoli dei testi consigliati. |
14 | Funzioni discriminati per la classificazione | Materiale didattico messo a disposizione dal docente, specifici capitoli dei testi consigliati. |
15 | Analisi di serie temporali | Materiale didattico messo a disposizione dal docente, specifici capitoli dei testi consigliati. |
L'esame si articola in due prove distinte:
La verifica dell’apprendimento potrà essere effettuata anche per via telematica, qualora le condizioni lo dovessero richiedere.
La votazione è espressa in trentesimi secondo il seguente schema:
Voto 29-30 e lode
Lo studente ha una conoscenza approfondita dei concetti e delle tecniche di analisi dei dati. Riesce prontamente ad analizzare i problemi di analisi dei dati, individuando le tecniche di analisi dei dati più idonee alla risoluzione del problema considerato in maniera autonoma e con spirito critico e indicando le pratiche metodologiche più idonee per la loro applicazione. Ha ottime capacità comunicative e proprietà di linguaggio.
Voto 26-28
Lo studente ha una buona conoscenza dei concetti e delle tecniche di analisi dei dati. Riesce ad analizzare i problemi di analisi dei dati, individuando tecniche di analisi dei dati idonee alla risoluzione del problema considerato e indicando le pratiche metodologiche più idonee per la loro applicazione. Ha buone capacità comunicative e proprietà di linguaggio.
Voto 22-25
Lo studente ha una discreta conoscenza dei concetti e delle tecniche di analisi dei dati, anche se si limita agli argomenti principali. Riesce ad analizzare i problemi di analisi dei dati, seppure non sempre in maniera lineare, individuando tecniche di analisi dei dati idonee alla risoluzione del problema considerato. Ha discrete capacità comunicative e una discreta proprietà di linguaggio.
Voto 18-21
Lo studente ha la minima conoscenza dei concetti e delle tecniche di analisi dei dati. Ha una modesta capacità di analizzare i problemi di analisi dei dati. Ha sufficienti capacità comunicative, seppure non sempre una appropriata proprietà di linguaggio.
Esame non superato
Lo studente non possiede la conoscenza minima richiesta dei contenuti principali dell’insegnamento. La capacità di utilizzare il linguaggio specifico è scarsissima o nulla e non è in grado di applicare autonomamente le conoscenze acquisite.
Il progetto di analisi dei dati è generalmente basato su dataset di dimensioni medio-grandi ottenibili in rete.
Esempi di domande d'esame tipo: