Obiettivi del corso sono:
Gli obiettivi del corso sono:
lezioni frontali in aula
Lezioni di laboratorio
Programmazione.
Nozioni di base di statistica e calcolo delle probabilità.
Nozioni di basi di dati.
Algebra lineare.
nozioni di calcolo numerico.
Conoscenze di base di programmazione.
Conoscenze di base del linguaggio di programmazione Python.
Obbligatoria
Obbligatoria, in alternanza con le lezioni del modulo di fondamenti di analisi dei dati, circa una volta alla settimana.
si suggeriscono varie dispense del docente
Dispense fornite dal docente.
hand outs docente. Testi e tutorial dalla rete.
Dispense fornite dal docente, documentazione dei pacchetti software utilizzati durante il corso:
L'esame si articola in tre prove distinte:
a) un laboratorio in Python offerto nelle date di esame a calendario. Viene proposto un data set e veine richiesto di condurre su tale data set una serie di analisi standard;
b) lo studente propone al docente lo studio di un dat set a sua scelta e concorda con il docente il tipo di analisi e irisultati cui tale analisi è orientata;
c) colloquio orale di verifica delle conoscenze di base relative al corso.
Il punto a) indicato nel modulo di fondamenti analisi dati: prova di laboratorio in Python scolto nelle date di esame indicate in calendario. La prova consiste nel condurre e documentare una serie di analisi standard su un dataset fornito.
Indicatori centrali e indicatori di dispersione. Correlazione. Regressione lineare.. Regressione logitica. Dipendenza e indipendenza statistica. teoremaa di Bayes. Classificazione MAP. Discriminante lineare. SVM. Kernel trick. Knn. K-means. CART.
Studiare la correlazione tra due variabili mediante l'analisi dello scatter plot e della matrice di correlazione.
Studiare la correlazione tra una variabile e un gruppo di variabili mediante la costruzione e analisi di un regressore lineare.
Studiare la correlazione tra un gruppo di varibili e il verificarsi di un evento mediante la costruzione e analisi di un regressore logistico.
Classificare dati mediante Naive Bayes.
Classificare dati mediante alberi decisionali.
Applicare tecniche di clustering a un insieme di dati.