Corso di statistica di base
Conoscenze di base di informatica
Praticamente obbligatoria.
libera
Il corso si focalizzerà sullo studio dell’analisi monovariata, bivariata e multivariata utilizzando il linguaggio R, ossia un ambiente open source per la gestione dei dati, l’analisi statistica, la produzione di grafici e, più in generale, per l’uso di moltissimi metodi formali (Networks Analysis, Time Series Analysis, Differential Equations, Machine Learning, Multivariate Statistics, ecc.).
Il corso prevede la trattazione di:
1) nozioni basilari di matematica e logica propedeutiche alla programmazione informatica;
2) operazioni su vettori, matrici, fattori, liste, tabelle, data frame, mediante il linguaggio R;
3) operazioni di lettura e scrittura su file esterni mediante in linguaggio R;
4) rappresentazioni grafiche dei dati mediante il linguaggio R;
5) programmazione con R: definizioni di nuove funzioni, costrutti di controllo, costrutti condizionali e
costrutti iterativi (if, ifelse, for, while, break, repeat, next);
6) statistica descrittiva univariata e bivariata mediante il linguaggio R;
7) correlazione e regressione lineare mediante il linguaggio R;
8) analisi delle componenti principali mediante il linguaggio R;
9) cluster analysis mediante il linguaggio R;
10) network analysis mediante il linguaggio R;
SI introduce il tema del dato e dell’informazione. SI passa poi alle tecniche relazionali di archiviazione e recupero del dato. Si discute dei “data base management systems” e del sistema delle transazioni che garantisce la coerenza del dato. Si introduce anche l’algebra relazionale che rappresenta la logica per il recupero dell’informazione dalle basi di dati relazionali e che rappresenta la base dei linguaggi di interrogazione SQL
Dispense del docente
- Opzionale: Introduction to Computational Social Science, Principle and Applications. Claudio Cioffi-Revilla (In inglese)
- Opzionale: Big data. Una rivoluzione che trasformerà il nostro modo di vivere e già minaccia la nostra libertà. Viktor Mayer-Schönberger, Kenneth N. Cukier e R. Merlini
https://sites.google.com/site/cesaregarofaloweb/home/r
slides fornite dal docente
TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA | ||
Argomenti | Riferimenti testi | |
1 | 1) nozioni basilari di matematica e logica propedeutiche alla programmazione informatica; | Dispense del cocente |
2 | 2) operazioni su vettori, matrici, fattori, liste, tabelle, data frame, mediante il linguaggio R; | Dispense del cocente |
3 | 3) operazioni di lettura e scrittura su file esterni mediante in linguaggio R; | Dispense del cocente |
4 | 4) rappresentazioni grafiche dei dati mediante il linguaggio R; | Dispense del cocente |
5 | 5) programmazione con R: definizioni di nuove funzioni, costrutti di controllo, costrutti condizionali e costrutti iterativi (if, ifelse, for, while, break, repeat, next); | Dispense del cocente |
6 | 6) statistica descrittiva univariata e bivariata mediante il linguaggio R; | Dispense del cocente |
7 | 7) correlazione e regressione lineare mediante il linguaggio R; | Dispense del cocente |
8 | 8) analisi delle componenti principali mediante il linguaggio R; | Dispense del cocente |
9 | 9) cluster analysis mediante il linguaggio R; | Dispense del cocente |
10 | 10) network analysis mediante il linguaggio R; | Dispense del cocente |
prova pratica al computer
Uso delle funzioni di base principali di R.
Come si installano e si caricano i pacchetti in R.
Come si costruisce e si opera su un vettore, una matrice, un dataframe in R.
Come si costrisce un grafico in R.
Come si costruisce una funzione in R.
Come si svolge l’analisi di correlazione e regressione in R.