SCIENZE POLITICHE E SOCIALIManagement della Pubblica AmministrazioneAnno accademico 2023/2024

9797415 - ANALISI DEI DATI

Docente: ROSARIO GIUSEPPE D'AGATA

Risultati di apprendimento attesi

Il corso mira a fornire gli strumenti metodologici necessari per poter trarre informazioni operative da un insieme di dati. Un’attenzione particolare sarà rivolta alla fase di ‘creazione’ del dato, a partire da un approfondimento critico sulle fonti e sulla creazione di indicatori con particolare riferimento a quelli utilizzati nell’ambito della P.A. Un’importanza particolare, inoltre, sarà rivolta ai criteri di costruzione di un’indagine campionaria, dalla scelta delle unità d’analisi (campionamento) alla rilevazione di opinioni, giudizi, ecc. (questionario). Alla fine del corso, lo studente sarà in grado, inoltre, di utilizzare i principali test non parametrici e di conoscere le principali tecniche e modelli di analisi multivariata

Modalità di svolgimento dell'insegnamento

La frequenza non è obbligatoria ma fortemente consigliata. 

 

Prerequisiti richiesti

Lo studente deve essere in possesso delle nozioni fondamentali di matematica come da programma di qualsiasi istituto superiore di secondo grado e delle nozioni basilari di statistica descrittiva ed inferenziale.

Frequenza lezioni

Per i frequentanti è prevista una prova intermedia alla fine di ciascun modulo; per un totale di 3 prove intermedie.  Per i frequentanti, inoltre, sono previste attività laboratoriali che, oltre ad agevolare il superamento delle verifiche intermedie, forniranno conoscenze pratiche in merito alla gestione di un database

Contenuti del corso

Il primo modulo si concentrerà sulla progettazione di un'indagine statistica a partire dall'analisi delle fonti statistiche ufficiali, nazionali ed internazionali. In questa fase un'attenzione particolare sarà rivolta alle strategie di campionamento e alla costruzione del questionario compresi alcuni cenni sulle tecniche di scaling. Il secondo modulo prevede un approfondimento del concetto di indicatore, nello specifico si tratteranno gli argomenti legati alla costruzione di un indicatore composito. Il terzo modulo prevede lo studio dei test non parametrici più utilizzati in ambito sociale ed alcuni cenni di analisi multivariata

Testi di riferimento

Modulo 1D. F. Iezzi (2009), Statistica per le Scienze Sociali, Carocci, Roma. Parte prima (da pag. 23 a pag. 190)G. Cicchitelli, A. Herzel e G. E. Montanari (1992), Il campionamento statistico, Il Mulino, Bologna, cap. III (§§ 1, 2, 3, 4, 5, 6, 7), pp. 69-84.L. Fabbris (1989), L’indagine campionaria, N.I.S., Roma, capp. I (§ 1.4, 1.5, 1.6), pp. 24-39.Modulo 2D. F. Iezzi (2009), Statistica per le Scienze Sociali, Carocci, Roma. Parte seconda (da pag. 283 a pag. 314)Handbook on Constructing Composite Indicators. Methodology and user guide., www.oecd.org/publishing.Modulo 3L. Fabbris (1997), Statistica multivariata. Analisi esplorativa dei dati, McGraw-Hill, Milano, pp. 3-77.S. Siegel e N. J. Castellan jr. (1992), Statistica non parametrica, McGraw-Hill, Milano, cap. III (§§ 3.4, 3.4.1, 3.4.2) e cap. IV (§§ 4.1, 4.2, 4.3), pp. 67-92; cap. V (§§ 5.1,5.2), pp. 113-130; cap. VI (§§ 6.1, 6.2, 6.3, 6.4), pp. 151-191.

Programmazione del corso

 ArgomentiRiferimenti testi
1Analisi delle fonti e costruzione di un data baseD. F. Iezzi (2009), Statistica per le Scienze Sociali, Carocci, Roma. Parte prima (da pag. 23 a pag. 190)G. Cicchitelli, A. Herzel e G. E. Montanari (1992), Il campionamento statistico, Il Mulino, Bologna, cap. III (§§ 1, 2, 3, 4, 5, 6, 7), pp. 69-84.L. Fabbris (1989), L’indagine campionaria, N.I.S., Roma, capp. I (§ 1.4, 1.5, 1.6), pp. 24-39.
2Gli indicatori. La costruzione di un indicatore compositoD. F. Iezzi (2009), Statistica per le Scienze Sociali, Carocci, Roma. Parte seconda (da pag. 283 a pag. 314)Handbook on Constructing Composite Indicators. Methodology and user guide., www.oecd.org/publishing.
3Test non parametrici e analisi MultivariataL. Fabbris (1997), Statistica multivariata. Analisi esplorativa dei dati, McGraw-Hill, Milano, pp. 3-77.S. Siegel e N. J. Castellan jr. (1992), Statistica non parametrica, McGraw-Hill, Milano, cap. III (§§ 3.4, 3.4.1, 3.4.2) e cap. IV (§§ 4.1, 4.2, 4.3), pp. 67-92; cap. V (§§ 5.1,5.2), pp. 113-130; cap. VI (§§ 6.1, 6.2, 6.3, 6.4), pp. 151-191.

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

Per i frequentanti sono previste tre prove intermedie, ciascuna a fine di ogni modulo trattato. Per poter sostenere la successiva prova bisogna aver superato la precedente. La prima verifica consiste nella presentazione di un progetto di indagine che contempli tutti gli aspetti metodologici a partire dal piano di campionamento. La seconda verifica si svolgerà in laboratorio multimediale e prevederà l’esclusivo utilizzo di excel. In merito alla terza verifica, lo studente concorderà col docente una tecnica multivariata e presenterà in aula un’applicazione.

 

 

Per i non frequentanti

L’esame sarà interamente scritto, consterà di 3 esercizi e 7 quesiti a risposta aperta che coprono l’intero programma. Lo studente avrà a disposizione 100 minuti per svolgere il compito.

Esempi di domande e/o esercizi frequenti

Quesiti

 

1) Indagini strutturali ed indagini correnti

2) I rapporti statistici

3) Campionamento casuale  A DUE STADI

4) Le fasi di un test non parametrico

5) L’analisi fattoriale

6) L’analisi di regressione stepwise

7) Matrici per l’analisi multidimensionale di dati

 

Esercizio 1

Si costruisca un indicatore composito di integrazione degli immigrati considerando tre indicatori semplici (attrazione, inserimento sociale ed inserimento occupazionale) calcolato su cinque province. Si commenti la procedura e i risultati cui si perviene.

 

Prov

Attraz

InsSoc

InsOcc

Torino

40,6

37,3

39,4

Milano

65

46,2

55,8

Trento

46,1

62,2

37,1

Vicenza

57,3

64,7

51,8

Treviso

58,4

58,3

47,6

 

 

 

 

 

Esercizio 2

Sia data la seguente distribuzione di pesi rilevati su 51 studenti. Verificare l’ipotesi che la distribuzione dalla quale è estratto il campione sia  normale. (α=0.05)

Kg

40- 45

46-50

51-55

56-60

Totale

ni

7

12

17

15

51

 

 Esercizio 3

 

La tabella nostra l’esito di un’indagine condotta su 116 studenti in merito alla valutazione del corso di Laurea L16. Ad un livello di significatività α=0.05 è possibile stabilire che nella popolazione di riferimento vi sia un giudizio sostanzialmente positivo?

negativo

abbastanza negativo

abbastanza positivo

positivo

Totale

1

6

64

45

116

 


English version