INTRODUZIONE AL DATA MINING

INF/01 - 9 CFU - 1° semestre

Docente titolare dell'insegnamento

ALFREDO FERRO
Email: ferro@dmi.unict.it
Edificio / Indirizzo: Stanza 40, Blocco III, Dipartimento di Matematica e Informatica, Viale Andrea Doria 6, 95125 Catania (CT)
Telefono: 0957383071
Orario ricevimento: Su appuntamento


Obiettivi formativi

Obiettivi formativi generali dell'insegnamento in termini di risultati di apprendimento attesi.

  1. Conoscenza e capacità di comprensione (knowledge and understanding): Il corso mira a formare le conoscenze e le competenze di base per l’analisi, la rappresentazione, e l’organizzazione di dati.
  2. Capacità di applicare conoscenza e comprensione (applying knowledge and understanding): lo studente acquisirà conoscenze riguardo ai modelli e gli algoritmi per l’analisi dei dati quali: mining ad alto supporto, sistemi di raccomandazione, ricerca di similarità, classificazione, clustering, text mining, network analysis.
  3. Autonomia di giudizio (making judgements): Attraverso esempi concreti e casi di studio, lo studente sarà in grado di elaborare autonomamente soluzioni a determinati problemi legati all'analisi dei dati.
  4. Abilità comunicative (communication skills): lo studente acquisirà le necessarie abilità comunicative e di appropriatezza espressiva nell'impiego del linguaggio tecnico nell'ambito generale dell'analisi dei dati.
  5. Capacità di apprendimento (learning skills): il corso si propone, come obiettivo, di fornire allo studente le necessarie metodologie teoriche e pratiche per poter affrontare e risolvere autonomamente nuove problematiche che dovessero sorgere durante una attività lavorativa. A tale scopo diversi argomenti saranno trattati a lezione coinvolgendo lo studente nella ricerca di possibili soluzioni a problemi reali, utilizzando benchmark disponibili in letteratura.

Prerequisiti richiesti

Programmazione, strutture dati, algoritmi su grafi.



Frequenza lezioni

Le risorse principali messe a disposizione dello studente sono le lezioni frontali, la cui frequenza è fortemente consigliata.

Per seguire meglio le lezioni, vengono messe a disposizione le slide utilizzate per il corso. Le slide non costituiscono un mezzo di studio: forniscono un dettaglio puntuale sugli argomenti trattati a lezione.



Contenuti del corso



Testi di riferimento


Altro materiale didattico

Il materiale didattico sarà pubblicato su www.studium.unict.it



Programmazione del corso

 *ArgomentiRiferimenti testi
1*Introduzione al data mining: problemi, strumenti.materiale didattico fornito dal docente 
2*Cenni di probabilità e statisticamateriale didattico fornito dal docente 
3*Teoria spettrale e entropiamateriale didattico fornito dal docente 
4*Introduzione ad Rmateriale didattico fornito dal docente 
5*Data mining ad alto supportomateriale didattico fornito dal docente 
6*Data mining a basso supportomateriale didattico fornito dal docente 
7*Recommendation Systems: definizione, algoritmi, e strumenti di valutazionemateriale didattico fornito dal docente 
8*Clusteringmateriale didattico fornito dal docente 
9*Classificazione: alberi decisionali e SVMmateriale didattico fornito dal docente 
10*Classificazione: estrattori di regole e classificatori bayesianimateriale didattico fornito dal docente 
11*Predizione: regressione, regressione logisticamateriale didattico fornito dal docente 
12*Esercitazione pratica in Rmateriale didattico fornito dal docente 
13*Probabilistic Graphical Modelsmateriale didattico fornito dal docente 
14*Web Miningmateriale didattico fornito dal docente 
15*Networksmateriale didattico fornito dal docente 
16*Cenni sul text miningmateriale didattico fornito dal docente 
* Conoscenze minime irrinunciabili per il superamento dell'esame.

N.B. La conoscenza degli argomenti contrassegnati con l'asterisco è condizione necessaria ma non sufficiente per il superamento dell'esame. Rispondere in maniera sufficiente o anche più che sufficiente alle domande su tali argomenti non assicura, pertanto, il superamento dell'esame.


Verifica dell'apprendimento


MODALITÀ DI VERIFICA DELL'APPRENDIMENTO

L'esame finale consiste in una prova scritta, ed un colloquio orale nel quale viene discusso un progetto.

La prova scritta è costituita da esercizi e domande di teoria.

Chi non supera la prova scritta, non può sostenere l'orale. La prova scritta può essere visionata prima delle prove orali.

Il progetto dovrà essere completato entro 60 giorni dal superamento della prova scritta.

Salvo diversa comunicazione:

Note:


PROVE IN ITINERE

Non previste.


PROVE DI FINE CORSO

Un seminario di approfondimento su articoli di ricerca nel settore del data mining dovrà essere presentato dallo studente alla fine del corso, ad integrazione della votazione finale.


ESEMPI DI DOMANDE E/O ESERCIZI FREQUENTI

Esempi saranno pubblicati sul portale www.studium.unict.it




Apri in formato Pdf English version