MATEMATICA E INFORMATICAInformaticaAnno accademico 2025/2026
9799527 - Omics Data Analysis
Docente: GIOVANNI MICALE
Risultati di apprendimento attesi
Di seguito sono elencati gli obiettivi formativi generali dell'insegnamento in termini di risultati di apprendimento attesi:
- Conoscenza e capacità di comprensione (knowledge and understanding): Il corso mira a formare le conoscenze e le competenze avanzate per l’analisi, l’integrazione e l’interpretazione di diverse tipologie di dati omici, inclusi dati genomici, trascrittomici, epigenomici, proteomici e metabolomici.
- Capacità di applicare conoscenza e comprensione (applying knowledge and understanding): Lo studente acquisirà competenze pratiche riguardo ai modelli e agli algoritmi per l’analisi di dati omici, quali: variant calling, analisi di espressione differenziale, analisi di dati single-cell, analisi di arricchimento funzionale, peak calling, integrazione multi-omica e costruzione di workflow riproducibili.
- Autonomia di giudizio (making judgements): Attraverso esempi concreti e casi di studio, lo studente sarà in grado di elaborare autonomamente soluzioni a determinati problemi legati all'analisi dei dati multi-omici, scegliendo le pipeline più adeguate e valutando criticamente i risultati ottenuti.
- Abilità comunicative (communication skills): Lo studente acquisirà le necessarie abilità comunicative e di appropriatezza espressiva nell'impiego del linguaggio tecnico per descrivere e presentare in modo efficace i risultati di analisi complesse.
- Capacità di apprendimento (learning skills): Il corso si propone, come obiettivo, di fornire allo studente le necessarie metodologie teoriche e pratiche per poter affrontare e risolvere autonomamente nuove problematiche che dovessero sorgere durante una attività lavorativa, permettendogli di rimanere aggiornato sulle tecnologie e sugli algoritmi emergenti nel campo dell'analisi omica.
Modalità di svolgimento dell'insegnamento
Lezioni frontali con numerose esercitazioni pratiche al computer.
Qualora l'insegnamento venisse impartito in modalità mista o a distanza potranno essere introdotte le necessarie variazioni rispetto a quanto dichiarato in precedenza, al fine di rispettare il programma previsto e riportato nel syllabus.
Prerequisiti richiesti
- Programmazione (preferibilmente R o Python)
- Statistica di base
- Biologia Molecolare e Genetica
- Fondamenti di Bioinformatica
Frequenza lezioni
La frequenza a lezione è obbligatoria.
Per seguire meglio le lezioni, saranno messe a disposizione delle slide dal docente. Si ricorda che le slide non costituiscono un mezzo di studio, ma forniscono un compendio per aiutare nell'apprendimento dei concetti illustrati a lezione. Lo studio dei materiali forniti dal docente, dei testi consigliati e lo svolgimento degli esercizi è fondamentale per apprendere appieno i concetti illustrati durante le lezioni.
Contenuti del corso
Modulo
1 – Introduzione all’analisi multi-omica
- Panoramica
dei dati omici e obiettivi del corso:
Introduzione al corso e tipologie di dati omici. Motivazioni e sfide
dell’integrazione multi-omica. Workflow e principi FAIR.
- Reperimento,
formati e preprocessing dei dati: Formati standard (FASTQ, BAM, VCF, GTF,
mzML). Database pubblici (GEO, SRA, ENCODE, PRIDE). Esercitazione:
esplorazione di dataset multi-omici.
Modulo
2 – Genomica computazionale
- Analisi
dei dati genomici: Richiami su varianti genomiche (SNV,
indel, CNV, SV). Pipeline di variant calling (BWA, GATK). QC e filtraggio
delle varianti.
- Interpretazione
dei dati genomici: Annotazione funzionale (ANNOVAR, VEP) e
interpretazione clinica (ClinVar, SIFT). Esercitazione: annotazione e
visualizzazione di varianti.
- Metilazione
del DNA e struttura della cromatina: DNA
methylation (bisulfite-seq) e introduzione all’analisi epigenomica.
Modulo
3 – Interazioni DNA/RNA-proteina
- Analisi
ChIP-seq: Concetti di arricchimento e peak calling
(MACS2). Assegnazione dei picchi e annotazione funzionale.
- Tecnologie
CLIP-seq e CLASH: Panoramica su PAR-CLIP, iCLIP. Interazioni
miRNA-mRNA e identificazione di RBP target.
- Esercitazione
su dati di interazione: Analisi e visualizzazione di binding sites
e interazioni.
Modulo
4 – Trascrittomica bulk e arricchimento funzionale
- RNA-seq:
pipeline di base: Allineamento, quantificazione e
normalizzazione (STAR, Salmon, DESeq2).
- Differential
expression e arricchimento funzionale: Analisi
con DESeq2/edgeR. Arricchimento con GO, KEGG, GSEA.
- Visualizzazione
trascrittomica: PCA, MA-plot, heatmap, volcano plot.
Modulo
5 – Single-Cell e Spatial Transcriptomics
- Introduzione
alla scRNA-seq: Tecnologie, filtraggio, normalizzazione,
UMAP/PCA.
- Clustering
e identificazione di tipi cellulari:
Pipeline Seurat/Scanpy. Analisi di Pseudotime e RNA Velocity.
- Spatial
transcriptomics: Tecnologie (Visium, seqFISH) e
integrazione con scRNA-seq.
Modulo
6 – Metabolomica e cenni di proteomica
- Dati
metabolomici: Tecniche (LC-MS, NMR), preprocessing
(XCMS), enrichment e pathway analysis.
- Introduzione
alla proteomica: MS-based proteomics (DDA vs DIA). Software
open source (MaxQuant, OpenMS).
Modulo
7 – Integrazione multi-omica
- Approcci
all’integrazione: Early, intermediate, late integration.
Problemi di scaling e batch effect.
- Metodi
computazionali per l’integrazione: iCluster, MOFA, mixOmics. Integrazione
multiome (RNA + ATAC).
Modulo
8 – Interpretazione biologica e casi studio
- Casi
studio: cancro e immunologia: Pan-cancer analysis, immunoterapia e dati
multi-omici.
- Visualizzazione
e narrazione scientifica: ggplot2, Shiny, plotly. Presentazione
efficace di dati integrati.
- Casi
studio: malattie metaboliche e neurologiche:
Alzheimer, diabete. Prospettive multi-omiche.
Testi di riferimento
Data la natura avanzata della materia, il materiale principale sarà costituito dalle slide fornite dal docente e da articoli scientifici di riferimento. Si consigliano i seguenti testi per approfondimenti:
- “Modern Statistics for Modern Biology”. Autori: Susan Holmes, Wolfgang Huber. Editore: Cambridge University Press (2019).
- “Bioinformatics Data Skills”. Autore: Vince Buffalo. Editore: O'Reilly Media (2015).
- "R for Data Science". Autori: Hadley Wickham, Garrett Grolemund. Editore: O'Reilly Media (2017).
Altre risorse aggiornate saranno indicate dal docente nelle slides utilizzate a lezione.
Programmazione del corso
| | Argomenti | Riferimenti testi |
| 1 | Introduzione all'analisi multi-omica | |
| 2 | Genomica computazionale | |
| 3 | Interazioni DNA/RNA-proteina | |
| 4 | Trascrittomica bulk e arricchimento funzionale | |
| 5 | Single-Cell e Spatial Transcriptomics | |
| 6 | Metabolomica e cenni di proteomica | |
| 7 | Integrazione multi-omica | |
| 8 | Interpretazione biologica e casi studio | |
Verifica dell'apprendimento
Modalità di verifica dell'apprendimento
L'esame finale consiste in una prova scritta e un colloquio orale nel quale sarà discusso un progetto concordato tra il docente e lo studente.
- La prova scritta e il colloquio orale avranno una valutazione in trentesimi e la valutazione finale sarà ottenuta come media pesata tra valutazione della prova scritta (peso: 25% del voto finale) e valutazione della prova orale (peso: 75% del voto finale).
- La prova scritta è costituita da una domanda di teoria su argomenti del corso che lo studente dovrà argomentare per mostrare un'ampia comprensione della materia.
- Il voto minimo per superare la prova scritta è 18/30. Chi non supera la prova scritta, non potrà sostenere l'orale. La prova scritta può essere visionata insieme al docente in qualunque momento.
- Il voto minimo per considerare superato l'esame finale è di 18/30.
- Il progetto dovrà essere completato entro 1 mese dal superamento della prova scritta. Il progetto potrà essere concordato con il docente in qualunque momento. In caso di rifiuto del voto scritto, la valutazione del progetto sarà conservata per tutto l'anno accademico. In caso di rifiuto del voto finale lo studente dovrà sostenere nuovamente tutta la prova (scritto e progetto).
- Gli orari e i luoghi di svolgimento delle prove saranno comunicati mediante i mezzi previsti dall’ateneo.
Note:
- È vietato l'uso di qualsiasi strumento hardware (calcolatrici, tablet, smartphone, cellulari, auricolari BT etc.), di libri o documenti personali durante l'esame scritto.
- Per sostenere gli esami è obbligatorio prenotarsi utilizzando gli appositi strumenti previsti dall’ateneo.
- Non sono ammesse prenotazioni tardive tramite email. In mancanza di prenotazione, l'esame non potrà essere verbalizzato.
- La verifica dell’apprendimento potrà essere effettuata anche per via telematica, qualora le condizioni lo dovessero richiedere.
Esempi di domande e/o esercizi frequenti
Esempi di domande per l'esame scritto saranno illustrati a lezione.
English version