SCIENZE BIOLOGICHE, GEOLOGICHE E AMBIENTALIBiologia ambientaleAnno accademico 2024/2025
9798765 - BIOMETRIA E STUDIO DELLE POPOLAZIONI ANIMALI
Docente: CARMELO FRUCIANO
Risultati di apprendimento attesi
Alla fine del
corso, gli studenti saranno in grado di:
- Utilizzare svariate tecniche per
l’analisi di dati biologici
- Comprendere come tecniche analitiche
(incluse tecniche di machine learning) possano essere utilizzate per
classificazione, predizione e test di ipotesi in contesti biologici.
- Esplorare e visualizzare dati
biometrici utilizzando plot.
- Avere un’ampia conoscenza di casi di
applicazione delle tecniche di analisi di dati a sistemi biologici reali
da popolazioni naturali
- Utilizzare il software R per task di
bassa difficoltà di analisi dei dati (utilizzo di pacchetti esistenti per
effettuare le tecniche di analisi apprese)
- Avere una comprensione di come le
tecniche di analisi di dati e machine learning apprese siano implementate
tipicamente in software ad interfaccia grafica
Modalità di svolgimento dell'insegnamento
- Lezioni frontali: trattazione dei concetti teorici con esempi pratici.
- Laboratori informatici: applicazioni pratiche delle tecniche di analisi dei dati utilizzando software (in particolare R).
Prerequisiti richiesti
- Conoscenze di base di biologia
animale.
- Conoscenza della lingua inglese
(necessaria per la lettura di articoli scientifici e materiali didattici).
Frequenza lezioni
La
frequenza alle lezioni e ai laboratori è importante per svariate ragioni, tra
cui il fatto che le competenze tecniche apprese durante il corso sono
fondamentali per il superamento della parte pratica.
Contenuti del corso
Modulo 1:
Strumenti biometrici
- Introduzione alla biometria e tipi di
dati (morfologici, genetici e ambientali) da popolazioni animali
- Analisi dei dati e biometria: statistica,
machine learning e intelligenza artificiale
- Esplorazione e visualizzazione dei
dati biologici tramite plot (es., box plot, scatterplot, istogrammi)
- Comparare due gruppi: metodi basati
su randomizzazione ed altri approcci
- Modelli lineari generali e loro
applicazioni
- Analisi delle componenti principali
(PCA)
- Classificazione – Analisi
discriminante e classificazione in base alle caratteristiche biometriche
- Classificazione – Alberi decisionali
e random forest (costruzione
di modelli predittivi utilizzando tecniche di machine learning).
- Quantificare la performance dei
modelli di classificazione con la validazione incrociata
- Quantificare la variabilità e
compararla tra popolazioni
- Altre tecniche basate sulla
randomizzazione
Modulo 2:
Applicazioni in popolazioni naturali
- Casi di studio con applicazione di tecniche trattate nel primo modulo
- Applicazioni con utilizzo di dati morfometrici
- Dati ecologici e relative problematiche
- Genetica, genomica e trascrittomica delle popolazioni animali
Testi di riferimento
Non sono previsti testi “adottati” in senso stretto ed il materiale di riferimento principale sarà quello fornito dal docente.
Vengono, comunque, segnalati alcuni testi che possono essere utilizzati per la consultazione e per approfondimenti.
Testi per la consultazione
- Sokal, R.R., Rohlf, F.J. Biometry: The Principles and Practice of Statistics in Biological Research, W.H. Freeman.
- Vu, J., Harrington, D., Introductory Statistics for the Life and Biomedical Sciences. Openintro (disponibile all'indirizzo https://www.openintro.org/book/biostat/)
Verifica dell'apprendimento
Modalità di verifica dell'apprendimento
La
valutazione avverrà mediante esame orale teorico-pratico. Potrà essere previsto
un test scritto di valutazione intermedia riservato agli studenti frequentanti,
le cui modalità e tempistiche verranno comunicate agli studenti durante il
corso.
Esempi di domande e/o esercizi frequenti
- Descrivere come l'analisi delle
componenti principali (PCA) può essere utilizzata per esplorare un dataset
biometrico.
- Quali sono i vantaggi dell’utilizzo
di alberi decisionali e random forest?
- Spiegare come la validazione
incrociata può essere impiegata per testare l'accuratezza dei modelli
predittivi basati su machine learning.
English version