L’insegnamento ha l’obiettivo di fornire i concetti relativi alle architetture avanzate nei moderni sistemi di elaborazione dell’informazione.
Partendo dalle architetture di base, il corso affronta le problematiche e le soluzioni relative all’esecuzione di applicazioni e presenta le metodologie hardware e software per l’ottimizzazione delle prestazioni per le diverse forme di parallelismo (instruction-level, data-level, thread-level).
Lo studente conoscerà e comprenderà:
-le tecniche per l’esecuzione ottimale delle applicazioni nei processori pipeline con istruzioni floating point
-le problematiche e le soluzioni relative alle eccezioni nei processori pipeline.
-le tecniche di branch prediction
-le problematiche e le soluzioni relative alla schedulazione statica e dinamica delle istruzioni
-le architetture dei processori che sfruttano forme di data level parallelism
-le diverse forme di thread-level parallelism e le relative implementazioni
-le architetture multiprocessori
-le problematiche e le soluzioni per la coerenza delle memorie cache in sistemi multiprocessori
Lo studente sarà in grado di valutare le prestazioni dei moderni sistemi a microprocessore, per sfruttare al meglio le diverse forme di parallelismo delle applicazioni in relazione alle caratteristiche delle diverse architetture e per proporre eventuali ottimizzazioni.
Lo studente sarà in grado di valutare l'impatto delle scelte architetturali sulle prestazioni dei calcolatori.
Lo studente sarà in grado di esporre in modo chiaro e rigoroso le conoscenze acquisite e come applicarle per la valutazione delle diverse scelte architetturali.
Lo studente sarà in grado di apprendere autonomamente ulteriori caratteristiche avanzate delle architetture dei processori
L'insegnamento verra svolto utilizzando lezioni frontali ed esercitazioni.
Qualora l'insegnamento venisse impartito in modalità mista o a distanza potranno essere introdotte le necessarie variazioni rispetto a quanto dichiarato in precedenza, al fine di rispettare il programma previsto e riportato nel syllabus.
Conoscenza delle architetture dei calcolatori base e le relative problematiche, i linguaggi assembly
La frequenza non è obbligatoria, ma è fortemente consigliata.
1. Architettura di base
* Organizzazione pipeline dei processori (problematiche e soluzioni, implementazione).
* Branch prediction.
* Eccezioni nella pipeline.
2. Parallelismo a livello di Istruzione
* Scheduling statico e dinamico.
* Speculazione Hardware, Esecuzione Multi-issue. Architetture superscalari: principi e problemi.
* Architetture VLIW (Very Long Instruction Word), esempi di famiglie di architetture
3. Parallelismo a livello di dati
Processori vettoriali.
Estensioni SIMD;
4. Sistemi multiprocessore e parallelismo a livello di thread
* Tassonomia, topologie, gestione della comunicazione nei sistemi multiprocessore.
* Gestione della memoria.
* I protocolli di coerenza della cache.
5. Architetture Application Specific
_____________________________________________________________
* Conoscenze minime irrinunciabili per il superamento dell'esame.
N.B. La conoscenza degli argomenti contrassegnati con l'asterisco è condizione necessaria ma non sufficiente per il superamento dell'esame. Rispondere in maniera sufficiente o anche più che sufficiente alle domande su tali argomenti non assicura, pertanto, il superamento dell'esame.
[T1] Hennessy & Patterson: Computer architecture, a quantitative approach (Morgan Kaufmann eds.) 5 ed.
[T2] Patterson & Hennessy: “Struttura e progetto dei calcolatori”. Zanichelli 4. Ed
[T3] Materiale fornito dal docente
Argomenti | Riferimenti testi | |
---|---|---|
1 | Organizzazione pipeline: problematiche e soluzioni. Esecuzione Pipeline di istruzioni Floating Point | T1 Appendix C, T2 Capitolo 4 |
2 | Tecniche di branch prediction statiche e dinamiche | T1 Capitolo 3 |
3 | Gestione delle eccezioni nella pipeline | T1 Appendix C, T2 Capitolo 4 |
4 | Data e control dependence. Schedulazione static e dinamica delle istruzioni | T1 Capitolo 3 |
5 | Schedulazione dinamica mediante Scoreboard | T1 Capitolo 3 |
6 | Schedulazione dinamica mediante algoritmo di Tomasulo | T1 Capitolo 3 |
7 | Esecuzione speculativa e Reorder Buffer | T1 Capitolo 3 |
8 | Architetture superscalari: multi-issue con schedulazione statica e dinamica | T1 Capitolo 3 |
9 | Architetture VLIW (Very Long Instruction Word) | T1 Appendix H |
10 | Processori a parallelismo sui data. | T1 Capitolo 4 |
11 | Architetture in grado di supportare il parallelismo a livello di thread | T1 Capitolo 5 |
12 | Multiprocessori | T1 Capitolo 5 |
13 | Gestione della memoria nei multiprocessori. I protocolli di coerenza della cache. | T1 Capitolo 5 |
14 | Architetture Application Specific | T3 |
Gli studenti devono svolgere una prova orale.
La verifica dell’apprendimento potrà essere effettuata anche per via telematica, qualora le condizioni lo dovessero richiedere.
E’ possibile scaricare esempi di domande e/o esercizi all’indirizzo http://studium.unict.it