FISICA

LAUREA MAGISTRALE

LABORATORIO DI BIOFISICA COMPUTAZIONALE

Docenti: 
Crediti: 
6
Sede: 
PARMA
Anno accademico di offerta: 
2020/2021
Responsabile della didattica: 
Settore scientifico disciplinare: 
FISICA APPLICATA (A BENI CULTURALI, AMBIENTALI, BIOLOGIA E MEDICINA) (FIS/07)
Semestre dell'insegnamento: 
Primo Semestre
Lingua di insegnamento: 

Italiano

Obiettivi formativi

Al termine del corso lo studente dovrà conoscere e aver compreso le caratteristiche delle strutture proteiche ed i principi fisici e biologici fondamentali alla base delle metodologie e delle tecniche illustrate. In particolare dovrà essere in grado di:
1. consultare le principali banche dati biologiche, in particolare di sequenze e strutture proteiche.
2. ricavare tutte le informazioni strutturali/funzionali possibili a partire da una sequenza proteica
3. analizzare le proprietà strutturali delle proteine tramite la grafica molecolare
4. lanciare una simulazione semplice di dinamica molecolare di un sistema proteico
5. lanciare una simulazione di docking molecolare di un sistema proteico
6. correlare tutti i dati che possono essere utili per comprendere le proprietà fondamentali del sistema in studio, con particolare riguardo alla relazione struttura-funzione biologica.
7. utilizzare il lessico disciplinare specifico acquisito
8. consultare e comprendere gli articoli scientifici presenti in letteratura.
Inoltre lo studente dovrà essere in grado di scegliere l’approccio migliore allo studio di una problematica inerente un sistema proteico e appurarne l’efficacia e l’utilità, cercando soluzioni in modo autonomo e approfondendo le conoscenze con studio personale.
Lo studente dovrà infine essere capace di comunicare i risultati delle proprie analisi e dei propri studi in maniera chiara, sintetica ed esaustiva. Tale abilità sarà particolarmente esercitata durante il corso tramite la stesura di relazioni delle attività pratiche svolte.

Prerequisiti

Nessuno.

Contenuti dell'insegnamento

Struttura delle proteine. Interazioni covalenti e non covalenti che partecipano alla definizione della struttura delle biomolecole. Struttura primaria. Struttura secondaria. Rappresentazione topologica. Strutture super-secondarie. Ramachandran plot. Struttura terziaria e folding proteico. Metodi teorici e sperimentali per la determinazione della struttura proteica secondaria e terziaria. Modellizzazione comparativa e cenni ai metodi teorici di predizione del fold. Classificazione dei fold. Struttura quaternaria.
Banche dati biologiche. Caratteristiche e modalità di ricerca nelle principali banche dati di sequenze e strutture proteiche.
Analisi di sequenze proteiche e nucleotidiche. Similarità e metodi di allineamento (a coppie e multiplo). Ricerca di pattern e motivi conservati. Profili delle proprietà fisico-chimiche di una sequenza proteica. Predizione di strutture secondarie proteiche dalla sequenza primaria.
Analisi delle caratteristiche strutturali e delle proprietà funzionali di proteine e complessi proteici tramite software di grafica molecolare e server di rete.
Tecniche computazionali per lo studio di struttura e dinamica delle proteine. Energia potenziale e force field. Simulazione del solvente. Minimizzazione dell'energia. Simulazioni di Dinamica Molecolare.
Riconoscimento molecolare. Simulazioni di interazioni molecolari: docking e drug design.
Esercitazioni pratiche durante lo svolgimento di ciascuna parte del programma.

Programma esteso

Struttura delle macromolecole biologiche. Le basi azotate. Il codice genetico e la sua traduzione. Livelli di strutturazione nelle proteine. Struttura primaria. Gli amminoacidi e le loro caratteristiche. Legame peptidico e angoli di torsione del backbone. Interazioni covalenti e non covalenti che partecipano alla definizione della struttura delle biomolecole: ponti disolfuro, ponti salini, legami H convenzionali e non convenzionali, interazione catione-pi, interazione ammino-aromatica, stacking aromatico, interazione idrofobica. Struttura secondaria delle proteine: alfa-elica, foglietto-beta, elica 310, elica 3-10, elica poliprolinica, turn, omega-loop, random coil e proteine intrinsecamente non strutturate. Rappresentazione topologica. Strutture super-secondarie. Ramachandran plot. Metodi per la determinazione della struttura secondaria delle proteine: DSSP e Stride. Struttura terziaria delle proteine. Ipotesi termodinamica di Anfinsen. Il problema del folding. Proteine omologhe e conservazione della struttura. Modellizzazione comparativa e cenni ai metodi teorici di predizione del fold. Classificazione delle strutture terziarie. SCOP e CATH. Struttura quaternaria delle proteine.
Banche dati biologiche. Banche dati di sequenze e strutture di macromolecole biologiche e metodi per effettuare una ricerca. Caratteristiche dei principali database di sequenze nucleotidiche. Esempio di una entry del EMBL Nucleotide Sequence Database. Caratteristiche dei principali database di sequenze proteiche. Esempio di una entry di UniProt. Il database di strutture proteiche PDB. Altre banche dati strutturali (DSSP, HSSP, PDBePISA...).
Analisi di sequenza. Omologia e similarità. Protocollo fondamentale per l’analisi di sequenza. Traduzione del DNA e identificazione della sequenza proteica. Ricerca di similarità. Allineamento di sequenze. Inserimento dei gap. Matrici di punti e di sostituzione. PAM e BLOSUM. Algoritmi di allineamento globale e locale (Needleman e Wunsch; Smith e Waterman). Ricerca di similarità vs. una banca dati di sequenze: metodi euristici. FASTA, BLAST, PSI-PLAST, PHI-BLAST: caratteristiche ed utilizzo. Significatività di un allineamento: Z-score, probabilità e valore di aspettazione. Allineamento multiplo di sequenze. ClustalOmega. Profilo di un multiallineamento. Pattern recognition. Prosite, BLOCKS, PRINTS: caratteristiche ed utilizzo.
Caratterizzazione e analisi dei profili fisico-chimici di una sequenza. Helical wheels.
Metodi di predizione della struttura secondaria.
Analisi grafica molecolare. Accesso e caratteristiche del PDB databank. Il file PDB. I software di grafica molecolare e l’analisi di una struttura proteica: correlazione struttura-funzione. RasMol, VMD, Swiss-Pdb viewer: caratteristiche ed utilizzo.
Tecniche computazionali. Vantaggi, limiti e possibili applicazioni. Assunzioni fondamentali dalla meccanica molecolare classica. Energia potenziale e force field. Sommatoria di Ewald e PME. Simulazione del solvente. Minimo assoluto e minimo locale dell'energia potenziale. Minimizzazione dell'energia.
Dinamica molecolare. Richiami di meccanica statistica. Ipotesi ergodica. Calcolo della traiettoria atomica. Protocollo standard di simulazione. Principali metodi di analisi dei risultati. Caratteristiche ed utilizzo di un semplice software di dinamica molecolare. Principali comandi di Unix. Il software Gromacs: caratteristiche ed utilizzo.
Riconoscimento molecolare e teoria del binding. Docking molecolare. Tecniche di virtual screening e drug design. l'Algoritmo Genetico Lamarckiano. Il software Autodock4: caratteristiche ed utilizzo.

Bibliografia

A.M. Lesk, "Introduction to protein science", Oxford Univeristy Press.
A.M. Lesk, "Introduzione alla Bioinformatica", McGraw-Hill Ed.
M. Helmer Citterich, F. Ferrè, G. pavesi, C. Romualdi, G. Pesole, “Fondamenti di Bioinformatica”, Zanichelli Ed.
G. Valle, M. Helmer Citterich, M. Attimonelli, G. Pesole, "Introduzione alla Bioinformatica", Zanichelli Ed.
D.E. Krane, M.L. Raymer, "Fondamenti di Bioinformatica", Pearson Education Ed.
Dal docente verranno fornite le slide utilizzate a supporto delle lezioni ed articoli di rassegna.

Metodi didattici

Lezioni ed esercitazioni al calcolatore erogate in presenza, fruibili anche a distanza in modalità sincrona (diretta streaming) e asincrona (le lezioni verranno registrate e resteranno fruibili per due settimane), attraverso la piattaforma Teams. Tuttavia, le modalità di erogazione e di verifica potrebbero variare in corso d’anno, a seconda del protrarsi o meno dell'emergenza Covid-19.
A supporto delle lezioni verranno utilizzate delle slide che sono da considerarsi parte integrante del materiale didattico e che verranno di volta in volta caricate sulla piattaforma Elly alcuni giorni prima dell’inizio di ogni nuovo argomento. Verranno altresì forniti articoli di rassegna sui vari argomenti trattati. Per scaricare il materiale didattico è necessaria l’iscrizione on line al corso sulla piattaforma Elly.
Ogni argomento illustrato a lezione verrà seguito da una esercitazione pratica tramite l’utilizzo di un computer e, in alcuni casi, del cluster di Calcolo di ateneo HPC. Durante le esercitazioni si utilizzeranno sia banche dati e server di rete, che diversi software di analisi e calcolo. I software sono tutti scaricabili gratuitamente, perciò coloro che seguirano le lezioni a distanza o registrate, dovranno installare i software su un proprio computer seguendo le indicazioni che la docente inserirà su Elly. Le esercitazioni verranno dapprima guidate dalla docente su un sistema di esempio e successivamente svolte personalmente dagli studenti per renderli padroni delle tecniche e delle metodologie avanzate nel campo della biofisica computazionale, in particolare per la determinazione, predizione e analisi di struttura e dinamica di sistemi proteici.
E’ richiesta una relazione scritta su ciascuna esercitazione pratica svolta, che illustri il sistema studiato, il metodo utilizzato, i risultati ottenuti, le conclusioni e i commenti. Tale relazioni potranno essere consegnate in itinere (e, in tal caso, preventivamente controllate dal docente), man mano che verrà svolta l’esercitazione; in ogni caso dovranno essere consegnate tassativamente al docente alcuni giorni prima di sostenere l’esame, saranno corrette, e costituiranno parte integrante della valutazione. Per questo motivo, la consegna delle relazioni è condizione necessaria per poter sostenere l’esame.
Si ricorda agli studenti di controllare costantemente il materiale didattico disponibile e gli avvisi forniti dalla docente tramite la piattaforma Elly.

Modalità verifica apprendimento

Valutazione sommativa.
Prova orale in modalità a distanza mediante la piattaforma Teams (a meno che il cessare dell'emergenza Covid-19 non permetta una verifica in presenza). Come riportato nella sezione "Metodi didattici", è richiesta una relazione scritta su ciascuna esercitazione pratica svolta, che illustri il sistema studiato, il metodo utilizzato, i risultati ottenuti, le conclusioni e i commenti. Tale relazioni potranno essere consegnate in itinere (e, in tal caso, preventivamente controllate dal docente), man mano che verrà svolta l’esercitazione; in ogni caso dovranno essere consegnate tassativamente al docente alcuni giorni prima di sostenere l’esame, saranno corrette, e costituiranno parte integrante della valutazione. Per questo motivo, la consegna delle relazioni è condizione necessaria per poter sostenere l’esame. L’esame partirà dalla discussione delle relazioni riguardanti le esercitazioni svolte e proseguirà poi con alcune domande orali sui concetti fondamentali su cui si fondano le metodologie affrontate. La valutazione/discussione delle relazioni e la risposta alle domande peseranno ciascuna al 50% nella valutazione finale.