Blog
RIASSUNTO BIOINFORMATICA UNIFI FONDI MARCO
- 6 Febbraio 2021
- Pubblicato da: studemme.com
- Categoria: Articoli di studemme

Stai cercando il riassunto BIOINFORMATICA UNIFI FONDI MARCO?
Lo trovi qui: https://studemme.com/courses/bioinformatica-unifi-fondi-marco/
Video riassunto di BIOINFORMATICA valido per il corso di LAUREA MAGISTRALE IN BIOLOGIA MOLECOLARE E APPLICATA della UNIVERSITÀ DEGLI STUDI DI FIRENZE.
Il video riassunto è stato realizzato da uno studente dopo avere seguito tutte le lezioni in classe ed aver superato l’intero modulo. Lo studente che ha realizzato questo video-riassunto ha superato l’esame con voto 30L.
Il corso universitario è tenuto dal professor Marco Fondi.
ARGOMENTI TRATTATI:
1 – Concetto di sequenza e tipi di file (FASTA, GenBank, GFF, PDB) .
2 – Come si confrontano le sequenze. Match, Missmatch e GAP. Allineamento di 2 sequenze con gli algoritmi globali come Needlman-Wunsh e locali come Smith-Waterman e BLAST. Valutazione della significatività dell’allenamento. Allineamento di più di 2 sequenze con algoritmi progressivi.
3 – Calcolo della distanza tra stringhe con 3 approcci: distanza di Hamming, Levenshtein e P-distance. Modelli di sostituzione che tengono conto dei problemi evolutivi: Modello di Jukes-Cantor, Kimura e GTR.
4 – Filogenesi molecolare: di cosa si occupa, cos’è un albero filogenetico e come si interpreta. Step per la costruzione della storia evolutiva di una sequenza e ricostruzione dell’albero con i 2 metodi possibili (basati sulla distanza e Massima Parsimonia). 2 modi per considerare i GAP : complete deletion e pairwise deletion.
5 – Evoluzione genica: forze che hanno portato alla formazione di geni omologhi (ortologhi e paraloghi) e metodi per l’identificazione dei geni ortologhi: basati sulla costruzione di alberi filogenetici e basati sulla similarità di sequenze (BBH).
La slide 6 è uno schema che mostra tutte le possibili analisi che possono essere effettuate a partire all’utilizzo delle tecnologie NGS che ci permettono l’ottenimento delle reads.
6- 3 tecnologie NGS (Illumina, PacBio e Nanopore) e il loro funzionamento, ottenimento reads in formato FASTQ e fase di controllo attraverso tool quali FASTQC. Analisi dell’elettroferogramma e utilizzo di algoritmi base-calling (Phred) per associare la qualità ad ogni chiamata. Trimming e rimozione delle basi con qualità scarsa.
7- Il capitolo 7 è diviso il 2 Slide.
Slide 8: Mappaggio come primo passaggio per poi effettuare Chiamata di Varianti (SNPs), utilizzo di file SAM, BAM, Mpileup, VCF per l’identificazione di ipotetiche mutazioni e criteri per la corretta chiamata delle varianti. Esempi di utilizzo di questa analisi.
Slide 9: A partire dal mappaggio analisi di L’RNA-seq per la quantificazione del trascritto di una cellula con esperimenti “time series” e “trattato Vs controllo” . Stima del livello di espressione con raw counts, CPM, RPKM/FPKM, TPM. Utilizzo di algoritmi clustering per identificazione di geni con espressione simile.
Tn-seq per l’identificazione di geni essenziali e geni a essenzialità condizione-specifica.
8- capitolo 8 diviso in 2 Slide.
Slide 10: Ricostruzione di un genoma di riferimento con i 2 metodi Sanger e Brujin, difficoltà nell’assemblaggio e utilizzo di informazioni del sequenziamento paired end o di un genoma di riferimento come aiuto nella ricostruzione.
Criteri per calcolare l’affidabilità del genoma ricostruito.
Slide 11: Possibili strade dopo l’assemblaggio del genoma: predizione genica con i 3 approcci (statistico, comparativo e basato sull’omologia) oppure genomica comparativa con identificazione del Pangenoma e dei geni ortologhi.
9- Altre utilità del sequenziamento: identificazione cluster genici con funzioni importanti attraverso 2 metodi: sperimentale e bioinformatico (UNIPROT, GO, COG, KEGG, Eggnog); GSEA.
10- Metagenomica con i 2 approcci: Targeted e Unturgeted.
Lascia un commento Annulla risposta
Devi essere connesso per inviare un commento.