mail unicampaniaunicampania webcerca

    Luigi RUSSO

    Insegnamento di BIOSTATISTICA E BIOINFORMATICA

    Corso di laurea magistrale in BIOLOGIA

    SSD: BIO/03

    CFU: 3,00

    ORE PER UNITÀ DIDATTICA: 24,00

    Periodo di Erogazione: Secondo Semestre

    Italiano

    Lingua di insegnamento

    ITALIANO

    Contenuti

    BIOSTATISTICA: Statistiche descrittive. Rappresentazione grafica dei dati. Curve di distribuzione. Indici di tendenza centrale, di forma, di dispersione. Statistica inferenziale: T-test, Analisi della Varianza, correlazione e regressione lineare. Analisi multivariate. Classificazione gerarchica e non gerarchica. Ordinamento. Analisi dei Componenti Principali.
    Modulo di BIOINFORMATICA PER L’ANALISI DEI GENOMI: Il corso verterà sullo studio degli aspetti fondamentali dell’analisi dei dati genomici. Verranno approfondite le metodologie omiche, la struttura e l’utilizzo dei dati bioinformatici. Verranno inoltre trattate le principali strategie bioinformatiche per l’identificazione di varianti genetiche e di profili di espressione genica, metilazione e struttura cromatinica.
    BIOINFORMATICA PER LO STUDIO DELLE PROTEINE: Proteomi e proteine strutturare e disordinate. Annotazione funzionale di proteine. Interazioni proteina-proteina e proteina-DNA/RNA. Banche dati: sequenze proteiche-Uniprot, bache dati per proteine disordinate e metallo-proteine,motivi funzionali, strutture proteiche-PDB e PDBe, interazioni proteiche mediante tecniche computazionali. Metodi bioinformatici per l’analisi di sequenze proteiche: descrittori di elementi funzionali nelle sequenze proteiche, livelli di descrizione delle strutture proteiche, metodi sperimentali per la determinazione della struttura di proteine strutturate e non strutturate. Predizione della struttura terziaria e quaternaria di complessi proteici mediante la metodologia AlphaFold. Tools per l’analisi e la visualizzazione della struttura di complessi proteici: CHIMERA, PROCHECK.

    Testi di riferimento

    BIOSTATISTICA: Whitlock M.C and Schluter, D., 2010. Analisi statistica dei dati biologici. Zanichelli. Fowler J., Cohen L., 2010. Statistica per ornitologi e naturalisti. Franco Muzzio Editore- Dispense e materiale didattico distribuito a lezione.
    Modulo di BIOINFORMATICA PER L’ANALISI DEI GENOMI: 1) Fondamenti di Bioinformatica – Manuela Helmer Citterich, Fabrizio Ferrè, Giulio Pavesi , Chiara Romualdi, Graziano Pesole; prima edizione 2018, Zanichelli; 2) Next Generation Sequencing and Data Analysis – Melanie Kappelmann-Fenzl; 2021, Springer (download disponibile dal catalogo online di ateneo https://unina2.on-line.it/opac/.do).

    BIOINFORMATICA PER LO STUDIO DELLE PROTEINE:Manuela Helmer Citterich, Fabrizio Ferrè, Giulio Pavesi , Graziano Pesole, Chiara Romualdi-
    Fondamenti di bioinformatica-Zanichelli
    Stefano Pascarella, Alessandro Paiardini-
    Bioinformatica Dalla sequenza alla struttura delle proteine- Zanichelli

    Obiettivi formativi

    Capacità di Applicare la Conoscenza e la Comprensione:
    BIOSTATISTICA:
    Conoscenza e Comprensione:
    lo studente acquisirà conoscenze approfondite sulle metodologie statistiche semplici (descrittive ed inferenziali) e multivariate (classificazione ed ordinamento) necessarie per l’analisi di sistemi biologici a diversa complessità. Gli studenti comprenderanno le nozioni di base della biostatistica sia per affrontare l’analisi di dati provenienti da una ricerca originale che per leggere in maniera più consapevole i risultati di ricerche pubblicate su riviste scientifiche. Inoltre, attraverso l’uso di esercitazioni pratiche, lo studente acquisirà la conoscenza dell’uso di fogli di lavoro elettronici e software di statistica.
    Capacità di Applicare la Conoscenza e la Comprensione:
    Lo studente sarà capace di applicare la conoscenza acquisita per scegliere quali statistiche applicare a dati biologici in funzione del tipo di variabili e di disegno sperimentale. Lo studente sarà inoltre capace di comprendere i risultati delle statistiche utilizzate
    Autonomia di Giudizio:
    l’insegnamento favorisce lo sviluppo della capacità di giudicare in maniera critica gli scenari anche complessi nell’ analisi statistica di dati biologici che lo studente potrà incontrare nel suo futuro percorso scientifico e professionale.

    Modulo di BIOINFORMATICA PER L’ANALISI DEI GENOMI: L’insegnamento ha lo scopo di fornire allo studente una conoscenza solida dei principi di analisi genomica. L'insegnamento si propone altresì di fornire conoscenze dettagliate sulle metodologie e relative applicazioni per lo studio del genoma e della sua regolazione. Al termine del corso, lo studente sarà in grado di: - conoscere gli strumenti e i metodi bioinformatici per l’analisi dei dati genomici; - proporre strategie di indagine per lo studio dei fenomeni genomici ed epigenetici; - utilizzare banche dati per la ricerca applicata a dati genomici.
    BIOINFORMATICA PER LO STUDIO DELLE PROTEINE:
    lo studente apprenderà conoscenze approfondite relative all’uso di programmi avanzati di grafica molecolare e sarà in grado di accedere alle banche dati disponibili in rete per l’ analisi delle strutture proteiche ottenute con diverse tecniche spettroscopiche; l’uso di informazioni strutturali per progettare esperimenti di mutazione sito diretta, la predizione della struttura terziaria e quaternaria di complessi proteici mediante l'approccio AI AlphaFold.

    Autonomia di Giudizio:
    l’insegnamento favorisce lo sviluppo della capacità di valutare criticamente scenari e problemi complessi nel campo della bioinformatica, consentendo agli studenti di formulare decisioni autonome basate su conoscenze teoriche e dati sperimentali

    Abilità Comunicative: lo studente maturerà un linguaggio scientifico appropriato per descrive le innovative metodiche di bioinformatica. Sarà in grado di presentare in maniera chiara ed efficace i risultati ottenuti mediante l'applicazione delle metodologie di bioinformatica.

    Capacità di Apprendimento:
    l’insegnamento promuove la capacità di apprendimento continuo, supportando l’autonomia decisionale e operativa nello studio e nell’ approfondimento teorico-pratico delle conoscenze acquisite attraverso la consultazione di testi e letteratura scientifica, per affrontare in maniera efficace nuove problematiche del settore della chimica e biologia strutturale. Inoltre, il corso fornirà le nozioni che permetteranno allo studente di proseguire gli studi in ambiti affini con un adeguato livello di autonomia.

    Prerequisiti

    Conoscenze di base della Biologia

    Metodologie didattiche

    BIOSTATISTICA:
    consiste di 18 ore di lezioni frontali con l’ausilio di slides e di 6 ore di esercitazioni numeriche svolte anche con uso di softwares in cui le statistiche illustrate nelle lezioni frontali vengono usate per analizzare dati biologici provenienti dalla letteratura scientifica e dai risultati di ricerche originali.

    Il modulo di BIOINFORMATICA PER L’ANALISI DEI GENOMI consiste di 16 ore frontali con l’ausilio di diapositive.

    BIOINFORMATICA PER LO STUDIO DELLE PROTEINE:- Lezioni frontali in aula su tutti gli argomenti del corso. Le lezioni sono svolte mediante l’ausilio della lavagna e mediante la proiezione di diapositive

    Metodi di valutazione

    BIOSTATISTICA: Esame scritto finale: l’esame consiste di 3-4 domande contenenti sia esercizi numerici che l’interpretazione dei risultati delle statistiche (semplici e multivariate) Il tempo a disposizione varia tra 20 e 30 minuti in funzione della complessità degli esercizi proposti L’esame si considera superato se le risposte corrette superano il 60%. Il voto è dato in 30/30; il valore viene successivamente ponderato in funzione del numero di CFU del modulo.
    Moduli di BIOINFORMATICA PER L’ANALISI DEI GENOMI e BIOINFORMATICA PER LO STUDIO DELLE PROTEINE: la verifica finale prevede un esame orale teso a verificare la conoscenza delle strategie bioinformatiche per l’analisi dei dati genomici e proteomici. La valutazione finale dell’esame, espressa in trentesimi, tiene conto della capacità di comprensione e apprendimento degli argomenti trattati, l'uso dei termini scientifici adeguati e la capacità di collegamento fra concetti diversi.
    Il voto finale sarà espresso in trentesimi e sarà calcolato come media ponderata dei voti ottenuti: 42% per la biostatistica, 29% per la bioinformatica applicata all'analisi dei genomi e 29% per la bioinformatica applicata allo studio delle proteine.
    <18 Non superato: lo studente non dimostra risultati coerenti con i descrittori di conoscenza e comprensione, applicazione, giudizio, comunicazione e capacità di apprendere.
    18-21 Livello sufficiente: lo studente raggiunge i descrittori di base relativi alla conoscenza e comprensione dei contenuti fondamentali e mostra una prima capacità di applicazione in contesti semplici.
    22-24 Livello pienamente sufficiente: lo studente soddisfa i descrittori di conoscenza e comprensione applicate, mostrando capacità di applicare concetti chiave correttamente e iniziare ad analizzare criticamente situazioni pertinenti ai temi dell’insegnamento.
    25-26 Livello buono: lo studente dimostra autonomia di giudizio nel valutare e confrontare scenari pertinenti, applica conoscenze in modo efficace e comunica risultati con chiarezza, riflettendo competenze più consolidate.
    27-29 Livello molto buono: lo studente soddisfa in modo avanzato i descrittori dei cinque ambiti, con padronanza dei contenuti, capacità di valutare criticamente casi complessi e abilità comunicative solide, evidenziate in elaborati e presentazioni.
    30 Livello eccellente: lo studente eccelle in tutti i descrittori di Dublino, con conoscenza approfondita, applicazione sicura e critica, giudizio autonomo, comunicazione efficace e capacità di apprendere in modo continuo e creativo, producendo lavori di elevata qualità sia nella presentazione sia nelle prove scritte/orali. La lode può essere attribuita quando lo studente dimostra, oltre a quanto sopra, particolare originalità, approfondimento e innovazione nell’elaborato e nella presentazione, superando le aspettative standard.

    Altre informazioni

    BIOSTATISTICA:
    La frequenza è fortemente consigliata. Durante il corso gli studenti potranno sostenere almeno una prova di autovalutazione in itinere che simulerà la prova scritta finale e che riguarderà gli argomenti trattati fino a quel momento. I risultati e le correzioni sono discusse in aula.
    Il materiale didattico (dispense, esercizi) sono disponibili su share points e sul canale Teams.
    Il docente è disponibile per ricevimento studenti nei giorni indicati nella scheda dell’insegnamento e, su richiesta, anche in altri momenti concordabili via email

    BIOINFORMATICA PER L’ANALISI DEI GENOMI Copie pdf delle diapositive presentate a lezione sono disponibili sullo sharepoint di ateneo, accessibile dalla pagina web del docente.

    BIOINFORMATICA PER LO STUDIO DELLE PROTEINE: Lo studente potrà avvalersi del materiale didattico (dispense, esercizi, ecc.) messo a disposizione sul sito web del Dipartimento di Scienze e Tecnologie Ambientali Biologiche e Farmaceutiche (https://www.distabif.unicampania.it/dipartimento/docenti/) e nella classe vituale di Microsoft Teams.

    I docenti sono disponibili per ricevimento studenti nei giorni indicati sulla scheda insegnamento e su richiesta inoltrata via e-mail.

    Programma del corso

    BIOSTATISTICA: Introduzione alla biometria. Le variabili biologiche: definizioni ed esempi. Osservazioni individuali. Unità di campionamento. Popolazione statistica e popolazione biologica. Campione di osservazioni. Rappresentazioni grafiche di dati biologicici. Distribuzioni di frequenza. Curva di distribuzione normale e asimmetrica. Gestione di dati asimmetrici: normalizzazione e standardizzazione. Statistiche di centralità (media, mediana e moda). Statistiche di dispersione (deviazione standard, errore standard, coefficiente di variazione). Statistica inferenziale. Concetto di significatività statistica. Test parametrici e non parametrici. T-test o t di Student. F-test. Analisi della varianza (ANOVA). Interpretazione di risultati di ANOVA ad una ed a più vie. Correlazione e regressione lineare. Introduzione alla statistica multivariata - Indici di similarità e dissimilarità – indici per dati binari: Jaccard, Sorensen. indici per dati quantitativi Distanza Euclidea - matrici di similarità. Classificazione gerarchica e non gerarchica – criteri agglomerativi – legame medio, singolo e completo. Analisi dei Componenti Principali. Interpretazione di un biplot.
    Modulo di BIOINFORMATICA PER L’ANALISI DEI GENOMI: Dimensione, struttura e funzione del genoma. Meccanismi molecolari di evoluzione dei genomi. Allineamento singolo e allineamento multiplo di sequenze. BLAST. Metodologie di analisi dei genomi: prima, seconda e terza generazione di sequenziamento. Librerie di sequenziamento. Formato dei dati genomici e qualità del sequenziamento. Assemblaggio e annotazione del genoma. Sequenziamento whole-exome e whole-genome. Chiamata di varianti genomiche: identificazione e analisi strutturale/funzionale. Sequenziamento dell’RNA e annotazione di trascritti. Identificazione dei geni differenzialmente espressi e arricchimento funzionale. Analisi dell’epigenoma: 1) array e sequenziamento per lo studio della metilazione del DNA; 2) immunoprecipitazione della cromatina, sequenziamento e riconoscimento di motivi. Concetti di metagenomica. Grandi progetti genomici e banche dati pubbliche.
    BIOINFORMATICA PER LO STUDIO DELLE PROTEINE: Proteomi e proteine strutturare e disordinate. Elementi che contribuiscono al disordine strutturale. Annotazione funzionale di proteine. Interazioni proteina-proteina e proteina-DNA/RNA. Banche dati: sequenze proteiche-Uniprot, bache dati per proteine disordinate e metallo-proteine,motivi funzionali, strutture proteiche-PDB e PDBe, interazioni proteiche mediante tecniche computazionali. Metodi bioinformatici per l’analisi di sequenze proteiche: descrittori di elementi funzionali nelle sequenze proteiche, livelli di descrizione delle strutture proteiche, metodi sperimentali per la determinazione della struttura di proteine strutturate e non strutturate. Predizione della struttura terziaria e quaternaria di complessi proteici mediante la metodologia AlphaFold. Tools per l’analisi e la visualizzazione della struttura di complessi proteici: CHIMERA, PROCHECK.

    English

    Teaching language

    Italian

    Contents

    BIOSTATISTICS: Descriptive statistics. Graphical representation of data: Distribution curves. Centrality, shape and dispersion indexes. Inferential statistics. T-test, Analysis of Variance, Correlation, Regression. Multivariate analysis. Hierarchical and not hierarchical classification. Principal Component Analysis.
    BIOINFORMATICS FOR THE ANALYSIS OF GENOMES: the course will focus on the fundamental aspects of genomic data analysis. It will explore omic methodologies, as well as the structure and use of bioinformatic data. Additionally, the main bioinformatic strategies for identifying genetic variants, gene expression profiles, methylation, and chromatin structure will be covered.
    BIOINFORMATICS FOR STUDYING PROTEIN: Proteomes and structured/disordered proteins. Functional annotation of proteins. Protein-protein and protein-DNA/RNA interactions. Databases: protein sequences (Uniprot), databases for disordered proteins and metalloproteins, functional motifs, protein structures (PDB and PDBe), protein interactions using computational techniques. Bioinformatic methods for protein sequence analysis: descriptors of functional elements in protein sequences, levels of description of protein structures, experimental methods for determining the structure of structured and unstructured proteins. Prediction of the tertiary and quaternary structure of protein complexes using the AlphaFold methodologies. Tools for the analysis and visualization of the structure of protein complexes: CHIMERA, PROCHECK.

    Textbook and course materials

    BIOSTATISTICS: Whitlock M.C and Schluter, D., 2010. Analisi statistica dei dati biologici. Zanichelli Fowler J., Cohen L., 2010. Statistica per ornitologi e naturalisti. Franco Muzzio Editore- Further teaching material provided by the professor.
    BIOINFORMATICS FOR THE ANALYSIS OF GENOMES: 1) Fondamenti di Bioinformatica – Manuela Helmer Citterich, Fabrizio Ferrè, Giulio Pavesi , Chiara Romualdi, Graziano Pesole; 1st edition 2018, Zanichelli; 2) Next Generation Sequencing and Data Analysis – Melanie Kappelmann-Fenzl; 2021, Springer (download available from the University online catalogue https://unina2.on-line.it/opac/.do).

    BIOINFORMATICS FOR STUDYING PROTEIN:Manuela Helmer Citterich, Fabrizio Ferrè, Giulio Pavesi , Graziano Pesole, Chiara Romualdi-
    Fondamenti di bioinformatica-Zanichelli
    Stefano Pascarella, Alessandro Paiardini-
    Bioinformatica Dalla sequenza alla struttura delle proteine- Zanichelli

    Course objectives

    Applying Knowledge and Understanding:
    BIOSTATISTICS:
    Knowledge and understanding:
    Students will gain knowledge about the simple statistics (descriptive and inferential) as well as multivariate statistics (classification and ordination) needed to analyze biological systems at different scales of investigation. Students will gain an understanding of the fundamentals of biostatistics, equipping them to approach the analysis of original research data and to interpret the results of published scientific research more critically. Through practical exercises, students will also learn how to use spreadsheets and statistical software.
    Applying Knowledge and Understanding
    Students will be able to apply their knowledge to select the appropriate statistical methods for biological data depending on the type of variables and experimental design. They will also be able to interpret the results of the statistical methods used.
    Autonomy of Judgment
    The course helps students to develop the ability to critically assess complex scenarios in statistical biological data analysis that they may encounter in their future scientific and professional careers.

    BIOINFORMATICS FOR THE ANALYSIS OF GENOMES: aim of the course is to provide students with a solid understanding of the principles of genomic analysis. It also seeks to provide detailed knowledge of methodologies and related applications for studying the genome and its regulation. By the end of the course, students will be able to: - understand bioinformatics tools and methods for analysing genomic data; - propose investigation strategies for studying genomic and epigenetic phenomena; - utilise data banks relevant to genomic data.
    BIOINFORMATICS FOR STUDYING PROTEIN: the student will learn in-depth knowledge related of the use of advanced molecular graphics software and he will be able to access to the on-line databases for IDP and metallo-proteins and for structured proteins resolved by spectroscopic techniques. analysis of protein structures obtained via X-ray and NMR; the use of conformational information to design direct site mutation experiments; the prediction of the tertiary/quaternary structure of protein complexes using AI-based AlphaFold methods.

    Autonomy of Judgment: the teaching promotes the development of the ability to critically evaluate scenarios and complex problems in the field of bioinformatic, allowing students to make independent decisions based on theoretical knowledge and experimental data.

    Communication Skills: the student will develop appropriate scientific language to describe the innovative bioinformatic metodologies. They will be able to clearly present the scientific results obtained by applyng the moder bioinformatic methodologies.

    Learning Ability: : the teaching promotes the ability for continuous learning, supporting decision-making and operational autonomy in the study and theoretical-practical deepening of the knowledge acquired through the consultation of texts and scientific literature, to effectively address new issues in the field of structural biology and structural chemistry. Moreover, the course will give essencial concepts allowing the student to continue studying in related areas with an adequate level of autonomy.

    Prerequisites

    Basic knowledge in Biology

    Teaching methods

    BIOSTATISTICS:
    comprises 18 hours of lectures supported by slides, as well as six hours of practical exercises. Some of these exercises involve using software to apply the statistical methods covered in the lectures to analyse biological data.

    BIOINFORMATICS FOR THE ANALYSIS OF GENOMES comprises 16 frontal hours supported by slides.

    BIOINFORMATICS FOR STUDYING PROTEIN:- Frontal lectures on all course topics. The lectures are performed with the help of the blackboard and by the projection of slides

    Evaluation methods

    BIOSTATISTICS: Final examination: one written test: the test is made up of three or four questions concerning both numerical exercise and interpretation of results of statistics applied to biological data. Time available: between 20 and 30 minutes, depending on the complexity of the exercises The grading is in 30/30; the minimum mark (18/30) is gained if at least 60% of the answers are correct. The value is weighted according to the number of the CFU (3) of the Biostatistics course. The exam is considered passed (18/30) only if correct answers are more than 60%.
    BIOINFORMATICS FOR THE ANALYSIS OF GENOMES AND THE STUDY OF PROTEINS: the final assessment includes an oral exam designed to evaluate knowledge of bioinformatic strategies for analysing genomic and proteomic data. The final grade, expressed in thirtieths, considers the ability to understand and learn the topics covered, the use of appropriate scientific terminology and the ability to make connections between different concepts.

    The final mark will be expressed out of 30 and calculated as a weighted average of the marks achieved: 42% for Biostatistics, 29% for Bioinformatics for the Analysis of Genomes, and 29% for Bioinformatics for the Study of Proteins.
    <18 Fail: the student does not demonstrate learning outcomes consistent with the Dublin descriptors for knowledge and understanding, application, judgment, communication, and learning skills.
    18-21 Sufficient: the student achieves the basic descriptors for knowledge and understanding of fundamental content and shows an initial ability to apply this knowledge in simple contexts.
    22-24 Fully sufficient: the student meets the descriptors for applied knowledge and understanding, showing the ability to correctly apply key concepts and begin to critically analyze situations related to the course topics.
    25-26 Good: the student demonstrates autonomy of judgment in evaluating and comparing relevant scenarios, applies knowledge effectively, and communicates results clearly, reflecting more consolidated skills.
    27-29 Very good: the student demonstrates an advanced level across the five descriptors, with mastery of content, the ability to critically evaluate complex cases, and strong communication skills, evidenced in papers and presentations.
    30 Excellent: the student excels in all Dublin descriptors, with in-depth knowledge, safe and critical application, autonomous judgment, effective communication, and the ability to learn continuously and creatively, producing high-quality work both in presentations and written/oral tests. Honors (cum laude) may be awarded when the student demonstrates, in addition, particular originality, depth, and innovation in the paper and presentation, exceeding standard expectations.

    Other information

    BIOSTATISTICS:
    Attendance is strongly recommended. The course includes at least one ongoing self-assessment test which will simulate the final written exam and cover all topics taught up to that point. The results and feedback are discussed in class.
    The teaching materials (lecture notes, exercises) are available on the Department SharePoint and the Teams channel.
    The lecturer is available for student consultations on the days specified in the course description. He is also available at other times by arrangement via email.
    BIOINFORMATICS FOR THE ANALYSIS OF GENOMES
    PDF copies of the slides from lessons are available on the university Sharepoint, accessible via the teacher's webpage.

    BIOINFORMATICS FOR STUDYING PROTEIN:The student will be provided with learning material available on the website of Department of Environmental, Biological and Pharmaceutical Sciences and Technologies (https://www.distabif.unicampania.it/dipartimento/docenti/) and within the virtual classroom on Microsoft Teams.

    The professors are available to receive the students in the days indicated in their syllabus or after a student request via e-mail.

    Course Syllabus

    BIOSTATISTICS: Introduction to main topics of Biometry. Biological variables: types and characteristics. Individual observations, sample unit, observation. Statistical and biological population. Sample: definition and dimension. Graphical representation of biological data. Frequency distribution curve. Gaussian or "bell-shaped" curve. Asymmetric distribution. Management of not normally distributed data: normalization and standardization. Descriptive statistics in environmental science. Centrality statistics. Mean, median, mode. Dispersion statistics. Standard deviation. Standard error. Coefficient of Variance. Inferential statistics. Significance in statistics. Null and working hypothesis. Parametric and not parametric tests. T-test . One-way and two-way ANOVA. Output of ANOVA. Interpretation of ANOVA results. Correlation and regression of variable. Pearson correlation coefficient. Use of correlation in biology. Theoretical and practical differences between simple and multivariate statistics similarity and dissimilarity indexes – Indexes for presence/absence data: Jaccard, Sorensen – indexes for quantitative data: Euclidean distance. Resemblance matrix. Hierarchical and not-hierarchical classification. Agglomerative methods – Average, single and complete linkage – plotting dendrograms Principal Component Analysis Interpretation of a Biplot.
    BIOINFORMATICS FOR THE ANALYSIS OF GENOMES: Dimension, structure and function of the genome. Molecular mechanisms of genome evolution. Single and multiple sequence alignment. BLAST. Methods for genome analysis: first, second and third-generation sequencing. Sequencing library. Format of genomic data and sequencing quality. Assembly and annotation of the genome. Sequencing of Whole-Exome and Whole-Genome. Calling genomic variants: identification and structural/functional analysis. Sequencing of RNA and annotation of transcribed regions. Identification of differentially expressed genes and functional enrichment. Analysis of the epigenome: 1) Array-based and sequencing methods for studying DNA methylation; 2) Chromatin immunoprecipitation, sequencing and recognition of regulatory elements. Concepts of metagenomics. Major genomic projects and public databases.
    BIOINFORMATICS FOR PROTEIN STUDY: Proteomes and structured/disordered proteins. Factors inducing the structural disoedered. Functional annotation of proteins. Protein-protein and protein-DNA/RNA interactions. Databases: protein sequences (Uniprot), databases for disordered proteins and metalloproteins, functional motifs, protein structures (PDB and PDBe), protein interactions using computational techniques. Bioinformatic methods for protein sequence analysis: descriptors of functional elements in protein sequences, levels of description of protein structures, experimental methods for determining the structure of structured and unstructured proteins. Prediction of the tertiary and quaternary structure of protein complexes using the AlphaFold methodologies. Tools for the analysis and visualization of the structure of protein complexes: CHIMERA, PROCHECK.

    facebook logoinstagram buttonyoutube logotype