Rosanna VERDE
Insegnamento di STATISTICAL AND MACHINE LEARNING METHODS FOR INFORMATION TECHNOLOGIES
Corso di laurea magistrale in DATA SCIENCE
SSD: SECS-S/01
CFU: 6,00
ORE PER UNITÀ DIDATTICA: 48,00
Periodo di Erogazione: Secondo Semestre
Italiano
Lingua di insegnamento | Inglese |
Contenuti | I principali temi del corso consistono in metodi statistici e di apprendimento automatico per la previsione dell'evoluzione di fenomeni sulla base di osservazioni, anche di grandi dimensioni prodotta dalle più moderne tecnologie |
Testi di riferimento | Hastie, T.; Tibshirani, R.; Friedman, J. The Elements of Statistical Learning, 2nd ed.; Springer: Berlin, Germany, |
Obiettivi formativi | Gli studenti acquisiranno competenze di tipo metodologico e applicativo e saranno in grado di applicare le conoscenze acquisite in studi su dati ambientali, ad esempio nel monitoraggio dell’inquinamento dell’aria o delle acque, nel telerilevamento per l’individuazione delle diverse tipologie di aree (urbane, agricole o industriali), nella gestione di dati di flusso, ad esempio, consumi energetici per la previsione della domanda. Inoltre, potranno anche applicare le proprie conoscenze su dati biomedici, ad esempio le tecniche di analisi di dati funzionali sull’analisi di ECG per una classificazione dei pazienti se affetti da patologia cardiaca o sani. L’obiettivo è quindi di fornire una preparazione coerente con gli sbocchi occupazionali di un data scientist in enti o imprese che operano in ambito ambientale o anche come analisti di dati biomedici in centri di cura (ospedali, laboratori bio-medicali) o in centri studio e di ricerca. |
Prerequisiti | Conoscenze di statistica di base e inferenziale e di tecniche di Data Mining. Conoscenze di base di software Python e R. |
Metodologie didattiche | Il corso è organizzato in lezioni frontali per la presentazione delle tecniche di analisi statistica dei dati e di machine learning. Particolare attenzione è rivolta agli aspetti applicativi specialmente in ambito ambientale. |
Metodi di valutazione | La verifica dell'apprendimento avviene attraverso una prova intercorso, una tesina che comprende aspetti metodologici e applicazioni delle tecniche studiate durante il corso su dati ambientali, di telerilevamento o bio-medici. |
Programma del corso | Il corso intende fornire conoscenze di metodi statistici e di apprendimento automatico per la previsione dell'evoluzione di fenomeni sulla base di osservazioni. L'enorme mole di dati prodotta dalle più moderne tecnologie ha permesso di estendere i modelli statistici e le tecniche di machine learning, nonché la loro interazione, allo studio di ambiti ambientali, socio-economici, bio-medicali. |
English
Teaching language | English |
Contents | The main topics of the course consist of statistical methods and machine learning for the prediction of the evolution of phenomena on the basis of observations, even large ones produced by the most modern technologies |
Textbook and course materials | Hastie, T.; Tibshirani, R.; Friedman, J. The Elements of Statistical Learning, 2nd ed.; Springer: Berlin, Germany, |
Course objectives | Students will acquire methodological and applicative skills and will be able to apply the knowledge acquired in studies on environmental data, for example in monitoring air or water pollution, in remote sensing for the identification of different types of areas ( urban, agricultural or industrial), in the management of flow data, for example, energy consumption for forecasting demand. In addition, they will also be able to apply their knowledge on biomedical data, for example functional data analysis techniques on ECG analysis for classifying patients with heart disease or healthy. The objective is therefore to provide a preparation consistent with the employment opportunities of a data scientist in organizations or companies operating in the environmental field or even as biomedical data analysts in treatment centers (hospitals, bio-medical laboratories) or in study centers. and research. |
Prerequisites | Knowledge of basic and inferential statistics and Data Mining techniques. Basic knowledge of Python and R software. |
Teaching methods | The course is organized in lectures for the presentation of statistical data analysis and machine learning techniques. Particular attention is paid to the application aspects, especially in the environmental field. |
Evaluation methods | Learning is verified through a middle term test, a report that includes methodological aspects and applications of the techniques studied during the course on environmental, remote sensing or bio-medical data. |
Course Syllabus | Statistics and machine learning methods concern the design of algorithms that can predict the evolution of phenomena based on observations. The huge amount of data produced by the most modern technologies has allowed to extend statistical models and machine learning techniques, as well as their interaction, to the study of environmental, socio-economics, bio-medical fields. |