Rosanna VERDE
Insegnamento di DATA MINING
Corso di laurea magistrale in SCIENZE E TECNICHE DELLE AMMINISTRAZIONI PUBBLICHE
SSD: SECS-S/01
CFU: 8,00
ORE PER UNITÀ DIDATTICA: 48,00
Periodo di Erogazione: Secondo Semestre
Italiano
Lingua di insegnamento | ITALIANO |
Contenuti | Introduzione: Il Data Mining versus Knowledge Discovery in Data Bases Analisi esplorativa dei dati Modelli statistici per il data mining: Regressione e Classificazione Metodi per il data mining: Regole di Associazione Misure di dissimilarità e distanze Metodi di Clustering divisivo (k-means) e gerarchico (criterio di Ward) Analisi in Componenti Principali Alberi di decisone (segmentazione binaria – alberi di classificazione e di regressione) Software per il Data Mining: R |
Testi di riferimento | In alternativa: S. ZANI – A. CERIOLI, Analisi dei dati e Data Mining per le decisioni aziendali, Giuffrè Editore, Milano, 2007 |
Obiettivi formativi | Conoscenza e capacità di comprensione (knowledge and understanding). |
Prerequisiti | Conoscenze di base di statistica descrittiva e inferenziale. |
Metodologie didattiche | Lezioni frontali con l’utilizzo di slides e materiale didattico fornito dal docente Esercitazioni È richiesto lo studio personale con l’approfondimento della materia sui testi consigliati |
Metodi di valutazione | Tesina scritta riportante gli aspetti metodologici e i risultati commentati delle elaborazioni di dati estratti da un data base pubblico, secondo le tecniche di Data Mining trattate nel corso e verifica finale attraverso una prova orale |
Programma del corso | CONTENUTI |
English
Teaching language | Italian |
Contents | Introduction: Data Mining versus Knowledge Discovery in Data Bases Exploratory data analysis Statistical models for data mining: Regression and Classification Data mining methods: Association Rules Measures of dissimilarity and distances Clustering methods: divisive (k-means) and hierarchical (Ward criterion) Principal Component Analysis Decision trees (binary segmentation - classification and regression trees) Data Mining Software: R – XLSTAT |
Textbook and course materials | as alternative: S. ZANI – A. CERIOLI, Analisi dei dati e Data Mining per le decisioni aziendali, Giuffrè Editore, Milano, 2007 |
Course objectives | Knowledge and understanding. |
Prerequisites | Basic knowledge of descriptive and inferential statistics. |
Teaching methods | Personal study is required on the recommended didactic books Slides for the course will be provided Laboratory training |
Evaluation methods | Report on the methodological aspects and results of data process, according to the techniques of Data Mining dealt with in the course and Final examination by oral test |
Course Syllabus | Introduction: Data Mining versus Knowledge Discovery in Data Bases Exploratory data analysis |