| | | | corso | | |
Analisi di dati ed estrazione di conoscenza
Codice: | AA365 | Crediti: | 5 | Semestre: | 2 | Sigla: | AEC | |
|
Settore disciplinare: | INF/01 - Informatica |
Docente
Fosca Giannotti
Obiettivi di apprendimento
La grande disponibilità di dati provenienti da database relazionali, dal web o da altre sorgenti motiva lo studio di tecniche di analisi dei dati che permettano una migliore comprensione ed un più facile utilizzo dei risultati nei processi decisionali.
L'obiettivo del corso è quello di fornire un'introduzione ai concetti di base del processo di estrazione di conoscenza, alle principali tecniche di data mining ed ai relativi algoritmi.
Particolare enfasi è dedicata agli aspetti metodologici presentati mediante alcune classi di applicazioni paradigmatiche quali il Basket Market Analysis, la segmentazione di mercato, il rilevamento di frodi e il Web mining. Infine il corso introduce gli aspetti di privacy ed etici inerenti all’utilizzo di tecniche inferenza sui dati e dei quali l’analista deve essere a conoscenza.
Descrizione
Il corso consiste di
- una parte preliminare dove si introducono i concetti essenziali del processo di estrazione della conoscenza
- una parte basica dove si introducono le principali tecniche di datamining (regole associative, classificazione e clustering). Di queste tecniche se ne studierà gli aspetti formali, implementativi
- una parte più metodologica dove si visiteranno alcune casi di studio nell’ambito del marketing e del supporto alla gestione clienti.
- una parte avanzata dove si rivisiteranno alcune tecniche applicate a strutture dati particolari quali dati semistrutturati quali provenienti da web e dove si indroducono gli aspetti di privacy ed etici inerenti all’utilizzo di tecniche inferenza sui dati
Note:
La prima parte del corso sarà effettuata in congiunzione con il corso di “Tecniche di Data Mining” tenuto dal prof. Pedreschi nell’ambito del corso di laurea in Informatica e Tecnologie Informatiche
Programma
- Motivazioni (4 ore)
- Le necessità tecnici e sociali per l’analisi dei dai e l’estrazione della conoscenza
- Il processo di knowledge discovery
- Panoramica sulle tecniche (6 ore)
- Regole Associative
- Classificazione mediante alberi di decisione
- Classificatori Bayesiani
- Il processo di konwledge Discovery (4 ore +2 esercitazione)
- Esempi di processo di estrazione: Il caso di Rilevamento di frodi; Il caso di Business intelligence l’Oreal
- Formalizzazione del processo di Knowledege Discovery
- Preparazione dei dati
- Algoritmi di Base (6 ore)
- Pattern Frequenti con Alg. A-Priori
- Classificatori bayesiani
- Alberi di decisione con C4.5
- Casi di studio (8 esercitazione)
- Principali strumenti commerciali
- Caso studio 1: Customer Segmentation
- Caso studio 2: Geo Marketing
- Caso studio 3: Basket Market Analysis
- Temi avanzati (6 ore+ 2 esercitazione )
- Web Mining
- Aspetti inerenti la Privacy
- Seminari da definire
Tutor: di Laboratorio: Mirco Nanni – ISTI-CNR KDD Lab. http://www-kdd.isti.cnr.it/
Bibliografia
- Jiawei Han, Micheline Kamber.
Data Mining: Concepts and Techniques,
Morgan Kaufmann Publishers, 2000
- U. Fayyad, G. Piatetsky-Shapiro, P. Smyth, R. Uthurusamy (editors).
Advances in Knowledge discovery and data mining.
MIT Press, 1996.
- T. Mitchell.
Machine learning.
Mc-Graw Hill, 1997.
- David J. Hand, Heikki Mannila, Padhraic Smyth, Principles of Data Mining.
MIT Press, 2001.
- S. Chakrabarti, Mining the Web: Discovering Knowledge from Hypertext Data.
Morgan Kaufmann, ISBN 1-55860-754-4, 2002
- Barry Linoff Data Mining Techniques for Marketing Sales and Customer Support, .
John Wiles & Sons, 2002