elenco  
         corso  

Analisi di dati ed estrazione di conoscenza

Codice: AA365Crediti: 5Semestre: 2Sigla: AEC 
 
Settore disciplinare: INF/01 - Informatica

Docente

Fosca Giannotti   f.giannotti@isti.cnr.it  Home Page di Fosca Giannotti

Obiettivi di apprendimento

La grande disponibilità di dati provenienti da database relazionali, dal web o da altre sorgenti motiva lo studio di tecniche di analisi dei dati che permettano una migliore comprensione ed un più facile utilizzo dei risultati nei processi decisionali.
L'obiettivo del corso è quello di fornire un'introduzione ai concetti di base del processo di estrazione di conoscenza, alle principali tecniche di data mining ed ai relativi algoritmi.
Particolare enfasi è dedicata agli aspetti metodologici presentati mediante alcune classi di applicazioni paradigmatiche quali il Basket Market Analysis, la segmentazione di mercato, il rilevamento di frodi e il Web mining. Infine il corso introduce gli aspetti di privacy ed etici inerenti all’utilizzo di tecniche inferenza sui dati e dei quali l’analista deve essere a conoscenza.

Descrizione

Il corso consiste di
  1. una parte preliminare dove si introducono i concetti essenziali del processo di estrazione della conoscenza
  2. una parte basica dove si introducono le principali tecniche di datamining (regole associative, classificazione e clustering). Di queste tecniche se ne studierà gli aspetti formali, implementativi
  3. una parte più metodologica dove si visiteranno alcune casi di studio nell’ambito del marketing e del supporto alla gestione clienti.
  4. una parte avanzata dove si rivisiteranno alcune tecniche applicate a strutture dati particolari quali dati semistrutturati quali provenienti da web e dove si indroducono gli aspetti di privacy ed etici inerenti all’utilizzo di tecniche inferenza sui dati
Note:
La prima parte del corso sarà effettuata in congiunzione con il corso di “Tecniche di Data Mining” tenuto dal prof. Pedreschi nell’ambito del corso di laurea in Informatica e Tecnologie Informatiche

Programma

  1. Motivazioni (4 ore)
    • Le necessità tecnici e sociali per l’analisi dei dai e l’estrazione della conoscenza
    • Il processo di knowledge discovery
  2. Panoramica sulle tecniche (6 ore)
    • Regole Associative
    • Classificazione mediante alberi di decisione
    • Classificatori Bayesiani
  3. Il processo di konwledge Discovery (4 ore +2 esercitazione)
    • Esempi di processo di estrazione: Il caso di Rilevamento di frodi; Il caso di Business intelligence l’Oreal
    • Formalizzazione del processo di Knowledege Discovery
    • Preparazione dei dati
  4. Algoritmi di Base (6 ore)
    • Pattern Frequenti con Alg. A-Priori
    • Classificatori bayesiani
    • Alberi di decisione con C4.5
  5. Casi di studio (8 esercitazione)
    • Principali strumenti commerciali
    • Caso studio 1: Customer Segmentation
    • Caso studio 2: Geo Marketing
    • Caso studio 3: Basket Market Analysis
  6. Temi avanzati (6 ore+ 2 esercitazione )
    • Web Mining
    • Aspetti inerenti la Privacy
    • Seminari da definire
  7. Tutor: di Laboratorio: Mirco Nanni – ISTI-CNR KDD Lab. http://www-kdd.isti.cnr.it/
     

Bibliografia


Ulteriore pagina web del corso: http://www-kdd.isti.cnr.it/


home


email