elenco   
        corso   

Tecniche di "Data Mining"

Codice: AA270Crediti: 6Semestre: 2Sigla: TDM 
 
Settore disciplinare: INF/01 - Informatica

Docente

Dino Pedreschi   pedre@di.unipi.it  Stanza 318  Tel. 0502212752

Obiettivi di apprendimento

La grande disponibilità di dati provenienti da database relazionali, dal web o da altre sorgenti motiva lo studio di tecniche di analisi dei dati che permettano una migliore comprensione ed un più facile utilizzo dei risultati nei processi decisionali.
L'obiettivo del corso è quello di fornire un'introduzione ai concetti di base del processo di estrazione di conoscenza, alle principali tecniche di data mining ed ai relativi algoritmi.
Particolare enfasi è dedicata agli aspetti metodologici presentati mediante alcune classi di applicazioni paradigmatiche quali il Basket Market Analysis, la segmentazione di mercato ed il rilevamento di frodi.

Descrizione

Il corso consiste di
  1. una parte preliminare dove si introducono alcuni concetti essenziali di DataWarehousing e di modalita' di aggregazione multidimensionale (OLAP);
  2. una parte basica dove si introducono le principali tecniche di datamining (regole associative, classificazione e clustering). Di queste tecniche se ne studierà gli aspetti formali, implementativi e l'utilizzo come strumento di ragionamento induttivo in casi concreti;
  3. una parte avanzata dove si rivisiteranno alcune tecniche applicate a strutture dati particolari quali dati spaziali, multimediali, testuali e semistrutturati quali provenienti da web

Programma

  1. Motivazioni (2 ore)
    • Le necessità tecnici e sociali per l'analisi dei dai e l' estrazione della conoscenza
    • Il processo di knowledge discovery
  2. OLAP (3 ore + 3 esercitazione)
    • Nozioni basiche di Data Warehousing
    • Nozioni basiche di Data Cube
  3. Regole Associative (6 ore +4 esercitazione)
    • Regole intra-attributo, inter-attributo
    • Calcolo efficiente di regole d'associazione: algoritmo Apriori e varianti
    • Estensioni del concetto di regola d'associazione: tassonomie, regole quantitative, regole predittive.
    • Regole associative e fattore Tempo: RdA Cicliche e Calendriche
    • Pattern Sequenziali e Serie Temporali
    • Basket Market Analysis utilizzando RdA
  4. Classificazione con alberi di decisione (6 ore +4 esercitazione)
    • Principali tecniche di classificazione
    • Classificatori bayesiani
    • Alberi di decisione
    • Rassegna di altri metodi
    • Applicazione al rilevamento di frodi
  5. Clustering (2 ore +2 esercitazione)
    • Principali tecniche di clustering
    • Applicazione al Customer segmentation
  6. Temi avanzati (6 ore +2 esercitazione)
    • Algoritmi scalabili per regole associative e pattern sequenziali
    • Spatial e multimedia datamining
    • Text mining e Web mining
     

Bibliografia

Modalità di esame

Scritto e orale

Ulteriore pagina web del corso: http://www-kdd.cnuce.cnr.it/bdm.html


home


email