elenco   
        corso   

Laboratorio di sistemi informativi economico/aziendali

Codice: ZY116Crediti: 6Semestre: 2Sigla: LSA 
 
Settore disciplinare: INF/01 - Informatica

Docente

Salvatore Ruggieri   ruggieri@di.unipi.it  Stanza 321  Tel. 0502212782

Prerequisiti

La frequenza, anche contemporanea, ad almeno uno tra i due corsi AA352 “Basi di dati di supporto alle decisioni” e AA570 “Data mining” è raccomandata.

Obiettivi di apprendimento

Il corso presenta tecnologie e sistemi per l’accesso ai dati, per la costruzione ed analisi di datawarehouse e per l’estrazione di conoscenza. L’accento è sull’uso di strumenti e sull’analisi di problemi applicativi, utilizzando esempi e casi studio significativi. Il corso si prospetta anche come preparatorio allo svolgimento di tesi di laurea specialistica.
Conoscenze. Lo studente acquisirà conoscenze sulle principali tecnologie di accesso ai dati, di datawarehousing e di data mining, con particolare riferimento ai prodotti software esistenti ed alla loro applicabilità al supporto delle decisioni.
Capacità. Lo studente saprà utilizzare strumenti software per progettare datawarehouse, per popolarli con dati da sorgenti esterne, per definire cubi OLAP e per navigarli alla ricerca di informazioni di supporto alle decisioni di business. Saprà anche utilizzare strumenti di data mining per l’estrazione di modelli, con particolare riferimento a modelli predittivi per il marketing ed il CRM.
Comportamenti. Lo studente saprà essere indipendente nella valutazione delle tecnologie e degli strumenti maggiormente adeguati alle caratteristiche e delle necessità delle aziende in cui saranno utilizzati. Sarà inoltre cosciente delle problematiche inerenti il trattamento di dati sensibili in un datawarehouse o nella analisi di dati con tecniche di data mining.

Descrizione

Il corso presenta tecnologie e sistemi per l’accesso ai dati, per la costruzione ed analisi di datawarehouse e per  l’estrazione di conoscenza. L’accento è sull’uso di strumenti e sull’analisi di problemi applicativi, utilizzando esempi e casi studio significativi. Il corso si prospetta anche come preparatorio allo svolgimento di tesi di laurea specialistica.

English Description

Technologies and systems are presented for data access, datawarehoue implementation and analysis, and for knowledge discovery in databases. The focus will be on tools and on applications to real problems.

Indicazioni metodologiche

Per conseguire gli obiettivi indicati, sarà necessario:

Programma

Introduzione

Introduzione, obiettivi, strumenti.

Accesso ai dati

Accesso ai dati su file: localizzazione e rappresentazione. Formati CSV, FLV, ARFF, XML, binari e compressi. API Java. Panoramica su standard di accesso ai dati su RDBMS (ODBC, JDBC, OLE DB, ADO) e API JDBC. Linked servers. Strumenti: Java, SQL Server 2005. Esercitazioni in gruppo: accesso a dati su file in Java, interscambio di dati mediante JDBC.

Il processo Extract Transform and Load (ETL)

Raccolta, selezione, pulizia, trasformazione, normalizzazione dei dati. Strumenti: SQL Server 2005 Integration Services. Esercitazioni in gruppo: case study su ETL.

Data warehousing e OLAP

Struttura (tabella dei fatti, dimensioni, gerarchie) di un datawarehouse, pubblicazione su web e navigazione da client 2D e 3D, linguaggio di interrogazione, API software. Strumenti: SQL Server 2005 Analysis Services, Data Analyser, DB Miner. Esercitazioni in gruppo: case study su datawarehousing e OLAP.

Ambienti per l'estrazione di conoscenza

Il processo CRISP, metafore visuali e programmative, modelli di mining, casi di studio (retail, insurance, web mining). Strumenti: Weka. Esercitazioni in gruppo: case study su analisi di data mining: costruzione dei modelli, valutazione, focusing dei parametri.

  Ore laboratorio: 48  

Bibliografia

Testi. Dispense e fotocopie distribuite dal docente.

Software. Il software citato ottenuto mediante licenza accademica, sia installato sui PC del laboratorio che fornito in copia con licenza accademica agli studenti.

Modalità di esame

La valutazione avverrà mediante una relazione ed un seminario svolti da gruppi di 1-2 studenti su argomenti che potranno variare da comparazioni di strumenti non presentati durante il corso (Oracle Warehouse, Business Objects, Microstrategy, Xelopes) all’analisi di altri casi di studio su integrazione, OLAP o mining.

Ulteriore pagina web del corso: http://www.di.unipi.it/~ruggieri/didattica/lsa


home


email