| | | corso | | | |
Laboratorio di sistemi informativi economico/aziendali
Codice: | ZY116 | Crediti: | 6 | Semestre: | 2 | Sigla: | LSA | |
|
Settore disciplinare: | INF/01 - Informatica |
Docente
Salvatore Ruggieri
Tel. 0502212782Prerequisiti
La frequenza, anche contemporanea, ad almeno uno tra i due corsi AA352 “Basi di dati di supporto alle decisioni” e AA570 “Data mining” è raccomandata.
Obiettivi di apprendimento
Il corso presenta tecnologie e sistemi per l’accesso ai dati, per la costruzione ed analisi di datawarehouse e per l’estrazione di conoscenza. L’accento è sull’uso di strumenti e sull’analisi di problemi applicativi, utilizzando esempi e casi studio significativi. Il corso si prospetta anche come preparatorio allo svolgimento di tesi di laurea specialistica.
Conoscenze. Lo studente acquisirà conoscenze sulle principali tecnologie di accesso ai dati, di datawarehousing e di data mining, con particolare riferimento ai prodotti software esistenti ed alla loro applicabilità al supporto delle decisioni.
Capacità. Lo studente saprà utilizzare strumenti software per progettare datawarehouse, per popolarli con dati da sorgenti esterne, per definire cubi OLAP e per navigarli alla ricerca di informazioni di supporto alle decisioni di business. Saprà anche utilizzare strumenti di data mining per l’estrazione di modelli, con particolare riferimento a modelli predittivi per il marketing ed il CRM.
Comportamenti. Lo studente saprà essere indipendente nella valutazione delle tecnologie e degli strumenti maggiormente adeguati alle caratteristiche e delle necessità delle aziende in cui saranno utilizzati. Sarà inoltre cosciente delle problematiche inerenti il trattamento di dati sensibili in un datawarehouse o nella analisi di dati con tecniche di data mining.
Descrizione
Il corso presenta tecnologie e sistemi per l’accesso ai dati, per la costruzione ed analisi di datawarehouse e per l’estrazione di conoscenza. L’accento è sull’uso di strumenti e sull’analisi di problemi applicativi, utilizzando esempi e casi studio significativi. Il corso si prospetta anche come preparatorio allo svolgimento di tesi di laurea specialistica.
English Description
Technologies and systems are presented for data access, datawarehoue implementation and analysis, and for knowledge discovery in databases. The focus will be on tools and on applications to real problems.
Indicazioni metodologiche
Per conseguire gli obiettivi
indicati, sarà necessario:
-
organizzare il processo di
apprendimento in moduli flessibili, posti in sequenza logica;
-
presentare in modo approfondito
una specifica tecnologia tra le varie concorrenti sul mercato, e le altre solo
"per differenza";
-
mantenere una posizione
indipendente e critica verso i vari software vendors presenti sul mercato, al
fine di formare una capacità critica nello studente;
-
coordinarsi con i docenti dei
corsi indicati nei prerequisiti e dei corsi paralleli del semestre;
-
partire dai problemi di business
per ritrovare le necessarie scelte tecnologie a supporto della loro soluzione;
-
proporre l'analisi di casi di
studio tratti da esperienze reali riportate in letteratura o derivanti da
ricerche del docente;
-
separare gli aspetti e le scelte
puramente tecnologiche da quelle funzionali alla soluzione di un problema di
analisi.
Programma
Introduzione
Introduzione, obiettivi, strumenti.
Accesso ai dati
Accesso ai dati su file: localizzazione e rappresentazione. Formati CSV, FLV, ARFF, XML, binari e compressi. API Java. Panoramica su standard di accesso ai dati su RDBMS (ODBC, JDBC, OLE DB, ADO) e API JDBC. Linked servers. Strumenti: Java, SQL Server 2005. Esercitazioni in gruppo: accesso a dati su file in Java, interscambio di dati mediante JDBC.
Il processo Extract Transform and Load (ETL)
Raccolta, selezione, pulizia, trasformazione, normalizzazione dei dati. Strumenti: SQL Server 2005 Integration Services. Esercitazioni in gruppo: case study su ETL.
Data warehousing e OLAP
Struttura (tabella dei fatti, dimensioni, gerarchie) di un datawarehouse, pubblicazione su web e navigazione da client 2D e 3D, linguaggio di interrogazione, API software. Strumenti: SQL Server 2005 Analysis Services, Data Analyser, DB Miner. Esercitazioni in gruppo: case study su datawarehousing e OLAP.
Ambienti per l'estrazione di conoscenza
Il processo CRISP, metafore visuali e programmative, modelli di mining, casi di studio (retail, insurance, web mining). Strumenti: Weka. Esercitazioni in gruppo: case study su analisi di data mining: costruzione dei modelli, valutazione, focusing dei parametri.
Bibliografia
Testi. Dispense e fotocopie distribuite dal docente.
Software. Il software citato ottenuto mediante licenza accademica, sia installato sui PC del laboratorio che fornito in copia con licenza accademica agli studenti.
Modalità di esame
La valutazione avverrà mediante una relazione ed un seminario svolti da gruppi di 1-2 studenti su argomenti che potranno variare da comparazioni di strumenti non presentati durante il corso (Oracle Warehouse, Business Objects, Microstrategy, Xelopes) all’analisi di altri casi di studio su integrazione, OLAP o mining.