elenco    
        corso    

Laboratorio di business intelligence

(Corso di Laurea Magistrale in Informatica per l'Economia e per l'Azienda (Business Informatics))

Docente

Salvatore Ruggieri   ruggieri@di.unipi.it  Stanza 321  Tel. 0502212782

Ultima versione disponibile: programma da confermare per l’a.a. 2012/2013

Prerequisiti

Le nozioni teoriche necessarie ai contenuti del laboratorio sono presentate nei corsi del primo semestre 426AA modulo “Basi di dati di supporto alle decisioni” e 420AA  “Data mining I”, e nel corso del secondo semestre “Data Mining II”. Durante il corso verranno indicati i riferimenti (capitolo di libri o dispense) i cui contenuti sono assunti per le lezioni successive. Non sarà possibile ripresentare tali contenuti durante il corso stesso.

Obiettivi di apprendimento

Il modulo presenta tecnologie e sistemi per l’accesso ai dati, per la costruzione ed analisi di datawarehouse, per la reportistica e per  l’estrazione di conoscenza da basi di dati. L’accento è sull’uso di strumenti e sull’analisi di problemi applicativi usando esempi e casi di studio. Il corso si prospetta preparatorio allo svolgimento della tesi di laurea magistrale.

Conoscenze.

Lo studente acquisirà conoscenze sulle principali tecnologie di accesso ai dati, di datawarehousing e OLAP, ed di data mining, con particolare riferimento ai sistemi software ed alla loro applicazione al supporto delle decisioni.

Capacità.

Lo studente saprà utilizzare strumenti software per progettare datawarehouse, per popolarli con dati da sorgenti esterne, per definire cubi OLAP e per navigarli alla ricerca di informazioni di supporto alle decisioni di business. Saprà anche utilizzare strumenti di data mining per l’estrazione di modelli, con particolare riferimento a modelli predittivi per il marketing ed il CRM.

Comportamenti.

Lo studente saprà essere indipendente nella valutazione delle tecnologie e degli strumenti maggiormente adeguati alle caratteristiche e delle necessità delle aziende in cui saranno utilizzati.

English Description

This course presents technologies and systems for data access, for building and analysing datawarehouses, for reporting and knowledge discovery from databases. The focus is on tools, systems and problem solving methodologies, with real case studies. Theoretical notions are taught in the courses of the first semester 426AA “Basi di dati di supporto alle decisioni”, 420AA “Data mining I”, and in the course of the second semester “Data Mining II”.

Programma

Introduzione
Introduzione, obiettivi, strumenti.

Accesso e qualità dei dati
Accesso ai dati su file: localizzazione e rappresentazione. Formati CSV, FLV, ARFF, XML, binari e compressi. API Java. Panoramica su standard di accesso ai dati su RDBMS (ODBC, JDBC, OLE DB, ADO) e API JDBC. Linked servers. Analisi della qualità dei dati. Strumenti: Java, SQL Server 2008, R. Esercitazioni in gruppo.

Il processo Extract Transform and Load (ETL)
Raccolta, selezione, pulizia, trasformazione, normalizzazione dei dati. Strumenti: SQL Server 2008 Integration Services. Esercitazioni in gruppo.

Data warehousing e OLAP
Struttura (tabella dei fatti, dimensioni, gerarchie) di un datawarehouse, pubblicazione su web e navigazione da client 2D e 3D, linguaggio di interrogazione, API software. Strumenti: SQL Server 2008 Analysis Services, Excel Power Pivot. Esercitazioni in gruppo.

Ambienti per l’estrazione di conoscenza
Il processo CRISP, metafore visuali e programmative, modelli di mining per classificazione e itemset frequenti, casi di studio (retail, insurance, web mining). Strumenti: Weka. Esercitazioni in gruppo.

  Ore laboratorio: 48  

Bibliografia

Manuali fotocopie distribuite dal docente.  Il software citato ottenuto mediante licenza accademica, sia installato sui PC del laboratorio che fornito in copia con licenza accademica agli studenti.


Ulteriore pagina web del corso: http://www.di.unipi.it/~ruggieri/didattica/apa/


home


email