elenco    
        corso    

Information Retrieval

Codice: 289AACrediti: 6Semestre: 1Sigla: IR 
 
Settore disciplinare: INF/01 - Informatica

Docente

Paolo Ferragina   ferragin@di.unipi.it  Stanza 295  Tel. 0502212764

Obiettivi di apprendimento

Studio, progetto e analisi di sistemi software efficienti ed efficaci per l’Information Retrieval nell’ambito di collezioni di documenti testuali (non strutturati), DB-centric (strutturati) o semi-strutturati (p.e. HTML, XML). Questo studio si concentrerà in particolare sui motori di ricerca per il Web, descrivendo in dettaglio tutti i loro componenti software principali e analizzando le prestazioni e i limiti computazionali delle soluzioni algoritmiche correntemente adottate per ciascuno di essi. Si introdurranno inoltre i fondamenti pratici e teorici per l’organizzazione e l’analisi dei sistemi di IR. Infine si analizzeranno alcune tecniche algoritmiche frequentemente utilizzate per la realizzazione di IR-tool che operano su grandi quantità di dati.

Programma

Motori di Ricerca Crawling, Text analysis, Indexing, Ranking Memorizzazione pagine Web e grafo dei collegamenti Visualizzazione dei risultati Altri tipi di dato: XML, DB testuali Data processing for IR tools Data streaming, sketching, compression Data clustering (cenni)
Ore lezione: 48    

Modalità di esame

Orale e un progetto software

Ulteriore pagina web del corso: http://www.cli.di.unipi.it/doku/doku.php/magistraleinformatica/ir/start


home


email