| | | corso | | | | |
Information Retrieval
Codice: | 289AA | Crediti: | 6 | Semestre: | 1 | Sigla: | IR | |
|
Settore disciplinare: | INF/01 - Informatica |
Docente
Paolo Ferragina
Tel. 0502212764Obiettivi di apprendimento
Studio, progetto e analisi di sistemi software efficienti ed efficaci per l’Information Retrieval nell’ambito di collezioni di documenti testuali (non strutturati), DB-centric (strutturati) o semi-strutturati (p.e. HTML, XML). Questo studio si concentrerà in particolare sui motori di ricerca per il Web, descrivendo in dettaglio tutti i loro componenti software principali e analizzando le prestazioni e i limiti computazionali delle soluzioni algoritmiche correntemente adottate per ciascuno di essi. Si introdurranno inoltre i fondamenti pratici e teorici per l’organizzazione e l’analisi dei sistemi di IR. Infine si analizzeranno alcune tecniche algoritmiche frequentemente utilizzate per la realizzazione di IR-tool che operano su grandi quantità di dati.
Programma
Motori di Ricerca
Crawling, Text analysis, Indexing, Ranking
Memorizzazione pagine Web e grafo dei collegamenti
Visualizzazione dei risultati
Altri tipi di dato: XML, DB testuali
Data processing for IR tools
Data streaming, sketching, compression
Data clustering (cenni)
Modalità di esame
Orale e un progetto software