| | | corso | | | | |
Information Retrieval
Codice: | 289AA | Crediti: | 6 | Semestre: | 1 | Sigla: | IR | |
|
Settore disciplinare: | INF/01 - Informatica |
Docente
Paolo Ferragina
Tel. 0502212764Obiettivi di apprendimento
Studio, progetto e analisi di sistemi software efficienti ed efficaci per l’Information Retrieval nell’ambito di collezioni di documenti testuali (non strutturati), DB-centric (strutturati) o semi-strutturati (p.e. HTML, XML). Questo studio si concentrerà in particolare sui motori di ricerca per il Web.
Descrizione
Moduli software che costituiscono un moderno motore di ricerca, e analisi delle prestazioni e dei limiti computazionali delle soluzioni algoritmiche correntemente adottate per ciascuno di essi. Fondamenti pratici e teorici per l’organizzazione e l’analisi dei sistemi di IR. Alcune tecniche algoritmiche utilizzate per realizzare IR-tool che operano su grandi quantità di dati
English Description
Study, design and analysis of efficient and efficacious software systems for Information Retrieval over massive collections of texts (unstructured data), DB-centric (structured) or semi-structured (e.g. HTML, XML). This study will eventually detail the design of modern Web search engines.
Programma
Motori di Ricerca:
Crawling, Text analysis, Indexing, Ranking,
Memorizzazione pagine Web e grafo dei collegamenti,
Visualizzazione dei risultati.
Altri tipi di dato: XML, DB testuali,
Data processing for IR tools,
Data streaming, sketching, compression,
clustering (cenni)
Modalità di esame
Scritto e orale, con eventualmente un progetto software