elenco    
        corso    

Information Retrieval

Codice: 289AACrediti: 6Semestre: 1Sigla: IR 
 
Settore disciplinare: INF/01 - Informatica

Docente

Paolo Ferragina   ferragin@di.unipi.it  Stanza 295  Tel. 0502212764

Obiettivi di apprendimento

Studio, progetto e analisi di sistemi software efficienti ed efficaci per l’Information Retrieval nell’ambito di collezioni di documenti testuali (non strutturati), DB-centric (strutturati) o semi-strutturati (p.e. HTML, XML). Questo studio si concentrerà in particolare sui motori di ricerca per il Web.

Descrizione

Moduli software che costituiscono un moderno motore di ricerca, e analisi delle prestazioni e dei limiti computazionali delle soluzioni algoritmiche correntemente adottate per ciascuno di essi. Fondamenti pratici e teorici per l’organizzazione e l’analisi dei sistemi di IR. Alcune tecniche algoritmiche utilizzate per realizzare IR-tool che operano su grandi quantità di dati

English Description

Study, design and analysis of efficient and efficacious software systems for Information Retrieval over massive collections of texts  (unstructured data), DB-centric (structured) or semi-structured (e.g. HTML, XML). This study will eventually detail the design of modern Web search engines.

Programma

Motori di Ricerca: Crawling, Text analysis, Indexing, Ranking, Memorizzazione pagine Web e grafo dei collegamenti, Visualizzazione dei risultati. Altri tipi di dato: XML, DB testuali, Data processing for IR tools, Data streaming, sketching, compression, clustering (cenni)
Ore lezione: 48    

Modalità di esame

Scritto e orale, con eventualmente un progetto software

Ulteriore pagina web del corso: http://www.cli.di.unipi.it/doku/doku.php/magistraleinformatica/ir/start


home


email