elenco    
        corso    

Information Retrieval

Codice: 289AACrediti: 6Semestre: 1Sigla: IR 
 
Settore disciplinare: INF/01 - Informatica

Docente

Paolo Ferragina   ferragin@di.unipi.it  Stanza 295  Tel. 0502212764

Prerequisiti

Corsi di Algoritmi e Reti.

Obiettivi di apprendimento

Studio, progetto e analisi di sistemi software efficienti ed efficaci per l’Information Retrieval nell’ambito di collezioni di documenti testuali (non strutturati), DB-centric (strutturati) o semi-strutturati (p.e. HTML, XML). Questo studio si concentrerà in particolare sui motori di ricerca per il Web.

Conoscenze.

Information Retrieval, motori di ricerca, Text e Network analysis, strutture dati per l'indicizzazione, data compression

Capacità.

capacità di progettare e valutare le prestazioni di un motore di ricerca

Descrizione

Moduli software che costituiscono un moderno motore di ricerca, e analisi delle prestazioni e dei limiti computazionali delle soluzioni algoritmiche correntemente adottate per ciascuno di essi. Fondamenti pratici e teorici per l’organizzazione e l’analisi dei sistemi di IR. Alcune tecniche algoritmiche utilizzate per realizzare IR-tool che operano su grandi quantità di dati

English Description

Study, design and analysis of IR systems which are efficient and effective to process, mine, search, cluster and classify documents, coming from textual, html or XML data collections. In particular, we will:

Programma

Motori di Ricerca: Crawling, Text analysis, Indexing, Ranking, Memorizzazione pagine Web e grafo dei collegamenti, Visualizzazione dei risultati. Altri tipi di dato: XML, DB testuali, Data processing for IR tools, Data sketching, compression, clustering (cenni)

Ore lezione: 48    

Bibliografia

Più alcuni articoli

Modalità di esame

Scritto e orale, con un progetto software facoltativo


Ulteriore pagina web del corso: http://didawiki.cli.di.unipi.it/doku.php/magistraleinformatica/ir/start


home


email