![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
|||||
|
|||||
I documenti sono stati codificati attraverso un linguaggio di nuova generazione, l'XML (eXstensible Markup Language) le cui potenzialità risiedono essenzialmente nel tipo di codifica dichiarativa o descrittiva. In particolare, le autrici del progetto sono giunte alla definizione formale di uno schema di decodifica basato sulla sintassi SGML (Standard Generalized Markup Language, ISO 8879) che può essere utilizzato per codificare una vasta gamma di caratteristiche testuali riscontrate negli atti e rilevanti per diverse aree di ricerca (diplomatica, storica, analisi linguistica, etc.). Il progetto di codifica mira a ottimizzare l'utilizzabilità delle trascrizioni elettroniche e facilitare il loro scambio fra studiosi che utilizzano diverse piattaforme informatiche e a creare una banca dati testuale codificata disponibile all'utenza. Il motore di ricerca implementato è adatto a gestire il volume di informazioni che contengono i testi codificati in questa specifica edizione elettronica; ha essenzialmente due pregi: recupera tutti i dati di tipo testuale e le informazioni di natura strutturale. Dal punto di vista tecnico si compone di tre funzionalità principali: quella che gestisce la ricerca testuale full-text, quella che gestisce le ricerche sulla struttura dei documenti, e infine la consultazione di una base di dati, nel caso di ricerche mirate al recupero di nomi di luogo o di persona. La ricerca full-text garantisce la stessa efficienza sia per ricerche di parole, che per porzioni di parole, che siano prefissi, suffissi o parti di essi. Una sua potenzialità risiede nella possibilità di indicizzare assieme al testo puro anche ogni informazione sulla struttura del documento SGML. L'impiego delle strutture dati che realizzano il motore di ricerca, testuale e strutturale, ha come effetto voluto quello di poter rispondere ad ogni richiesta su testo o struttura dei documenti codificati. |