Iniziative per la codifica digitale di testi antichi

a cura di Gian Pietro Basello

Innanzitutto ci sono due pagine di collegamenti commentati molto utili:

Di seguito replico per comodità alcuni dei collegamenti elencati nelle succitate (e più esaurienti) pagine. Da un punto di vista di implementazione tecnica, la maggior parte di questi progetti si basa sull'eXtensible Markup Language (XML), un metalinguaggio che permette la definizione di specifici linguaggi di marcatura testuale all'interno di un ambiente di sviluppo flessibile in cui i dati e la loro rappresentazione sono mantenuti ben distinti. Le specifiche di questo standard sono pubblicate dal World Wide Web Consortium [CDrom]. Per farsi un'idea più approfondita e concreta di come è strutturato XML rimando a A Gentle Introduction to XML [CDrom].

I dati sono inseriti in una struttura gerarchica secondo uno schema predefinito (elaborato tramite Document Type Definition o, come si preferisce oggi, XML Schema [CDrom]) e più o meno dettagliato a seconda delle esigenze. Ogni singolo frammento di dati viene immagazzinato in un elemento. Ogni elemento può avere degli attributi contenenti informazioni addizionali (metadati) ad esso correlate o contenere altri elementi, così da formare un albero di dati ramificato.

Una volta avvenuta la codifica dei dati, è possibile avere più rappresentazioni di essi. La stessa informazione può essere reperita e visualizzata in modi diversi. Ad esempio, un utente potrebbe richiedere una visione sinottica di un testo antico e della sua traduzione in una lingua moderna; un altro potrebbe aver bisogno invece del conteggio di tutte le attestazioni di una data parola in modo da costituire una voce lessicale comprendente tutte le varianti grafiche e le traduzioni proposte nei rispettivi contesti; oppure può eseguire una ricerca di qualsiasi parola o gruppo di segni o definizione morfologica in un corpus di iscrizioni o anche solo in una sua parte. Ognuna di queste modalità viene definita attraverso una procedura Extensible Stylesheet Transformation (XSLT) [CDrom] che raccoglie i dati utili e li trasforma in una rappresentazione appropriata. Una trasformazione può anche presentare i dati sotto forma di una rappresentazione visuale come un grafico attraverso il linguaggio Vector Markup Language (VML). L’effetto di una trasformazione può essere specifico sia per la visualizzazione in un browser HTML che per la stampa. L’aspetto grafico definitivo della pagina dipende da un foglio di stile Cascading Style Sheet (CSS) [CDrom], che costituisce quindi l’ultima fase del processo.

I seguenti progetti sono specifici per le scritture cuneiformi. Ci sono due tipi di approcci che in realtà sono complementari: la replica virtuale della superficie tridimensionale di un'iscrizione e la codifica (intesa come traslitterazione) del testo.

Ci sono anche alcuni articoli indipendenti da specifici progetti:


©2000-2004 Copyright by Gian Pietro Basello
for ElamIT.net <www.elamit.net> (old URL: http://digilander.libero.it/elam)
Write to <elam@elamit.net>

Napoli, 13.14/II/2003; 9/V/2004

Il materiale (testi e immagini) contenuto in questo sito può essere liberamente utilizzato per fini personali, didattici, non commerciali. Non può essere riprodotto senza indicarne correttamente l'autore e l'indirizzo internet (URL). Sarà gradita la segnalazione a <elam@elamit.net> di ogni uso o collegamento al materiale contenuto in questo sito. Grazie!

The contents of this site, including all images and text, are for personal, educational, non-commercial use only. The contents of this site may not be reproduced in any form without proper reference to Author and Internet Address (URL). Please report to <elam@elamit.net> every use or link to these contents. Thank you!