E’ stato calcolato dall’università di Berkley (F.Carlini, La memoria del digitale, Chip e Salsa, il Manifesto del 16 maggio 2004) che sono 18 milioni di exabytes la quantità di dati prodotta di un anno. Detto in termini più umani si tratta 18 miliardi di miliardi di caratteri a stampa di cui 5 vengono salvati su supporti fisici e il resto viene lasciato all’oblio.
In questa cifra sta la prima questione sollevata dalla famigerata Legge 106, la massa di dati da gestire, che richiede un investimento in infrastrutture non trascurabile anche limitandosi alla produzione nazionale.
Secondo punto: l’ambito di applicazione della legge che si scontra con la definizione di ”pubblicazione di interesse culturale per l’italia”.
Tanto per capirci, un sito come questo tenderei a considerarlo di interesse culturale per l’Italia ma, dal momento che non è prodotto in Italia e sta fisicamente su un server in qualche parte del mondo fuori Italia, probabilmente ricade al di fuori dell’ambito di applicazione della 106.
Da questo punto di vista, la salvaguardia delle pubblicazioni on line di interesse culturale non richiede un cambiamento della legislazione ma semplicemente la volontà di investire in un sistema tipo Way Back Machine limitato ai siti di interesse nazionale.
Tralasciando le questioni legislative che Internet, con il suo carattere sovranazionale, si porta appresso, il terzo problema da affrontare dovrebbe essere quello, già denunciato, della rapida obsolescenza della tecnologia, che può rendere di fatto inutile tutto il lavoro di archiviazione se non si ha l’accortezza di conservare, insieme ai documenti, una serie di ammennicoli non trascurabili che, nel caso di pubblicazioni on line vanno dal browser al sistemi operativo su cui il browser gira fino all’harware che permette l’utilizzo del sistemi operativo.
Personalmente ho già avuto un’esperienza di questo tipo quando un mio amico mi ha chiesto aiuto per trasformare automaticamente dei documenti scritti con il programma Works for Windows versione 2 in documenti Word. Operazione che non è stata possibile eseguire perchè i flitri di conversione di Word funzionano solo con versioni più recenti ma difficilmente reperibili di Works.
Il mio amico si è dovuto rassagnare al copia e incolla che fortunatamente ancora funziona.
Molto più fortunato è stato Leonardo del quale, a distanza di 500 anni, possiamo ammirare le opere anche on line grazie al progetto Turning the Pages.
La cifra snocciolata all’inizio si porta poi con sè un ulteriore problema, di risoluzione tutt’altro che facile: la catalogazione e il reperimento delle informazioni.
La massa enorme di dati e informazioni che le pubblicazioni on line producono e produranno in misura sempre maggiore renderà inutilizzabile qualsiasi algoritmo automatico di ricerca che si basasse esclusivamente sull’informazione originaria.
L’unica soluzione che rende l’archivio utilizzabile è la catalogazione delle informazioni cioè l’associazione ad una meta informazione che rende l’informazione stessa recuperabile analogamente a quanto viene fatto, per esempio, per le pubblicazioni scientifiche.
Da questo punto di vista una legge che volesse salvaguardare il patrimonio culturale si troverebbe a dover scegliere tra demandare l’operazione di catalogazione a chi gestisce l’archivio, operazione di dimensione titaniche, o cercare di imporla agli autori, cosa praticamente impossibile (sia dal punto operativo che legislativo) e di dubbi risultati.
Il problema è di dimensioni tali che c’è chi se ne preoccupa anche a livello di singola pubblicazione, come dimostra questo progetto.