Magazzini Digitali

di Giovanni Bergamin

Un numero sempre più crescente di pubblicazioni nasce da tempo in formato digitale e non ha più l’equivalente cartaceo. Molti paesi (tra i quali anche l’Italia) hanno modificato la propria legislazione per comprendere nel deposito legale anche le pubblicazioni digitali native (o born digital). La più recente normativa italiana sul deposito legale (L. 106/2004, D.P.R. 252/2006) prevede un periodo di sperimentazione del deposito legale su base volontaria dei documenti elettronici, definiti dalla legge “documenti diffusi tramite rete informatica”.
Recentemente (luglio 2011), è stato firmato un accordo tra la Direzione Generale Beni librari e le associazioni maggiormente rappresentative dei settori dell’editoria: AIE, FIEG, USPI. L’accordo, al quale hanno aderito anche altre due associazioni, Mediacoop e ANES, ha lo scopo di promuovere la sperimentazione del deposito legale delle opere digitali native nelle Biblioteche nazionali centrali di Firenze e Roma e – limitatamente alla copia di salvataggio (o dark archive) – nella Biblioteca nazionale Marciana di Venezia. L’insieme di queste tre istituzioni e la Fondazione Rinascimento digitale ha dato vita (l’accordo è del novembre 2010) a un Servizio coordinato di conservazione e di accesso nel lungo periodo delle risorse digitali. Il Servizio consolida la sperimentazione del progetto Magazzini Digitali iniziato nel 2006 con il finanziamento e la collaborazione della Fondazione Rinascimento digitale.
Il nome del progetto – e ora anche del Servizio – fa riferimento al progetto europeo NEDLIB (1997-2000) dove il modello logico dei magazzini librari – in inglese digital stacks – delle grandi biblioteche nazionali è stato visto come modello di riferimento anche per le risorse digitali native.
Come ormai ampiamente riconosciuto la conservazione a lungo termine delle risorse digitali non è solo una questione tecnologica. Le strategie per evitare la corruzione dei bit o l’obsolescenza degli strumenti informatici sono semplicemente una parte del problema. Occorre prendere in considerazione (ma si tratta di un elenco incompleto) la sostenibilità economica, l’affidabilità dei sistemi di deposito, il quadro legislativo, i ruoli e le responsabilità istituzionali. Il servizio Magazzini digitali si basa su una architettura persistente di deposito dei dati a lungo termine.
Per architettura persistente si intende un disegno tecnologico del deposito teso a isolare gli elementi che si prevede avranno più stabilità nel tempo da quelli che dipendono maggiormente dalle tecnologie in uso in un determinato periodo. Per lungo termine si intende “un intervallo di tempo sufficientemente ampio da dover considerare l’impatto prodotto dalle informazioni conservate in un deposito dai cambiamenti delle tecnologie (incluso l’utilizzo di nuovi supporti e formati di dati) e della comunità di utenti. Tale periodo si estende indefinitamente nel futuro” [ISO 14721 – OAIS].
Può essere interessante osservare che i bit delle pubblicazioni digitali depositate in Magazzini digitali non saranno conservati all’interno degli edifici delle rispettive istituzioni (come invece accade di norma per le raccolte librarie). Esistono da molti anni sul mercato centri che ospitano con tutti i requisiti di sicurezza le macchine che erogano servizi informatici (non solo di memorizzazione o storage). Del resto collocare uno dei siti principali a Firenze sulle rive dell’Arno e l’altro a Venezia in Piazza San Marco, soggetta al noto fenomeno dell’acqua alta, avrebbe costituito una seria minaccia per la sicurezza complessiva del servizio. Tutto l’hardware è stato quindi collocato presso centri di elaborazione dati esterni, selezionati sulla base del possesso della certificazione di conformità allo standard internazionale ISO 27001. I tre centri selezionati (le procedure per l’assegnazione si sono chiuse nel settembre 2011) sono posseduti e gestiti da tre differenti società (per ridurre il un possibile effetto “domino” nel caso di chiusura di un centro per questioni legate alla vita economica di una determinata società) e distano l’uno dall’altro più di duecento di 200 chilometri (per ridurre l’impatto di eventi catastrofici naturali).

La tabella che segue mostra i dettagli.
Sito Ruolo Collocato a Società certificata ISO 27001
Biblioteca Nazionale Centrale Firenze (BNCF) Sito principale Torino COLT TELECOM
Biblioteca Nazionale Centrale Roma (BNCR) Sito principale Bologna CINECA
Biblioteca Nazionale Marciana (BNM) Salvataggio (dark archive) Roma ALMAVIVA

Nei primi mesi del 2012 il Servizio diventerà operativo. Merita infine ricordare che Magazzini Digitali si occupa solo della integrità degli insiemi di bit (o file) conservati, ma si occupa anche della capacità di “interpretazione” di un file codificato in un determinato formato (per esempio che un elaboratore di oggi sia in grado di interpretare un file secondo un formato oggi non più in uso). Oltre a garantire l’accessibilità ai documenti nel lungo termine, Magazzini Digitali si fa carico anche dell’autenticità (ovvero dell’identità e della integrità) di quanto conservato.