La Digitalizzazione di massa: Google e Proquest

di Pierantonio Metelli

Progetto Proquest. Pagina di ricerca

Nonostante che molte biblioteche in Europa abbiano lanciato in questi anni progetti di digitalizzazione di vario tipo e consistenza, la digitalizzazione del patrimonio culturale europeo procede ancora lentamente. La stessa Commissione europea, pur mettendo in guardia dai rischi di formazione di posizioni monopolistiche nel mercato culturale e rimarcando il principio dell’uguale trattamento di tutti i cittadini dei diversi stati europei, ha incoraggiato la formazione di joint-venture pubblico-privato, riconoscendo l’impossibilità del solo versante pubblico di varare progetti di digitalizzazione di enormi patrimoni nazionali. La BNCF ha iniziato i primi progetti di digitalizzazione fino dagli inizi degli anni Novanta e ad oggi sono oltre 3 milioni le immagini digitali acquisite ed archiviate. D’altronde la produzione di nuove digitalizzazioni, nonché il continuo necessario aggiornamento di hardware e software per il mantenimento degli archivi digitali, hanno costi non indifferenti che incontrano difficoltà con le possibilità di finanziamento attualmente disponibili nell’Amministrazione centrale. L’ingresso di Google in questo settore, con la sua capacità di investimenti, ha prodotto innegabilmente un’accelerazione, impensabile soltanto fino a pochi anni fa, ed ha spostato la riflessione da un dibattito teorico o squisitamente professionale su progetti e prototipi intorno al come costruire la “biblioteca digitale”, verso una opzione concreta che ha creato nuove opportunità. In questa prospettiva in rapida evoluzione la BNCF ha varato una strategia verso la digitalizzazione di massa attraverso un modello di cooperazione che realizzi accordi differenziati per natura, specializzazione e finalità, in relazione alle diverse tipologie di materiali da digitalizzare. In modo tale che la Biblioteca possa guidare e gestire l’indirizzo generale della propria politica culturale, senza una cessione in toto del proprio patrimonio librario, costituendo allo stesso tempo un quadro di riferimento nelle iniziative pubblico-privato e affermando un modello autonomo di diffusione della cultura. Conseguentemente la BNCF ha concluso due importanti accordi con partner diversi: Google e ProQuest. Da una parte, a seguito di un progetto pilota su alcune collezioni, la BNCF ha realizzato un contratto della durata di sette anni con ProQuest, società leader nel campo dell’informazione scientifica elettronica per il mondo accademico e di ricerca, per la digitalizzazione di tutti i materiali a stampa pubblicati fino all’anno 1700 (stimati ben oltre le 50.000 unità). Dall’altra affidando a Google una parte rilevante dei volumi pubblicati dal 1701 alla fine dell’Ottocento. I primi hanno elevati costi di catalogazione e necessitano di un trattamento di tipo specialistico. La loro destinazione più congrua sembra quindi essere all’interno di un prodotto scientifico rivolto in primo luogo ad un target istituzionale e di ricerca. Per questo saranno destinati alla realizzazione di una base dati online (EEB – Early European Books), curata da ProQuest, che andrà a costituire la storia della stampa in Europa dalle origini alla fine del diciassettesimo secolo, offrendo immagini in alta risoluzione e con “fedeltà” cromatica e dimensionale all’originale (ProQuest ha già prodotto EEBO – Early English Books Online, una base dati che contiene in formato digitale tutti i libri stampati in Inghilterra Irlanda Scozia Galles e nelle aree del Nord America di influenza inglese fino all’anno 1700). I secondi, materiali più moderni, da affidare invece al servizio “Google books search”, a carattere più divulgativo e rivolto alla generalità degli utenti, all’interno di un accordo di durata decennale tra il MIBAC e Google per la digitalizzazione di un milione di opere non soggette a copyright (di cui circa un terzo provenienti dalla BNCF, gli altri due terzi dalla Nazionale Centrale di Roma e dalla Nazionale di Napoli). Senza entrare nei dettagli dei due accordi, si può dire in generale che l’accordo con Proquest garantisce maggiori requisiti di scientificità e una maggiore tutela nel trattamento dei volumi rari, nessuna rilevante limitazione sui formati delle opere da digitalizzare, operazioni di digitalizzazione effettuate all’interno delle strutture della Biblioteca, una più alta qualità delle immagini con master in alta definizione, costi di catalogazione, ove necessaria, e di produzione dei metadati a carico di ProQuest, royalty per la BNCF dopo il recupero dell’investimento iniziale effettuato da ProQuest. A fronte di alcuni punti più critici (digitalizzazioni effettuate in un centro esterno all’istituto, costi di catalogazione a carico del MIBAC, minore qualità delle immagini) l’accordo con Google garantisce un forte impatto a livello mondiale (ad oggi “Google Books” ha già digitalizzato 21,5 milioni di volumi), la piena ricercabilità del testo tramite un OCR avanzato che ne permette anche l’accessibilità a portatori di handicap e da dispositivi mobili, un immediato accesso alla consultazione senza alcuna restrizione. Nell’accordo con ProQuest la libera accessibilità ai testi forniti dalla BNCF è riservata per 15 anni ai soli residenti nel territorio italiano: al termine di questo periodo di esclusiva, la BNCF potrà però utilizzare le digitalizzazioni effettuate da ProQuest anche in un modello di libero accesso su base mondiale.
Per concludere sinteticamente si può affermare che attraverso questi due diversi accordi la BNCF alla fine del prossimo decennio potrà concretamente porsi come una delle prime grandi biblioteche a livello mondiale che avrà riconvertito nel digitale una parte assolutamente rilevante del suo patrimonio librario non coperto da copyright rendendolo disponibile alla consultazione online.

Aggiornato a Dicembre 2011

Salva