Chestiuni documentaristice (inclusiv bibliologice)

Dan Matei (care își dă și el cu părerea).

Biblioteca Digitală a României [BDR]: planuri şi speranţe

with 2 comments

 

Postul ăsta (şi cel anterior) au fost provocate, de fapt, de postul al lui Nicolaie Constantinescu, care semnalează bucuros existenţa unei propuneri de de politică publică privind digitizarea resurselor culturale naţionale şi crearea Bibliotecii Digitale a României.

Sunt implicat în proiectul Bibliotecii Digitale a României. Dar, (mai) înăuntru fiind, nu împărtăşesc optimismul amicului Nicolaie Constantinescu. Sper ca el să aibă dreptate.

Adevărat: propunerea de „politică publică” a Ministerului Culturii este, în principiu, agreată de guvern. Dar până nu se alocă un buget, e doar un gând pios. Iar anul astă nu mă aştept să i se aloce un buget. Dă Doamne să mă înşel !

Adevărat: ministrul meu (Adrian Iorgulescu) a declarat public că BDR e una dintre priorităţile ministerului. Aici am ceva mai multe nădejdi, adică tot la bugetul existent.

 

A. Care e planul ?

1. Să inventariem ce e deja digitizat.

2. Să constituim un repozit (repository), unde să depunem resursele pe care le obţinem, împreună cu aplicaţiile de prezentare (randare), dacă sunt necesare, e.g. o aplicaţie de răsfoire. Şi să asigurăm URL-uri stabile.

3. Să constituim o bază de date cu metadatele descriptive ale acestor resurse (disponibile pentru recoltare de către europeana.eu).

4. Să dezvoltăm portalul naţional, i.e. BDR, cu interfaţă românească (şi măcar şi cu una englezească), şi care să permită acces nu doar la resursele din repozitul local, ci şi la alte resurse „de interes românesc” din repozite străine (i.e. Google Books, Live Books) sau resurse care — din diverse motive — nu sunt încă accesibile prin europeana. eu (de pildă fiindcă n-au metadatele conforme cu cerinţele acesteia).

NB. Europeana.eu nu va accepta resurse din repozite concurente (e.g. Google Books), aşa că BDR va colecta mai multe resurse „româneşti” decât europeana.eu. Ca să vedeţi ce vreau să zic: într-un week-end (în toamnă) am făcut un exerciţiu de vreo 3-4 ore. Am încercat să identific resurse „româneşti” în trei repozite mari (Google Books, Live Books şi Internet Archive). În acestea, neavând cataloage, e greu de găsit ceva, dacă nu ştii exact ce cauţi. Iniţial, am căutat orbeşte, folosind cuvinte cât mai „româneşti”, precum „mămăligă” sau „suflet”. Pe urmă am dat-o pe „Romania”, „Transylvania”, „Valachia” şi altele asemenea. Tot am găsit 102 cărţi. Iată rezultatul la www.biblioteca-digitala.ro.

5. Să încurajăm orice digitizare în ţară (plătită sau voluntară). Să convingem autorităţile (centrale şi locale) să nu finanţeze nici o digitizare, dacă rezultatul nu se include în BDR.

 

B. Conexiunea cu europeana.eu

Schematic vorbind, asocierea BDR cu Biblioteca Digitală Europeană Europeana.eu se va face în modul următor:

  • portalul Europeana.eu îşi va recolta metadatele (de sorginte românească) din baza de date BDR (prin protocolul OAI-PMH). Utilizatorii portalului Europeana.eu vor avea acces la resursele româneşti (pentru care s-au recoltat metadate) din repozitul românesc (alături de celelalte repozite europene);
  • utilizatorii BDR vor avea acces la toate resursele din repozitul românesc, dar şi la resurse din alte repozite (pentru care portalul are metadate).

Diagramatic (şi foarte simplificat), mecanismul sugerat este:

 Relatia-BDR-Europeana

… în care se vede cam cum e planul.

 

C. Care-i problema ?

Se poate rezuma astfel: (deocamdată) nu avem banii pentru softul adecvat.

Dar am intrat într-un parteneriat „european” şi am aplicat la apelul 3 (aprilie) la FP7, ca să obţinem finanţare pentru dezvoltarea unei platforme pentru biblioteci digitale („gen BDR” :-).

Încalc (puţin) confidenţialitatea ca să arăt cam ce mi-aş dori. Folosesc o variaţiune a unui exemplu pe care l-am pus în textul aplicaţiei (unul dintre parteneri e un laborator din Prato, aşa că – din simpatie – am ales un „exponat” pratoan).

Să presupunem că avem în biblioteca digitală următoarea resursă digitală:

 

 Prato-duomo-Globalgeografia.com

O foarte simplă înregistrare metadatală [metadata record] pentru ea ar fi:

 

[ro] Legendă: catedrala din Prato, după amiaza.

[en] Caption: Prato Cathedral in the afternoon.

ã Globalgeografia.com

  

O înregistrare metadatală mai complexă, ar fi o înregistrarea „Dublin Core” [ISO 15836:2003(E)]:

 

Title

prato1.jpg
Creator    ? 
Subject [en]   The Prato Cathedral    

Subject [ro]   Catedrala din Prato  
Description [en]   A photo of the famous Prato Cathedral (Santo Stefano di Borgo al Cornio) in the afternoon. Architect: Guidetto da Como. Creation date: 12th-15th century. Style: Romanesque; Gothic.  
Description [ro]   fotografie a faimoasei catedrale din Prato (Santo Stefano di Borgo al Cornio), la orele după amiezii. Arhitect: Guidetto da Como. Datare: sec. XII – XV. Stil: romanic; gotic.  
Publisher    Globalgeografia.com  
Contributor    ?  
Date    2002-2004 (?)  
Type [en]   digital image  
Type [ro]   imagine digitală  
Format    jpeg  
Identifier    http://www.globalgeografia.com/album/italia/toscana/prato1.jpg  
Source    http://www.globalgeografia.com  
Language      
Relation      
Coverage [en]   Prato, Italy  
Coverage [ro]   Prato, Italia  
Rights    ã Globalgeografia.com  

O reprezentare mai folositoare (şi nu mult mai complexă) ar arăta (diagramatic) cam aşa:

 

PratoArgument

Aşadar, pentru a reprezenta „obiecte culturale” (care sunt — prin natura lor — complexe), e necesar un model de date complex. Acel model de date trebuie să includă mai multe tipuri de înregistrări metadatale şi multe tipuri de relaţii între acestea, împreună cu exprimări plurilingve a termenilor implicaţi.

Astfel, un vizitator al prezumtivei noastre biblioteci digitale ar avea şansă să descopere imaginea frumoasei basilici pratoane nu doar după numele ei, ci şi baleind ale lucruri interesante aflate în Toscana sau construite în secolul XV sau aparţinând clasei „arhitectură” sau fiind asociate cumva cu Sfântul Ştefan. Utilizatorul nostru ar putea profita astfel nu doar de metadatele oferite de furnizorul imaginii, ci şi de cunoştinţele consemnate de alţi furnizori de conţinut, cum ar fi:

  • Prato se află în Toscana;
  • Toscana face parte din Italia;
  • basilica este o entitate arhitecturală.

     

  •  Dacă e relativ uşor (nu şi pentru mine !) să faci maioneză din ouă şi ulei, e foarte dificil să separi oul de uleiul dintr-o maioneză. Similar, e relativ uşor să degradezi [dumb-down] o asociere complexă de înregistrări metadatale (precum cele sugerate în diagramă) ca să obţii o înregistrarea Dublin Core (sau chiar o simplă legendă), dar este foarte dificil să transformi (automat) o înregistrare Dublin Core într-un set de înregistrări metadatale logic interconectate („degradarea” e aproape o funcţie neinversabilă — cum ar zice matematicianul).

    Morala e că ar fi nevoie de elaborarea unor modalităţi de reprezentare a informaţiei culturale complexe într-un format rafinat şi de a defini un model de date care să încurajeze experţii să-şi consemneze cunoştinţele culturale astfel încât să se favorizeze multiple căi de descoperire de către utilizator a resurselor dintr-o bibliotecă digitală. Din fericire, deja se cam ştie cum să se facă asta.

    Ne-ar plăcea ca Biblioteca Digitală a României să fie organizată astfel (cam ca o enciclopedie), ca să permită utilizatorului nu doar căutarea unei resurse bine precizate, ci şi baleierea şi navigarea printre entităţile asociate de catalogatori/indexatori cu resursele digitale aflate în acea bibliotecă. Să ne ţinem pumnii !

    Anunțuri

    Written by poliptic

    24 Mai 2008 la 12:21 pm

    2 răspunsuri

    Subscribe to comments with RSS.

    1. Iertata-mi fie indrazneala dar as repeta aici intrebarea mea postata pe Prolibro legata de acest proiect: cu ce oameni se va lucra? Stiu ca bugetul va rezolva o parte din probleme dar pregatirea oamenilor ia timp. Cine se va ocupa de asta? Impresia mea este ca cIMec-ul nu e foarte mare…se va extinde in viitor pentru a putea sustine acest proiect? Vor fi adusi sa lucreze in proiect informaticienii? Sau bibliotecarii? ( Stiut fiind ca la noi rare sunt intersectiile dintre ei)

      In legatura cu separarea galbenusurilor de ulei din maioneza…exista un articol care sa urmareasca cum au rezolvat alte tari europene problema? Aceasta nu e o problema noua totusi…

      Claudia S.

      26 Mai 2008 at 7:45 am

    2. La recenta conferinta eLiberatica 2009 au fost prezenti multi oameni care ar putea sa ajute.

      Comunitatea Free Software din România e mult mai mare decat credeți – problema e că nu știu unii de alții.

      Îmi permit să vă sugerez câteva site-uri și liste de discuții cu care să intrați în contact, pentru a obține AJUTOR IT (de multe ori gratuit):

      http://wwww.softwareliber.ro
      http://www.fedoraproject.ro
      http://ro.openoffice.org

      precum și rețeaua LinkedIn (căutați grupurile de software liber, Fedora, CentOS, OpenOffice.org, Debian…).

      Răzvan

      3 Iunie 2009 at 1:02 pm


    Lasă un răspuns

    Completează mai jos detaliile tale sau dă clic pe un icon pentru a te autentifica:

    Logo WordPress.com

    Comentezi folosind contul tău WordPress.com. Dezautentificare / Schimbă )

    Poză Twitter

    Comentezi folosind contul tău Twitter. Dezautentificare / Schimbă )

    Fotografie Facebook

    Comentezi folosind contul tău Facebook. Dezautentificare / Schimbă )

    Fotografie Google+

    Comentezi folosind contul tău Google+. Dezautentificare / Schimbă )

    Conectare la %s

    %d blogeri au apreciat asta: