Chestiuni documentaristice (inclusiv bibliologice)

Dan Matei (care își dă și el cu părerea).

Europeana.eu: „Incidentul românesc” și lecțiile lui

with one comment

 

Ce este Europeana.eu (www.europeana.eu) ?

  Europeana - slogan

Descrierea „oficială” spune:

Europeana.eu — Biblioteca, Muzeul și Arhiva Digitală a Europei — este un proiect care a început în iulie 2007, având drept scop crearea prototipului unui sait care să ofere acces direct la circa două milioane de obiecte digitale (incluzând materiale filmate, fotografii, picturi, înregistrări sonore, hărţi, manuscrise, cărţi, ziare şi documente de arhivă).

Conţinutul digital al Europeana.eu va fi selectat din materialele deja digitizate şi disponibile online în muzeele, bibliotecile, arhivele şi colecţiile audio-vizuale ale Europei. Prototipul urmăreşte să expună conţinut reprezentativ provenind din toate aceste patru domenii ale patrimoniului cultural şi — totodată — provenind din întreaga Europă. Intenţia este ca, până în 2010, portalul Europeana.eu să ofere acces direct şi gratuit oricărui cetăţean, la peste şase milioane de cărţi, imagini, documente de arhivă, înregistrări sonore şi filme în format digital.

Ceva despre istoria proiectului se poate citi și în acest blog.

 

Doamna Viviane Reding (comisarul european pentru societatea informaţională şi mass-media) a „tăiat panglica” prototipului portalului Europeana.eu pe 20 noiembrie 2008, la Bruxelles, în prezenţa miniştrilor culturii din ţările membre ale Uniunii Europene (din România a participat secretarul de stat Demeter Andras). Lansarea publică a avut loc pe 27 noiembrie, la Paris (unde Preşedinţia franceză a Uniunii a organizat conferinţa „Numérisation du patrimoine culturel – Bibliothèque numérique européenne”, la Musée du quai Branly).

A doua zi după deschidere, portalul Europeana.eu, versiunea Beta (adică un prototip experimental) a fost închis din cauza unui număr record de accesări (zece milioane, se zice), care au blocat serverul. Redeschiderea a avut loc abia peste o lună, în jur de 20 decembrie 2008.

 

Pentru realizarea prototipului Europeana.eu s-a lansat, în iulie 2007, proiectul EDLnet [European Digital Library Network], la care au participat cel puţin câte o instituţie din fiecare ţară membră (din România, partenerul invitat a fost CIMEC – Institutul de Memorie Culturală). În 2008, partenerii din proiectul EDLnet au furnizat resurse culturale digitale care să fie expuse — experimental — publicului european prin acest portal. Miza este prezenţa patrimoniului cultural al fiecărui stat membru al Uniunii Europene în această „vitrină” a culturii europene.

Conform diverselor declaraţii oficiale (şi neoficiale), Comisia Europeană consideră această bibliotecă digitală principalul său proiect cultural, pentru următorii ani. Nimic surprinzător: fără îndoială este un proiect de mare importanţă şi semnificaţie atât culturală, cât şi politică.

   

Ce „știe” Europeana.eu

 Acum portalul, versiunea beta — accesibil public la adresa www.europeana.eu — permite căutarea după cuvinte-cheie (adică şiruri de caractere aflate, explicit, oriunde în conţinutul metadatelor unei resurse). Așa arată (acum) pagina lui natală:

  

clip_image004

  

De exemplu, la interogarea cu cuvântul-cheie „Europe” se obţin (acum: 31.01.2009) 152.870 de resurse digitale (texte, imagini, înregistrări audiovizuale, înregistrări audio). Observați că resursele audio n-au imagini-timbru (dar nici toate resursele imagini n-au încă).

  

clip_image006

La interogarea cu cuvântul-cheie „Europa”, se obţin 4.775 de resurse digitale (şi se poate observa că pe prima pagină apar şi trei resurse româneşti, provenite de la CIMEC):

  Interogarea "Europa"

În aceste interogări se văd binișor limitările curente ale portalului. De pildă nu „știe” că „Europe” și „Europa” e același lucru. Apoi, nu e limpede de ce piesele trimise de noi (i.e. CIMEC) apar la interogarea „Europa” (eu știu: în atributul „contributor” al acestor piese apare expresia „Şcoală din Europa centrală”; dar utilizatorul obișnuit, ar putea să afle asta doar mergând la detaliile piesei și apoi la contextul ei original, pe saitul CIMEC.)

Dar nu e grav ! Să nu uităm că acesta este un prototip ! Acest fapt a trecut cam neobservat de presă. Sigur, nici Comisia Europeană nu a subliniat suficient ca este (deocamdată) un experiment.

În practică, expunerea unei resurse culturale în Europeana.eu, presupune:

  • plasarea obiectului digital într-un „repozit” (i.e. un „depozit informatic”) naţional (la o adresă stabilă şi accesibilă permanent) — într-un format standard;
  • expedierea la Haga (locaţia portalului Europeana.eu) a fişei descriptive a respectivului obiect — într-un format standard — şi adresa lui (portalul se comportă ca un catalog de bibliotecă);
  • (eventual) plasarea fişei descriptive şi într-un portal naţional.

Diagramatic, un exemplu al acestui mecanism (statuia romană Şarpele Glycon de la Muzeul de Istorie Naţională şi Arheologie din Constanţa – în acest caz) este:

 

clip_image010

 

iar prezentarea resursei digitale respective în viitorul portal naţional va arăta nu foarte diferit de cum arată acum în lista bunurilor clasate (http://clasate.cimec.ro):

 

clip_image012

   

Ce se face în România ?

 Pentru a pune în practică un plan de perspectivă privind prezența românească în Europeana.eu, Ministerul Culturii şi Cultelor a elaborat la sfârşitul anului 2008 un Program naţional pentru digitizarea resurselor culturale naţionale şi crearea Bibliotecii Digitale a României — aprobat prin Hotărârea Guvernului nr. 1676 din 10/12/2008 — care permite demersuri coerente şi de durată pentru digitizarea patrimoniului românesc şi expunerea resurselor digitale astfel obţinute atât în Europeana.eu, cât şi în viitoarea Bibliotecă Digitală a României (probabil numită Culturalia.ro). Prin acest act, CIMEC – Institutul de Memorie Culturală a fost desemnat „agregatorul” naţional, cel ce administrează repozitul naţional de resurse culturale digitale şi asigură interfaţa dintre furnizorii de conţinut (instituţii publice sau alte organizaţii deţinătoare de resurse culturale din România) şi serviciul tehnic care gestionează portalul Europeana.eu. Organizaţional, Ministerul Culturii, Cultelor și Patrimoniului Național constituit cinci „piloni tematici” (cu comisiile de experţi aferente) pentru: patrimoniul scris (biblioteci), patrimoniu mobil (muzee), patrimoniu imobil (monumente şi arheologie), patrimoniul audio-vizual şi patrimoniul arhivistic.

Din punct de vedere practic,

  • până la 15 octombrie 2008 (termenul limită pentru 2008), CIMEC (în calitate de partener în proiectul european EDLnet) a constituit repozitul naţional şi a expus 3.299 de obiecte digitale (imagini de obiecte muzeale clasate provenite din baza de date a patrimoniului cultural naţional, administrată de CIMEC, prin urmare bunuri cu valoare deja confirmată de Comisia Naţională a Muzeelor, pentru care aveam şi imagini de calitate), a prelucrat (în formatul cerut) şi a expediat la Haga fişele descriptive pentru cele 3.299 de obiecte digitale.
  • s-au elaborat (și acum se experimentează) instrumente informatice care să permită prelucrarea resurselor digitale provenite de la pilonii patrimoniu mobil și patrimoniu imobil la „scară industrială”;
  • se lucrează la constituirea nucleului inițial al unui portal românesc (Culturalia.ro);
  • pentru fiecare pilon tematic în parte, comisiile de specialitate elaborează planuri care să stabilească ce se digitizează (și cu ce priorități);
  • pentru fiecare pilon tematic în parte, comisiile de specialitate elaborează metodologiile de fişare a obiectelor digitale.

În perspectivă (dacă totul merge bine şi va exista o susţinere financiară rezonabilă), din 2009 comunităţile profesionale se vor mobiliza:

  • să identifice, să fişeze şi să prelucreze resursele culturale deja digitizate (sistematic sau ocazional);
  • să digitizeze resurse culturale semnificative din patrimoniul naţional, să le fişeze și să le prelucreze;
  • să expună resursele astfel prelucrate atât în Europeana.eu, cât şi în Culturalia.ro.

Efortul va fi semnificativ: această integrare a resurselor culturale româneşti în contextul european impune o rigoare sporită şi cere — pe cât posibil — elaborarea de fişe descriptive şi în limbi de circulaţie. Însă această oportunitate majoră pentru imaginea României trebuie să fie valorificată.

 

„Incidentul românesc”

 Din păcate, la lansarea prototipului portalului Europeana.eu, la 20 noiembrie 2008, a apărut o situaţie neplăcută pentru România. La interogarea cu cuvântul-cheie „România” se obţinea următorul rezultat:

 

clip_image014

 

Chiar pe prima pagină a rezultatelor căutării, din cele 1.688 de rezultate (între care — după cum se vede în stânga — 1.482 provin din România), s-au nimerit 10 fotografii sinistre, cu copii din orfelinatele româneşti din 1990. Imaginile provin de pe un sait educațional scoţian (www.scran.ac.uk):

 

clip_image016

 

Desigur, nu era o conspiraţie. Dovadă: dacă se caută după cuvântul-cheie „României”, se obţineau:

 

clip_image018

 

adică 703 resurse, din care 697 provin de la CIMEC, iar pe prima pagină, din 12 resurse, 11 provin de la CIMEC.

Pe de altă parte, dacă se interoghează cu cuvântul-cheie „Roumanie”, se obţinea:

 

clip_image020

 

iar cu cuvântul-cheie „Rumänien”, se obținea:

 

clip_image022

 

Aşadar, nefericita situaţie este un simplu incident tehnic, datorat algoritmului de ordonare a obiectelor din rezultatul unei interogări (ranking algorithm). M-am interesat, desigur, și n-am aflat algoritmul complet. Dar, e sigur că resursele pentru care cuvântul-cheie căutat se găseşte explicit chiar în titlu au prioritate în listă, apoi urmează cele care au cuvântul-cheie în celelalte câmpuri (nu mi-e clar în ce ordine). În fine, resursele „echivalente” din punct de vedere al priorităților sunt sortate în ordinea inversă a introducerii în baza de date. Astfel, s-au conjugat următorii factori:

  • cuvântul-cheie „România” este transformat (automat) în „Romania” (unele caractere cu diacritice sunt convertite la caracterele de bază respective);
  • cuvântul „Romania” se află în titlurile acelor nefericite fotografii (e.g. „Children in Romania”);
  • puține dintre resursele trimise de noi aveau cuvântul „România” în titlu (mult mai multe aveau cuvântul „României”);
  • s-a întâmplat ca imaginile provenite de la Scran să fie introduse în baza de date mai târziu decât cele trimise de CIMEC.

Din păcate, situaţia a fost imediat observată în România şi a provocat — previzibil — o (prea) vie emoţie, cu accente de indignare (iar eu am primit și reproșuri, vagi, e adevărat).

Am semnalat situaţia administratorilor portalului (la Haga) încă din noaptea de 20 noiembrie (când — de altfel — saitul a fost închis, pe considerent că n-a făcut faţă marelui număr de accese), solicitând o remediere. Nu am cerut — desigur — să fie cenzurate imaginile incriminate, ci doar să fie mai „uniform” repartizate printre celelalte resurse rezultate în urma interogării cu „România”. Ba chiar, după câteva zile, am sugerat şi o soluţie tehnică simplă, „de avarie”. Din păcate, echipa de la Haga a neglijat pe moment problema (şi nici nu ne-a explicat la vreme cauzele întâmplării; între timp s-au scuzat că au fost plecați în concedii etc.), astfel că, la jumătatea lui decembrie — când saitul a fost repus online, fără tam-tam de astă dată — am constatat că nimic nu se schimbase.

Am încercat în repetate rânduri să contactăm echipa tehnică (chiar cu mesaje ce ameninţau voalat cu plângeri la CE) dar, poate din pricina sărbătorilor, n-am reuşit să obţinem nici o reacţie. Abia după 1 ianuarie am obţinut promisiunea unei abordări a problemei. Iar apoi, adică pe 6 ianuarie, a izbucnit scandalul în media românească şi acesta a ajuns iute la Comisia Europeană (prin intermediul comisarului Leonard Orban). Ca urmare a presiunilor de la Bruxelles, managementul proiectului (de altfel persoane de calitate şi competente) a reacţionat şi s-a găsit rapid o posibilă soluţie, dar care implica un efort tot din partea românilor: să mai trimitem (de urgenţă) un lot de obiecte digitale, astfel încât acestea, având o dată mai recentă de trimitere, să apară în primele pagini, conform algoritmului de ordonare actual din Europeana.eu.

Prin urmare, în 8 şi 9 ianuarie s-a lucrat foarte intens la CIMEC şi s-au pregătit alte peste 8.000 de înregistrări de bunuri culturale din patrimoniul naţional, și au fost trimise la Haga (de data asta, din păcate, cu imagini de mai slabă calitate, aşa cum se găsesc ele în dosarele de clasare în patrimoniul național). Astfel, acum, la interogarea „România” se obține:

 

clip_image024

 

Sigur, e cam bizar cum s-au grupat 8 scaune în primele 12 resurse. Dar i-am bodogănit deja destul pe amicii de la Haga…

Această situaţie putea fi — în cea mai mare măsură — evitată, dacă problema ar fi fost tratată serios de la început de echipa de la Haga, pentru că efortul de la începutul lui ianuarie puteam să-l facem la fel de bine și la sfârşitul lui noiembrie.

Ca o ironie, ia vedeți ce apare la interogarea „Hitler” (la 1.02.2009):

 

clip_image026

 

Primul exponat e un portret al lui Hitler pictat de un român (adevărat, mai celebru în Franța decât în România), încă din 1934 !

 

Problemele

 Acest incident a scos mai bine în evidență problemele proiectului Europeana.eu, cel puțin așa cum apar ele din perspectiva mea. Cele majore ar fi:

  • Biblioteca, muzeul și arhiva digitală a Europei n-ar trebui să fie un proiect finanțat din programe europene, adică discontinuu și incert. Europeana.eu ar trebui să fie un serviciu public, asigurat de o agenție europeană, finanțată continuu și adecvat (de altfel, acest serviciu ar utiliza cum nu se poate mai onorabil banii publici europeni).
  • Proiectul EDLnet a fost un proiect remarcabil de modest finanțat: a avut un buget de circa 1,5 milioane de euro, la o durată de 18 luni. Continuarea sa din cadrul programului eContentPlus, proiectul Europeana 1.0 (care-și propune realizarea serviciului operațional adevărat), are prevăzut un buget de câteva milioane de euro, pe o durată de 3 ani. Prin urmare, dacă CE declară că acesta este proiectul ei cultural major, de ce îl finanțează așa de precar ?
  • De altfel, cu ocazia acestui proiect s-au pus în evidență și unele deficiențe ale programelor europene, și anume lipsa de coordonare și de concentrare, atunci când acestea se dovedesc necesare. Astfel, între 2005 și 2008, CE se mândrește că a cheltuit circa 60 milioane de euro pentru proiecte legate de biblioteci digitale, dar atunci când a fost nevoie de o platformă informatică pentru o bibliotecă digitală adevărată, acesta a trebuit să fie — practic — improvizată în 6 luni, cu o echipă de dezvoltare de 3-4 oameni.
  • Europeana.eu ar trebui să revină la spiritul ei originar (așa cum a fost el sugerat, la începuturi, prin contrast cu „concurența”, i.e. Google Books Search, și anume o resursă cu material atent selectat, pe baza „semnificației culturale”. Cu alte cuvinte, se presupunea că vom expune în Europeana.eu doar resurse culturale cu adevărat semnificative (pentru a evita cuvântul „valoroase”). Or, în acest moment, deoarece pe parcurs a apărut ambiția de a expune (într-un prototip experimental !) peste 2 milioane de obiecte digitale, selecția materialului a fost — practic — abandonată. Cantitatea a doborât calitatea. La ce ne folosește ? Oricum, la cantitate Google ne va depăși cu mult.
  • Nu e OK să se expună resurse în Europeana fără, sau cu foarte puțină „interpretare”. Multe dintre resursele expuse au acum fișe descriptive cu totul rudimentare și deci, sunt lipsite de „context”. Sigur, un peisaj poate că n-are nevoie de multă „interpretare”. Dar „Mein Kampf” — de pildă — poate fi expus așa, pur și simplu ?
  • Prototipul este încă rudimentar, iar aceasta se trage — după mine — mai ales din rudimentaritatea metadatelor (un fel de Dublin Core, ușor extins). Fără „fișiere de autoritate”, căutarea o să dea mereu rezultate precare. Acum, sistemul nu „știe” că Firenze, Florența și Florence e același lucru, sau că (Firenze, Florența, Florence) e parte a (Italia, Italy, Italie).
  • Monolingvismul de facto al fișelor nu e acceptabil, pe termen lung. Desigur e o problemă grea de tot, dar nu poate fi amânată prea mult.

De altfel, la a 4-a reuniune a Grupului de Experți în Digitizare al Statelor Membre (Luxemburg, 29.01.2009), am sugerat formarea unui „consiliu editorial” al Europeana.eu, care să stabilească „regulile jocului”. Prima reacție a unui reprezentant al Comisiei Europene (de altfel o persoană foarte bine) a fost negativă, pe considerent că Europeana nu ar trebui să fie „cenzurată”, și că — de altfel — materialele sunt propuse de instituții culturale, deci … Nu era timp de multe discuții (și poate nici nu era locul potrivit), așa că n-am insistat. Eu cred că un asemenea consiliu ar trebui să filtreze nu atât ce se expune, cât cum se expune. În orice caz, o să încerc să conving ministerul nostru să insiste pe această idee.

Pe de altă parte, în chestiunea traducerilor, sunt conștient că tot noi, vorbitorii de „limbi mici”, avem de lucru. Dacă vrem să ne „vadă” mai multă lume, trebuie să ne traducem fișele în englezește, franțuzește, nemțește. Pe când, dacă vrem ca românofonii să „vadă” resursele britanice, franceze, germane, tot noi o să trebuiască să le traducem în românește. C’est la vie…

Pour terminer, Europeana.eu mi se pare un demers de toată lauda. Nu numai că ar putea fi în sine un serviciu cultural paneuropean realmente important și semnificativ (care ar întări sentimentul unității culturii europene !), dar ne-ar obliga și pe noi, operatorii culturali, ca, la noi acasă, să fim mai riguroși și mai grijulii cu resursele noastre digitale. Tocmai de aceea, abordarea lui ezitantă mi se pare regretabilă.

Anunțuri

Written by poliptic

1 Februarie 2009 la 4:30 pm

Un răspuns

Subscribe to comments with RSS.

  1. Foarte utile aceste explicatii. Dar si foarte diplomatice. Eu neavand o relatie oficiala in aceasta problema (inca:) pot fi un pic mai critica.

    Romania nu are oameni in functii de decizie politica care sa inteleaga in detaliu cum se organizeaza o biblioteca digitala (din pacate nici una fizica). Din ce am vazut pana acum nu mi se pare ca cei care iau decizii in CE stiu mult mai multe insa, spre deosebire de noi, au incredere sau macar pleaca urechea la specialisti. Proiectele de digitalizare cu care se lauda au fost finantate de ei dar pe baza propunerilor venite de undeva…de la profesionalisti in stiinta informarii europeni as crede si spera. Ei bine eu nu as fi asa blanda cu cei care dpdv profesional au venit cu propunerea Europeana.eu sau care au girat pentru ea. Daca din primele momente cand a fost initiat acest proiect nu si-au pus serios problema traducerii metadatelor…eu zic ca nu trebuiau sa se apuce de treaba. Cate limbi si dialecte sunt in tarile EU? Daca chiar considerau ca initiere acestui proiect este foarte importanta puteau cel putin sa ii explice clar limitele de la inceput.

    Faptul ca CE a facut atata publicitate acestui prototip dovedeste insa ca nu au fost avertizati de problemele care erau de altfel inevitabile. Daca am putea presupune ca numarul mare al vizitatorilor din primele zile putea fi o surpriza (desi la cata publicitate i s-a facut ma indoiesc) faptul ca termenii cautarii ar trebui tradusi automat in toate limbile pentru care exista inregistrari trebuia stiut neaparat. Un consens legat de minimul de descriere al contextului obiectului ar fi din nou ceva elementar.

    Am avut candva cu dvs. o discutie legata de necesitatea unui master pe digitalizare/digitizare in Romania. In lumina celor petrecute cred ca e nu numai necesar dar trebuie sa contina si cursuri de diplomatie pentru ca, pe langa pregatirea profesionala sa li se dea viitorilor profesionisti uneltele cu care, la masa de discutii, sa poata „educa” CE in aceste probleme.

    Si in rest…numai de bine:)

    Claudia S.

    1 Februarie 2009 at 11:16 pm


Lasă un răspuns

Completează mai jos detaliile tale sau dă clic pe un icon pentru a te autentifica:

Logo WordPress.com

Comentezi folosind contul tău WordPress.com. Dezautentificare / Schimbă )

Poză Twitter

Comentezi folosind contul tău Twitter. Dezautentificare / Schimbă )

Fotografie Facebook

Comentezi folosind contul tău Facebook. Dezautentificare / Schimbă )

Fotografie Google+

Comentezi folosind contul tău Google+. Dezautentificare / Schimbă )

Conectare la %s

%d blogeri au apreciat asta: