Chestiuni documentaristice (inclusiv bibliologice)

Dan Matei (care își dă și el cu părerea).

Publicarea în Europeana.eu: probleme și (unele) soluții

leave a comment »

A. Problematica Europeana

A.1. Ce este portalul europeana.eu ?

Biblioteca Digitală Europeană [http://www.europeana.eu] este deja bine cunoscută lumii intelectuale europene (sper că și publicului larg.)

Fig. 1. Europeana. Pagina natală

Totuși auto-prezentarea fațetelor ei merită reamintită:

<citat>

  • Pentru utilizatori: Europeana este un punct de acces unic pentru milioane de cărți, tablouri, filme, obiecte muzeale și documente arhivistice care au fost digitizate în întreaga Europă. Ea este o sursă de informații de autoritate provenite de la instituțiile culturale și științifice europene.
  • Pentru instituțiile memoriei: Europeana este o oportunitate de a ajunge la mai mulți utilizatori, de a-și spori traficul web, de a îmbogăți experiența utilizatorilor lor și de a construi noi parteneriate.
  • Pentru profesioniștii din zona patrimonială: Europeana este o platformă pentru schimbul de cunoștințe între bibliotecari, curatori, arhiviști și industriile creative.
  • Pentru elaboratorii de politici și finanțatori: Europeana este o inițiativă prestigioasă susținută de Comisia Europeană și o cale de a stimula economia creativă și de a promova turismul cultural.

</citat>

Practic, Europeana este un catalog colectiv transnațional de resurse culturale digitale expuse de toate țările membre ale Uniunii Europene. E adevărat că are ambiții tehnice importante, dar, în esență, e un catalog, deoarece portalul stochează și expune metadatele (i.e. fișele catalografice ale) obiectelor digitale, astea fiind expuse pe saiturile furnizorilor, deci într-un mod foarte distribuit.

A2. Care sunt problemele expunerii obiectelor digitale ?

Din perspectivă tehnică, expunerea unui obiect digital în Europeana presupune:

  • obiectul să fie publicat pe un sait (al furnizorului) stabil (pe termen lung), cu o conexiune rezonabil de rapidă și să aibă o calitate acceptabilă (e.g. imagini de bună rezoluție). Printr-un „sait stabil pe termen lung” înțeleg un sait ce are garanții de persistență (saituri precum Youtube sau Flickr sau Wikimedia oferă oare garanții că materialul lor va fi la fel de accesibil și peste 10 sau 20 de ani ? Fiind deținute de organizații private, cine poate oferi această garanție ?). Adică să existe o probabilitate apreciabilă ca saitul respectiv să fie vizibil și peste 10-15 ani.
  • obiectul să aibă o calitate tehnică acceptabilă, adică:
    • o bună rezoluție, dar la dimensiuni rezonabile (pentru a nu implica un timp de acces excesiv). De pildă, în figura 2 se vede un document de peste 36 MB. Or, chiar la o conexiune relativ rapidă descopierea acestui fișier poate dura 2-3 minute (și poate costă !). Și poate că cititorul constată repede că documentul nu-l interesează. E preferabilă o prezentare ca cea din figura 3, în care un „foiletor” permite vizualizarea pagină cu pagină a unui volum facsimilat.
    • să nu necesite instalarea unor instrumente soft neuzuale, cum ar fi situația din figura 4, în care se vede cum documentele de vizualizat cer instalarea unui program de vizualizat fișiere DejaVu. Mulți cititori pot fi inhibați.

Fig. 2. Obiect digital prea mare

Fig. 3. Prezentarea paginată a unui facsimil digital de carte

Fig. 4. Documente ce necesită instalarea unui program

  • obiectul să aibă o adresă web (i.e. URL) unică. De pildă, în figurile 5 și 6, se vede un caz de „așa nu !”. Două obiecte digitale (imagini, în acest caz) distincte care au același adresă web. Altfel spus, nu pot fi adresate individual, direct, prin URL. În figura 7 se vede cum apare fișa unui obiect în Europeana, iar după click pe linkul (stânga-jos) „view item at …” se ajunge la fișa lui pe saitul furnizorului (figura 8). E evidentă necesitatea URL-ului unic.

Fig. 5. Așa nu (1): două obiecte cu aceeași adresă

Fig. 6. Așa nu (2): două obiecte cu aceeași adresă

  • adresa web (i.e. URL) a obiectului să fie persistentă pe termen lung;
  • metadatele asociate obiectului să fie scrise cu diacriticele corecte. Încă din 2004, prin norma SR 13392:2004 s-a standardizat codificarea corectă a caracterelor specifice limbii române. Mai mult, în 2006, utilizarea aceste codificări a fost legiferată prin legea nr. 183/2006 „privind utilizarea codificării standardizate a setului de caractere în documentele în formă electronică”. Diferențele semnificative au apărut la ș și ț. Nu doar aspectul grafic (trecerea de la sedilă la virguliță) este importantă, ci diferența de codificare Unicode a acestor caractere este capitală. Și dacă până acum sistemele de operare uzuale foloseau vechile codificări, apariția dispozitivelor mobile (e.g. tablete) ca și a versiunilor noi de sisteme de operare pentru PC-urile tradiționale, schimbă radical situația. Tabelul următor prezintă diferențele de codificare. Pare o problemă de detaliu, dar diavolul se ascunde în detalii. Figurile 7 și 8 arată consecințele practice (în Europeana) ale diferențelor de codificare. Metadatele exponatelor Brâncuși sunt scrise în codificarea veche, deci când cheia de căutare este scrisă cu codificarea nouă, obiectele nu sunt regăsite (motiv pentru care metadatele vechi vor fi retrase și re-furnizate cu codificarea corectă).

Vechi

Nou

ş

U+015F

ș

U+0219

Ş

U+015E

Ș

U+0218

ţ

U+0163

ț

U+021B

Ţ

U+0162

Ț

U+021A

__

Fig. 7. Căutare „Brâncuși” (scris cu ș „nou”)

Fig. 8. Căutare „Brâncuşi” (scris cu ș „vechi”)

  • metadatele asociate obiectului să fie conforme cu modelul de date specific Europeana: EDM [Europeana Data Model].

Fig. 9. Taxonomia claselor în modelul EDM

Modelul EDM cuprinde (în versiunea 5.2.3) 16 clase, din care 5 sunt preluate din alte ontologii. Taxonomia lor vede în figura 9, iar cea a proprietăților, în figura 10.

Fig. 10. Taxonomia proprietăților în modelul EDM

Din perspectiva drepturilor intelectuale, expunerea în Europeana presupune ca:

  • furnizorul să obțină drepturi depline de (re)publicare a obiectelor digitale. Aceasta nu e o problemă în cazul operelor din domeniul public (deși, în cazul operelor vizuale, de regulă, chiar dacă originalul — e.g. tabloul — este în domeniul public, reproducerea sa digitală e sub copyrightul fotografului). E însă o problemă în cazul operelor orfane și, mai ales, a celor sub copyright. Noi chiar vorbim de „gaura neagră a secolului XX”, adică lipsa masivă a operelor de secol XX, din pricina absurdei limite (viață + 70 de ani) din legile europene ale drepturilor de autor și a statutului incert al unei opere orfane.
  • furnizorul să furnizeze metadatele sub licența Creative Commons CC0 [„No rights reserved”], adică — din perspectivă practică —, echivalentul domeniului public.

 

Fig. 11. Licența CC0

 

 B. Experiența noastră practică: proiectul ATHENA 

Proiectul european ATHENA (2009 – 2011) a fost o rețea de bune practici, în cadrul programului eContentPlus. A avut 109 parteneri, inclusiv CIMEC – Institutul de Memorie Culturală, iar scopul lui major a fost furnizarea de resurse culturale în Europeana, mai ales material muzeal. În cadrul acestui proiect, CIMEC a furnizat  16.258 de exponate, mai ales obiecte de muzeu, dar și texte sau facsimile digitale de cărți. În figura 12 se vede expunerea un volum facsimilat. 

Fig. 12. Athena: Expunerea unei resurse

 Metadatele asociate volumului, convertite în formatul XML specific proiectului (LIDO [Lightweight Information Describing Objects]), se văd în figurile 13, 14 și 15. 

 

Fig. 13. Metadatele descriptive ale obiectului (în formatul LIDO)  

Fig. 14. Metadatele asociate evenimentului „creație” (în formatul LIDO)  

Fig. 15. Adresele web ale obiectelor digitale (în formatul LIDO)

 

 C. Experiența noastră practică: proiectul CARARE

CARARE este un proiect european de tip „rețea de bune practici” (2010-2012), în care Institutul Național al Patrimoniului este partener, alături de alte 28 de organizații, din 21 de țări.

Fig. 16. Expunerea unei resurse în contextul furnizorului (isShownAt)

Obiectivul proiectului este de a furniza Bibliotecii Digitale Europene resurse digitale reprezentând patrimoniul arheologic și arhitectural al partenerilor. Institutul nostru a furnizat deja peste 1.800 de resurse culturale (cu mult mai multe imagini) și va mai furniza peste 2.000 de resurse.

În figurile 16 și 17 se vede o resursă expusă în Europeana, prin intermediul proiectului CARARE. Cele două imagini ilustrează cele două moduri de expunere: în primul caz resursa se află în contextul paginii web a furnizorului, adică așa cum o vede vizitatorul saitului de origine (URL-ul acestei pagini este consemnat în atributul isShownAt al fișei descriptive). În al doilea caz, obiectul digital propriu-zis este expus scos din context, astfel încât poate fi folosit în expoziții virtuale sau antologii (embeded), în care curatorul poate asocia propria descriere (URL-ul acestei pagini este consemnat în atributul isShownBy al fișei descriptive).

Fig. 17. Expunerea unei resurse în scoasă din contextul furnizorului (isShownBy)

Fișa descriptivă a fiecărei resurse culturale trebuie convertită în formatul specific proiectului, adică să fie un fișier XML, care se conformează schemei CARARE. În figurile 18, 19 și 20 se văd fragmente din înregistrarea XML asociată resursei din figura 16. De remarcat în figura 20, elementul isShownAt, care conține adresa web a resursei (în contextul furnizorului).

Fig. 18. Identificarea înregistrării

Fig. 19. Descrierea resursei fizice reprezentate

Fig. 20. Descrierea obiectului digital 

D. Ce mai e de făcut ? 

Multe sunt de făcut ! În 27 octombrie 2011, Comisia Europeană a emis o recomandare „privind digitizarea și accesibilitatea online a materialului cultural și conservarea digitală” (în românește). În anexa II, se văd obiectivele cantitative pentru 2015 (stabilite pe bază de populație, PIB pe locuitor, cam așa ceva). Obiectivul pentru România este înfricoșător: 789.000 de exponate ! Asta înseamnă cam 1.000 de resurse per zi lucrătoare ! Nu văd cum… Dar măcar să furnizăm un număr semnificativ.

…..

Altă cerință „interesantă” este cea de la punctul c: „garantarea faptului că toate capodoperele aparținând domeniului public vor fi accesibile prin intermediul Europeana până în 2015”. Deci mai trebuie și să alegem „capodoperele” ! Să vedem cum definim o „capodoperă”.

Practic, nu cred că putem colecta/furniza un volum semnificativ de resurse culturale, dacă nu se instituie un mecanism gen catalog partajat, prin care instituțiile culturale și voluntarii să înregistreze/descrie materialul digital existent. Iar autoritățile trebuie să forțeze instituțiile care digitizează pe bani publici să descrie, să publice pe web și să înregistreze tot ce se digitizează.

Mai mult, Fundația Europeana (organismul care patronează Biblioteca Digitală Europeană) a recomandat, încă mai demult, ca fiecare Stat Membru să-și dezvolte un portal propriu — în paralel cu Europeana — în care să expună materialul pe care l-a expus în europeana.eu, în înfățișarea proprie specificului cultural al respectivei țări. Mai multe State Membre au pus deja în practică această recomandare. Exemple remarcabile sunt portalurile italian (CulturaItalia) și cel francez (Gallica).

Și România are în plan un astfel de portal, Culturalia.ro, pe numele lui (stipulat în Ordinul ministrului culturii și cultelor nr. 2467/2008, între atribuțiile agregatorului național). Cu resurse foarte limitate, se lucrează la el. În postarea următoare, o să descriu ce se face. 

 

Written by poliptic

24 Mai 2012 la 12:35 am

Lasă un răspuns

Completează mai jos detaliile tale sau dă clic pe un icon pentru a te autentifica:

Logo WordPress.com

Comentezi folosind contul tău WordPress.com. Dezautentificare / Schimbă )

Poză Twitter

Comentezi folosind contul tău Twitter. Dezautentificare / Schimbă )

Fotografie Facebook

Comentezi folosind contul tău Facebook. Dezautentificare / Schimbă )

Fotografie Google+

Comentezi folosind contul tău Google+. Dezautentificare / Schimbă )

Conectare la %s

%d blogeri au apreciat asta: