Chestiuni documentaristice (inclusiv bibliologice)

Dan Matei (care își dă și el cu părerea).

Archive for the ‘cataloage’ Category

Expunerea în Europeana: șoc cultural în instituțiile memoriei

with one comment

I. Din nou despre bibliotecile digitale (contemporane)

„Noua generație” de biblioteci digitale a fost inaugurată de Biblioteca Digitală Europeană: Europeana. Aceasta este – de fapt – un catalog colectiv de resurse culturale digitale expuse online (mai ales) de către țările membre ale Uniunii Europene. Așadar, ea oferă acces la metadatele (i.e. fișele catalografice ale) obiectelor digitale care sunt efectiv consultabile pe saiturile contributorilor (peste 3.500 în întreaga Europă), deci într-un mod foarte distribuit. Expunerea metadatelor se face în două moduri: printr-un portal și printr-o interfață programată – API [Application Programming Interface]. Prin portal (fig. 1), utilizatorii pot interoga direct colecția, iar prin API, programatorii afiliați pot dezvolta interfețe de consultare proprii și pot îngloba înregistrări în propriile lor aplicații.

fig-1-europeana-landing

Fig. 1. Pagina natală a portalului Europeana (decembrie 2016)

Europeana a constituit un model pentru alte biblioteci digitale majore. Una dintre cele mai importante este Digital Public Library of America [DPLA] (fig. 2). De notat: DPLA că este una dintre (nu prea multele) inovații europene majore adoptate de americani în ultimii 25 de ani !

fig-2-dpla-landing

Fig. 2. Pagina natală a portalului DPLA (decembrie 2016)

La nivel european, Statele Membre (care se respectă) au dezvoltat biblioteci digitale naționale, pandante ale Europeana. Cea mai masivă este Deutsche Digitale Bibliothek [DDB] (fig. 3).

fig-3-ddb-landing

Fig. 3. Pagina natală a DDB (decembrie 2016)

Se observă că aceste biblioteci digitale expun colecții de multe milioane de lucrări. Dar, cu cele peste 54 de milioane de exponate, Europeana este de peste trei ori mai voluminoasă decât DPLA.

II. Expunerea online

Întâi, o banalitate prea des uitată: de ce conservăm colecțiile ? Desigur, pentru a ne bucura de ele. Adică publicul – cât mai larg – să se bucure de ele ! Prin „bucurie” înțeleg, de bună seamă, satisfacții estetice și intelectuale. De ce merită (re)amintită această banalitate ? Fiindcă, prea adesea instituțiile memoriei uită că trebuie să fie (mereu) orientate către public. Iar expunerea pe web, adică accesibilă celui mai larg public, scoate și mai tare în evidență deficiențele de prezentare ale multor instituții ale memoriei.

Să ne reamintim: la ce e bună expunerea online ? Răspunsurile mele:

  • Contracarează – (măcar) într-o oarecare măsură – „discriminarea geografică” oraș-sat și capitală-provincie. Un bun cultural expus online – chiar dacă sub forma de surogat digital, în cazul lucrărilor tangibile, mai ales obiectele muzeale – are șanse semnificativ mai mari de a ajunge la ochii unui cetățean defavorizat (cultural) de localizarea sa geografică. Iar un text online e la fel de „veritabil” ca și versiunea lui tipărită.
  • Dezvăluie și piesele „ascunse” veșnic prin depozite. Doar e de notorietate că mai toate muzeele își pot expune în expoziția permanentă abia o mică parte a colecției.
  • Permite afișarea de „legende” ample și conexiuni pentru piesele expuse, ceea ce în expozițiile „fizice” rareori se întâmplă.

III. De ce produce Europeana un șoc cultural în instituțiile memoriei ?

În esență: Europeana fiind o platformă online destinată publicului larg, instituțiile memoriei expozante sunt puse în situația de a-și (re)orienta fișele descriptive ale resurselor culturale expuse către ochiul utilizatorului și nu doar al profesionistului.

De regulă, muzeele nici nu-și expun public cataloagele, iar bibliotecile și arhivele pun în fișele lor – pe lângă descrierea pedantă a cărții ca obiect – cel mult câteva vedete de subiect și nelipsiții (dar inutilii) indici CZU. Așadar, cataloagele „tradiționale” nu prea se adresează „clientului”.

Prin urmare, în context digital, metadatele asociate unei lucrări – care în mod tradițional sunt destinate custodelui/curatorului/bibliotecarului – trebuie extinse cu informații destinate utilizatorului. Piesa se cere interpretată, i.e. plasată în context istoric și geografic, iar subiectul și eventualele aluzii, explicate. Așadar, exponatul – fie el imagine sau text – trebuie „înfășurat” într-o poveste contextualizantă.

Exemplificarea 1 (muzee):

Celebrul tablou al lui Poussin „Răpirea sabinelor”. O fișă precum cea din fig. 4 nu spune prea multe privitorului. La „descrierea” „par Poussin”, ce să zici ? Apoi, elementele „cifrate” (e.g. 77.P.Z.) poate semnifică ceva cel mult pentru custodele colecției. Ca să nu mai zicem de inducerea în eroare: „Type: Monograph” (chiar dacă imaginea este extrasă dintr-o monografie). Mai bine ne-ar spune ceva care să sporească înțelegerea lucrării: cine-s sabinele ? cine le răpește ? de ce ? În plus: informarea privind datarea reproducerii (1899) e mult mai puțin relevantă decât ar fi cea despre datarea originalului (c. 1640).
fig-4-poussin-sabine-europeana-2016-10-08a

 Fig. 4. Poussin. „Răpirea Sabinelor”. Fișa unei reproduceri

Din fericire, Luvru însuși oferă o expunere adecvată (fig. 5).

fig-5-poussin-sabine-louvre-2016-10-08

Fig. 5. Poussin. „Răpirea Sabinelor”. Expunerea pe saitul Luvrului

Încă un și mai bun exemplu găsim pe saitul Muzeului Național de Artă al României. „Adorația păstorilor” al lui El Greco (fig. 6.). Pe lângă o descriere textuală adecvată, o avem și în format audio, ba chiar și în format gestual ! (Păcat că la o scară așa de mică – doar 40 de piese se bucură de o asemenea expunere).

fig-6-mnar-el-greco-2016-10-09a

Fig. 6. El Greco. „Adorația păstorilor”. Expunerea pe saitul MNAR

Exemplificarea 2 (biblioteci):

Un roman „obscur”: „Război și pace”. Fișa din fig. 7 ne cam derutează: „2011” ? Sigur, meseriașii înțeleg că ăsta e anul ediției (al manifestării și nu al expresiei sau lucrării, în jargon FRBR). Dar cititorul obișnuit înțelege asta, sau crede că e anul genezei lucrării ? Nimic despre 1863-1869, nimic despre războaiele napoleoniene, nimic despre Borodino. Nici chiar despre Rusia ! Deci nu aflăm nimic despre subiectul romanului ! Și câtă lume înțelege că „821.161.1” înseamnă „literatură rusă”10 ? Și câți bibliotecari – în afara clasificatorilor – înțeleg ? Așadar, cui folosește limbajul ăsta cifrat ?

fig-7-tolstoi-razboi-si-pace-bna

Fig. 7. Tolstoi. „Război și Pace”

Nici fișa din fig. 8 nu e mai grozavă. Ce să înțelegi din „limba: rumrus” ? Că s-a tradus din rusă ? Frumos exprimat ! Apoi, bietul Tolstoi nici nu și-a închipuit că a scris o carte având drept subiecte „literatura rusă” și „roman” ! Similară și fișa din fig. 9.

fig-8-tolstoi-razboi-si-pace-bara

Fig. 8. Tolstoi. „Război și pace”

fig-9-tolstoi-razboi-si-pace-bcua

Fig. 9. Tolstoi. „Război și pace”

Exemplificarea 3 (arhive):

O imagine de arhivă, cu un personaj notoriu (fig. 10). Descriptori semnificativi ? „Künstler” (= artist) ? Apoi: „limba: germană” ? Ce e „lingvistic” în fotografie ? În schimb nu aflăm nimic despre cine mai e în fotografie ? Când a fost făcută ? În ce context ? Nu aflăm nici măcar cine e fotograful. Cu alte cuvinte, ce semnificație culturală are această fotografie ? De ce merită efortul s-o digitizăm, s-o expunem și să o privim ?

fig-10-hitler-ddb-2016-10-08a

Fig. 10. „Adolf Hitler”  în portalul Deutsche Digitale Bibliothek

Exemplele provin de la instituții de frunte. Dacă cele din „liga întâi” nu sunt adaptate încă „expunerii în piața publică”, ce pretenții să avem de la instituțiile mai mici, cu resurse semnificativ mai restrânse !

IV. Cum să ne adaptăm (noi, instituțiile memoriei) ?

Bineînțeles că adaptarea la mediul online nu e simplă și nici imediată. Cere eforturi. Prima cerință este – cred – conștientizarea faptului că trebuie schimbată mentalitatea. Și apoi regândirea fiecărei fișe (i.e. a codurilor de catalogare) prin prisma utilizatorului. Chiar și imaginile trebuie, poate, prelucrate având publicul în minte. Și expunerea textelor trebuie gândită pentru comoditatea utilizatorului. De pildă, fișiere pdf gigantice nu sunt recomandabile: poți aștepta îndelung să se descarce o carte în pdf (și poate să și plătești), ca apoi să constați că te interesau doar două pagini (sau nici măcar atât). Ca să nu mai zicem că fișierele pdf nu-s comod de citit pe dispozitive mobile, i.e. pe ecrane mici. Dacă se poate, e preferabil ca textele să fie expuse în HTML pur.

În privința descrierilor, putem imagina câteva „tactici” practice.

a) Să recuperăm textele descriptive din cataloagele de expoziție.

Mai ales muzeografii obișnuiesc să descrie amplu măcar unele piese pe care le expun, în cataloagele expozițiilor (un exemplu ilustrativ în fig. 11). De regulă, acestea sunt uitate după închiderea respectivelor expoziții. Și e păcat. Aceste descrieri pot fi reutilizate în fișele expuse online, în beneficiul privitorului.

fig-11-altar-votiv

Fig. 11. Text descriptiv dintr-un catalog de expoziție

b) Să „cooperăm” cu editorii și librarii

Putem prelua (cu folos) în fișele catalografice descrierile oferite de editori. În definitiv e și în interesul lor: poate unii utilizatori ai catalogului, decid să cumpere cartea, inspirați de acea descriere. În fig. 12 se vede o asemenea descriere, mult mai expresivă decât fișele catalografice obișnuite.

fig-12-tolstoi-razboi-si-pace-polirom

Fig. 12. Prezentarea unei ediții a romanului „Război și pace”, pe saitul editurii

c) Să „cooperăm” cu Wikipedia

Multă lume din comunitățile noastre profesionale tratează cu dispreț articolele din Wikipedia. Nejustificat. Și în orice caz, în detrimentul clienților noștri. Dacă nu suntem mulțumiți de un articol, n-avem decât să-l îmbunătățim ! Uite, de pildă, o fișa foarte „profesională” (fig. 13), în comparație cu un articol „de amatori” despre aceeași lucrare, din Wikipedia (fig. 14).

fig-13-brancusi-cumintenia-clasate-2016-10-10a

Fig. 13. Fișa „Cumințeniei Pământului” în Inventarul Bunurilor Culturale Mobile Clasate

fig-14-brancusi-cumintenia-wikipedia

Fig. 14. Articolul despre „Cumințenia Pământului” din Wikipedia

Pe de altă parte, să nu ne facem iluzii ! Când un utilizator caută o resursă culturală anume, interoghează Google. Așadar, contează foarte tare unde se regăsește pagina în lista de răspunsuri Google. În cazul „Cumințeniei Pământului”, în decembrie 2016, articolul Wikipedia era pe poziția 4, pe prima pagină, iar fișa din Inventarul clasatelor nu apărea nici în primele 15 pagini ! Bine, să zicem că „scandalul” Cumințeniei alterează ierarhia. Dar, de pildă, în căutarea bustului „Vitellius” al lui Brâncuși, articolul Wikipedia apare pe poziția 1, pe când fișa din Inventarul clasatelor apare abia pe poziția 7.

d) Să renunțăm la CZU

Clasificarea Zecimală Universală [CZU] a fost o mare realizare intelectuală, de mare folos în secolul XIX și secolul XX, până la pătrunderea calculatoarelor în biblioteci. De atunci însă, este un jargon profesional, chiar criptic, parcă anume făcut să ascundă informație prețioasă utilizatorilor. Bineînțeles că o lucrare trebuie clasificată. Dar de ce să mai folosim un limbaj cifrat pentru asta ? Limbajul natural nu e mai „natural” ? Occidentalii de ce folosesc de ani mulți vedete de subiect și descriptori ? Utilizatorul, nedecriptând indicii CZU (deci neavând un limbaj comun cu clasificatorul), poate rata regăsiri utile.

În plus, codificând în CZU, clasificatorii risipesc timp prețios, fiindcă, desigur, găsirea indicelui adecvat este mai consumatoare de timp decât găsirea (sau „inventarea”) unei vedete de subiect adecvate.

e) Să renunțăm la MARC(uri)

Și formatul MARC a fost o mare realizare biblioteconomică a anilor ’60. Dar, acum, după jumătate de secol, cramponarea de el este păguboasă. Nu degeaba Biblioteca Congresului – unde, de altfel, s-a inventat MARC – se pregătește (cam demult !) să treacă la BIBFRAME, un format mai adecvat vremurilor.

În fig. 15 se vede înregistrarea UNIMARC a unei ediții a romanului „Război și pace”. O să mă rezum la obiecția majoră, și anume: ce rost mai are efortul de a evidenția părțile titlului și a mențiunii de responsabilitate ? În afară de a permite afișarea în formalismul ISBD (la ce mai folosește acesta ? nici măcar stilurile consacrate de citare nu folosesc sintaxa ISBD), cui folosește ? N-am întâlnit OPAC care să-ți permită căutarea doar în „mențiunea secundară de responsabilitate”, să zicem. Și chiar dacă softurile ar permite, câți dintre utilizatori măcar înțeleg ce înseamnă această expresie ? Așadar, o transcriere brută sau, și mai bine, ocerizarea paginii de titlu ar fi mai economicoasă.

fig-15-marc-a

Fig. 15. Înregistrarea UNIMARC a fișei din fig. 7

În locul pedantei transcrieri a paginii de titlu, catalogatorii și-ar folosi mai profitabil expertiza la a identifica și caracteriza lucrarea/lucrările și expresia/expresiile cuprinse în manifestarea prelucrată.

Pentru clasificări – în cadrul formatului MARC (la care, desigur, bibliotecile cu ILS-uri tradiționale nu pot renunța, decât odată cu softul) – aș folosi (neortodox) câmpul 686 – Other Class Numbers, adică, în loc de indici numerici aș folosi (fără jenă) limbaj natural.

V. În loc de concluzii

Nu că ar putea asta să ne consoleze, dar nici alții nu-s (mult) mai breji. Vezi (fig. 16; Richard Pevear și Larissa Volokhonsky coautori cu Tolstoi ?).

fig-16-tolstoi-war-and-peace-worldcat-a

Fig. 16. Fișa „Război și pace” în WorldCat

În rezumat, teza mea este că schimbarea de paradigmă pe care o impune Europeana ne impune să ne concentrăm pe descriptori și pe descrieri cât mai ample. O lucrare, cu cât este mai semnificativă cultural, merită să fie „înfășurată” într-o poveste, adică să i se dezvăluie contextul geografic, istoric și cultural, să i se specifice nuanțat subiectul și să i se semnaleze conexiunile cu alte lucrări. Mai mult efort trebuie investit în descrierea lucrărilor, nu a „containerelor”. De pildă, nu descrierea fină a numărului de revistă e interesantă, ci a articolelor dinăuntru ! Și totul, având în minte utilizatorul final: publicul larg.

În fine, mari speranțe îmi pun în viitorul catalog național partajat: culturalia.ro. Acesta va fi deschis atât bibliotecilor, cât și muzeelor și arhivelor și va cuprinde și Biblioteca Digitală a României, pandantul național al Europeana. Modelul său de date se va baza pe modelele conceptuale CIDOC-CRM și FRBRoo, deci va fi foarte contemporan.

 

Written by poliptic

19 Ianuarie 2017 at 5:52 pm

Culturalia: Un portal românesc (?) [2]

leave a comment »

În postarea anterioară  — unde am început să schițez „arhitectura” bazei de date care ar sta la baza saitului culturalia.ro  (cam ezit să-i spun portal) — am promis că o să explic și indexul general. Amân, pentru că prieteni programatori (mai programatori ca mine) mi-au semnalat un serios punct slab la jurnalizare, adică la mecanismul de monitorizare a modificărilor, adică al trasabilității genealogiei fiecărei resurse. Așa că, o re-gândire a dus la modificări. Structura nouă a tabelei-jurnal apare în figura 1.

Fig. 1. Culturalia. Structura unei înregistrări în tabela-jurnal

O intrare constă din:

  • resourceGuid – identificatorul resursei (entitate sau aserțiune) afectate;
  • provenanceGuid – identificatorul entității-eveniment (de tip „asignare de atribut”) care agregă informațiile despre cine și pe ce bază a operat asupra resursei;
  • timeStamp – momentul în care s-a produs intervenția asupra resursei;
  • previousStatus – starea resursei înainte de intervenție.

Dacă acțiunile asupra resurselor (i.e. înregistrărilor) ar fi:

  • creare;
  • modificare;
  • ștergere (din motive de redondanță);
  • revizie (validare, invalidare, punere la îndoială);
  • fuziune a două (sau mai multe);
  • scindare,

atunci stările posibile ale resurselor (i.e. ale înregistrărilor) ar fi:

-4

arhivată (clonă)

-3

arhivată (invalidată)

-2

arhivată (redondantă)

-1

arhivată (înlocuită)

0

creată

1

creată (înlocuitoare)

2

problematică

3

validată

iată tranziția stărilor, în funcție de acțiuni (și de drepturile editorilor) ar fi:

a) asupra celor originare/înlocuite:

Creare

Punere la îndoială

Validare

Înlocuire

Fisiune

Ștergere

Invalidare

0

2

3

0

2

3

-1

-4

-2

-3

1

2

3

-1

-4

-2

-3

2

3

-1

-4

-2

-3

3

2

-1

-4

-2

-3

-1

2

3

-2

3

-1

-3

2

3

-1

-4

b) asupra celor înlocuitoare:

Înlocuire

Fisiune

Punere la îndoială

Validare

1

1

2

3

Scenariile editoriale importante ar fi:

a) modificările unei aserțiuni individuale, care ar fi:

  • subiectul: înlocuirea identificatorului resursei (unificare de identificatori);
  • predicatul: 1) înlocuirea identificatorului predicatului (unificare de identificatori), 2) rafinare (înlocuirea cu o subproprietate);
  • obiectul unei proprietăți: înlocuirea identificatorului resursei (unificare de identificatori);
  • obiectul unui atribut: corecție;
  • celelalte elemente: 1) adăugare, 2) modificare, 3) ștergere.

b ) fuziunea a două relații (provenite din surse diferite):

Exemplu: două atribute:

subiect

predicat

object

id1(Twain) id(nume) Mark Twain

subiect

predicat

object

id2(Twain) id(nume) Twain, Mark

fuzionează în:

subiect

predicat

object

id2(Twain) id(nume) Mark Twain

dacă se preferă id2(Twain) din a doua relație, dar se preia literalul din prima.

Fig. 2. Fuziunea a două atribute, plus două revizii

În exemplificarea din figura 2 avem trei momente:

  • t1 – cele două atribute fuzionează, dând naștere celei de-a treia, fapt consemnat în trei înregistrări de jurnal distincte;
  • t2 – o revizie pune la îndoială noul atribut (starea lui trece din 1 în 2), fapt consemnat în jurnal;
  • t3 – o nouă revizie validează noul atribut (starea lui trece din 2 în 3), fapt consemnat în jurnal.

Aserțiunile modificate sunt arhivate (întră în starea -1) și punctează către aserțiunile înlocuitoare/succesoare (care intră în starea 1)  — cum se sugerează și în figură. Identificatorul aserțiunii succesoare este consemnat în câmpul „successorGuid” (vezi figurile 5 și 6).

c) fisiunea unui atribut:

Exemplu: un atribut:

subiect

predicat

object

id(Zenobia) id(autor) Gellu Naum

… fisionează în trei aserțiuni (o relație și două atribute):

subiect

predicat

object

id(Zenobia) id(autor) id(Naum)
id(Naum) id(prenume) Gellu
id(Naum) id(nume de familie) Naum

Fig. 3. Fisiunea unui atribut (cu clonele evidențiate)

În exemplificarea din figura 3 se sugerează soluția (nu prea elegantă — poate-mi sugerează cineva una mai isteață) prin care se memorează legătura dintre o aserțiune și succesoarele ei: aserțiunea originară este clonată (starea -4), doar ca să fie loc pentru fiecare pointer către succesoarele sale (în „successorGuid”). În plus, clonele memorează (refolosind „predicateTypeGuid”) pointeri către aserțiunea clonată. (Pentru economie de spațiu, s-ar putea renunța la stocarea literalului în clonele atributelor.)

Această soluție (care consumă spațiu, prin clonele generate și înregistrările de jurnal aferente) — i.e. cu pointeri de la aserțiunile înlocuite către cele înlocuitoare (în loc de invers) — fac mai „ieftine” fuziunile decât fisiunile. Și asta, din pricină că presupun — știind datele cu care vom avea de-a face — că fuziunile vor fi mai multe decât fisiunile. Iar dacă practica va dovedi că se consumă cam mult spațiu cu clonele, poate că s-ar putea adăuga o tabelă specifică pentru memorarea pointerilor de la aserțiunile înlocuite spre cele înlocuitoare.

Figurile 4, 5 și 6 arată noile versiuni ale tabelelor „entitate”, „instanță de relație” și „atribut”. La fiecare, noutatea semnificativă este „successorGuid”.

Fig. 4. Culturalia. Structura unei intrări din tabela „entitate”

Fig. 5. Culturalia. Structura unei intrări din tabela instanțelor de relație

Fig. 6. Culturalia. Structura unei intrări din tabela instanțelor de atribut

Abia în postarea următoare se va comenta (promisul) index general.

Written by poliptic

17 Iunie 2012 at 11:34 pm

Culturalia: Un portal românesc (?)

with one comment

Și România are în plan un portal de tip Europeana (adică un catalog care să ofere acces la resurse culturale digitale, fie ele texte, imagini, audiograme sau videograme), Culturalia pe numele lui (stipulat în Ordinul ministrului culturii și cultelor nr. 2467/2008, între atribuțiile agregatorului național).  Cu resurse foarte limitate, se lucrează la proiectarea acestui portal.

Pe scurt — pentru a nu intra în prea fine detalii tehnice —, modelul de date Culturalia este conform paradigmei datelor interconectate  (vezi postarea anterioară). Nu doar pentru a fi „în trend”, ci și fiindcă această paradigmă permite atât agregarea de seturi de date foarte eterogene — cerință vitală pentru cataloagele de tip Europeana — cât și coexistența datele de granularitate variabilă. De pildă, e perfect posibil (deși nu foarte dezirabil) să avem alături aserțiunile:

subiect

predicat

object

id(Naum) nume Gellu Naum
id(Naum) prenume Gellu
id(Naum) nume de familie Naum
__

Însă mixtura de predicate și obiecte de granularitate diferită este inevitabilă atunci când sursele de date sunt eterogene.

În figura 1 se schițează model conceptual, adică ierarhia claselor (frunzele arborelui — cele albastre — reprezintă tabelele esențiale ale bazei de date) de nivel înalt.

Fig. 1. Culturalia: vârful ierarhiei claselor

De remarcat că se disting trei tipuri de aserțiuni (și această distincție constituie mica diferența față de modelul canonic RDF):

  • relații – asocieri între entități (atât clase cât și instanțe de clase);
  • atribute – asocieri între entități și literali (e.g. șiruri de caractere);
  • intrări de index – asocieri între signaturi (i.e. atribute de reprezentarea a entităților, e.g. nume pentru persoane, titluri pentru cărți) și cheile lor de sortare.

Fig. 2. Culturalia: relațiile dintre componentele modelului

În figura 2 sunt evidențiate legăturile între elementele modelului de date (care se identifică cu tabelele bazei de date). De remarcat că atât o relație, cât și un atribut poate fi subiectul unei alte aserțiuni (ceea ce în terminologia RDF se cheamă „reificarea” unei aserțiuni). Din acest motiv, aserțiunile au și ele identificatori.

Paranteză:

Identificatorii din prezentul model sunt un anume tip de identificatori standard, și anume „identificatori globali unici” — GUID [Globally Unique Identifier]  — care (cvasi)asigură unicitatea la nivel global. Partea proastă e că un asemenea identificator e de ne-citit/memorat pentru oameni. Exemplu:

ac16a9e1-8a01-4c2a-90f9-8970a0f3e553

De aceea, în ilustrările următoare, identificatorul elementului x este reprezentat prin guid(x).

Închis paranteza.

De pildă, să zicem că avem aserțiunea:

identificator guid(a1)
subiect guid(Jan van Eyck )
predicat guid(născut pe)
obiect 1390

și asertăm că această aserțiune este îndoielnică:

identificator guid(a2)
subiect guid(a1)
predicat guid(este îndoielnică)
obiect true

În figura 3 se vede cum fiecare aserțiune este înscrisă într-un „jurnal”, unde se consemnează cine a făcut afirmația, când și pe ce bază. Astfel, se pot urmări corecturile succesive și — mai ales — se evidențiază responsabilitățile intelectuale asupra aserțiunilor. De remarcat că proveniența aserțiunii (inclusiv responsabilitatea intelectuală)  se indică prin trimiterea la o entitate din clasa „eveniment” de tip „asignare de atribut” („E13 Attribute Assignment” în ontologia CIDOC-CRM [Conceptual Reference Model]). Acest eveniment poate fi o entitate complexă, adică să fie asociat cu mai mulți agenți și cu mai multe surse bibliografice.

Fig. 3. Culturalia: jurnalizarea fiecărei aserțiuni

Nota bene: aserțiunile „modificate” sau „șterse” sunt doar arhivate, nu sunt modificare sau șterse cu adevărat. Cu alte cuvinte, o aserțiune „ștearsă” e doar marcată ca „arhivată”, iar o aserțiune „modificată” este de fapt o versiune nouă, cea veche fiind arhivată. Aceasta permite să se urmărească „evoluția” unei aserțiuni și — la nevoie — să se revină la o stare anterioară.

Figurile 4, 5, 7 și 8 prezintă structurile tabelelor esențiale ale bazei de date Culturalia (versiunea alfa: o implementare Access experimentală — „proof-of-concept”, cum îi zic anglofonii).

Nota bene: se presupune că interfața-utilizator va fi suficient de elaborată pentru a ascunde complexitatea rețelei de aserțiuni pe care sistemul le va acumula.

Fig. 4. Culturalia: structura tabelei „entitate”

Tabela „entity” e simplă: o intrare conține doar identificatorul și (eventual) URI-ul http [Uniform Resource Identifier]  fiecărei entități (fie ea clasă sau instanță). La limită, această tabelă ar putea lipsi, fiindcă aserțiunile nu sunt aici. Dar poate se va dovedi util ca identificatorii entităților să fie centralizați undeva.

Fig. 5. Culturalia: structura tabelei „relație”

Cum îi spune numele, tabela  „relation” (figura 5) conține instanțele de relații (i.e. aserțiunile în care obiectul e o entitate). Pe lângă identificatorii membrilor tripletelor (canonici în modelul RDF):

  • subjectGuid – identificatorul subiectului;
  • predicateGuid – identificatorul predicatului (zis și „proprietate”);
  • objectGuid – identificatorul obiectului;

o intrare mai conține:

  • modifierGuid – identificatorul (eventualului) modificator  al obiectului. Ca de pildă „ante”, calificând un obiect-perioadă sau „la sud de”, calificând un obiect-loc.
  • predicateTypeGuid – identificatorul (eventualului) tip al predicatului.  Posibilitatea de a categorisi un predicat (ceea ce constituie un substitut pentru generarea de sub-predicate), permite evitarea proliferării predicatelor. În plus, ar putea fi un mecanism convenabil în cazul preluării datelor moștenite.

Un exemplu pentru a ilustra utilitatea categorisirii predicatului: să presupunem că avem relația „derivată din” dintre „L.H.O.O.Q.” lui Duchamp și „Mona Lisa” lui Leonardo (figura 6). Ulterior, se poate categorisi predicatul „derivată din” prin relaționarea cu conceptul „parodie”.

 

derivată din

(parodie)

 

Fig. 6. <L.H.O.O.Q. / Duchamp> <derivată din> <Mona Lisa / Leonardo>

Așadar, aserțiunea inițială:

subjectGuid guid(L.H.O.O.Q.)
predicateGuid guid(derivată din)
objectGuid guid(Mona Lisa)

se poate rafina, adăugându-i-se elementul:

predicateTypeGuid guid(parodie)

Abordarea alternativă, presupune:

a)      adăugarea unui nou predicat, prin aserțiunea:

subjectGuid guid(parodiază pe)
predicateGuid guid(e sub-proprietate a)
objectGuid guid(derivată din)

b)     înlocuirea aserțiunii inițiale cu:

subjectGuid guid(L.H.O.O.Q.)
predicateGuid guid(parodiază pe)
objectGuid guid(Mona Lisa)

Fig. 7. Culturalia: structura tabelei „atribut”

După cum îi spune numele, tabela „attribute” (figura 7) conține instanțele de atribute (i.e. aserțiunile în care obiectul e un literal). Pe lângă identificatorii subiectului și predicatului aserțiunii:

  • subjectGuid – identificatorul subiectului;
  • predicateGuid – identificatorul predicatului/proprietății;

o intrare conține și cinci forme (alternative) de literal:

  • textualValue – text (până în 255 de caractere);
  • longTextualValue – text lung;
  • booleanValue – boolean;
  • dateValue – dată calendaristică;
  • numericalValue – număr;

și mai conține:

  • modifierGuid – identificatorul (eventualului) modificator  al obiectului. Ca de pildă „ante”, calificând o dată calendaristică sau „mai mic(ă) decât”, calificând o cantitate;
  • unitGuid – identificatorul (eventualei) unități de măsură;
  • languageGuid – identificatorul (eventualei) limbi a literalului;
  • predicateTypeGuid – identificatorul (eventualului) tip al predicatului, similar cu cel din tabela „relation”;
  • objectTypeGuid – identificatorul (eventualului) tip al obiectului. Similar cu cazul predicatului, permite o categorisire a obiectului, ceea ce limitează și mai mult proliferarea predicatelor;
  • datatypeGuid – identificatorul naturii literalului, i.e. al tipului de dată (e.g. număr întreg);
  • qualifierGuid – identificatorul unui (eventual) calificator (e.g. o unitate de măsură);
  • syntaxEncodingScheme – (eventuala) schemă sintactică (pentru valorile structurate).

De notat că doar identificatorul limbii și cel al naturii literalului se regăsesc în modelul canonic RDF.

Un exemplu pentru a ilustra utilitatea modificatorului obiectului:

subjectGuid guid(David al lui  Michelangelo)
predicateGuid guid(are masa)
modifierGuid guid(mai mare de)
numericalValue 6.000
unitGuid guid(kg)

Sigur că această aserțiune s-ar putea exprima mult mai simplu astfel:

subjectGuid guid(David al lui  Michelangelo)
predicateGuid guid(are masa)
textualValue peste 6.000 kg
languageGuid guid(română)

Dar această formulare nu permite procesări numerice asupra literalului. Nici nu e independentă de limbă, deci pentru a exprima același lucru în rusă, ar fi necesară încă o aserțiune:

subjectGuid guid(David al lui  Michelangelo)
predicateGuid guid(are masa)
textualValue более 6.000 кг
languageGuid guid(rusă)

Pe de altă parte, tratarea kilogramului ca o entitate distinctă ar permite (pe lângă asertarea unei definiții, de pildă), folosirea ei convenabilă în contexte lingvistice diferite. Astfel, am putea avea aserțiunile:

subjectGuid

predicateGuid

textualValue

objectTypeGuid

guid(kilogram) guid(are abrevierea) кг guid(alfabet chirilic)
guid(kilogram) guid(are abrevierea) kg guid(alfabet latin)

Un exemplu pentru a ilustra utilitatea categorisirii predicatului:

subjectGuid guid(Turnul Eiffel)
predicateGuid guid(are dimensiunea)
numericalValue 324
unitGuid guid(m)
predicateTypeGuid guid(înălțime)

Un exemplu pentru a ilustra utilitatea categorisirii obiectului:

subjectGuid guid(conceptul de poem)
predicateGuid guid(e designat prin)
textualValue poems
languageGuid guid(engleză)
objectTypeGuid guid(plural)

Un exemplu pentru a ilustra utilizarea schemei sintactice (MARCXML în acest caz):

subjectGuid guid(Capcanele istoriei/Lucian Boia, ed.1)
predicateGuid guid(titlu și mențiune de responsabilitate)
textualValue <datafield tag=”245″ ind1=”1″ ind2=”0″>
<subfield code=”a”>Capcanele istoriei : </subfield>
<subfield code=”b”>
         Elita intelectuală românească între 1930 şi 1950 /
</subfield>
<subfield code=”c”>Lucian Boia</subfield></datafield
syntaxEncodingScheme http://www.loc.gov/standards/marcxml/schema/MARC21slim.xsd
Figura 8 prezintă structura tabelei „logEntry”.

Fig. 8. Culturalia: structura tabelei „intrare de jurnal”

În esență, o intrare în această tabelă constă din (vezi și figura 3):

  • resourceGuid – identificatorul resursei (entitate sau aserțiune) jurnalizate;
  • provenanceGuid – identificatorul entității-eveniment (de tip „asignare de atribut”) care agregă informațiile despre cine și pe ce bază a operat asupra resursei;
  • timeStamp – momentul în care s-a produs intervenția asupra resursei;
  • statusChange – ce schimbare de status a produs intervenția;
  • oldVersionGuid – identificatorul resursei înlocuite (în cazul modificărilor).

În postarea următoare se va comenta modul de constituire a indexului general (implică și decizii de proiectare mai subiective), respectiv se va prezenta tabela „indexEntry”.

Corecție: postarea următoare discută jurnalizarea. Indexul se amână :-)

Written by poliptic

3 Iunie 2012 at 1:06 pm

Scrisoare deschisă domnului ministru Valerian Vreme

leave a comment »

07.09.2010
Ministerul Comunicațiilor și Societății Informaționale
Scrisoare deschisă domnului ministru Valerian Vreme

Stimate domnule ministru
Acum aproape o lună am adresat o scrisoare domnului ministru Sandu, la care dânsul nu a apucat să răspundă. Problema fiind importantă, reiau demersul, ușor extins.

Întâi, vă semnalez că proiectele depuse în cadrul operațiunii 3.2.1. Susţinerea implementării de soluţii de e-guvernare şi asigurarea conexiunii la boadband, acolo unde este necesar așteaptă din 26 octombrie 2009 să fie evaluate ! Adică niște buni bani structurali zac nefolosiți de aproape un an ! Cu ceva timp în urmă, am propus în public să se aleagă câștigătorii prin tragere la sorți. Nu glumeam; dacă respectiva comisie nu poate să se decidă, să decidă Domnul !
Dar dacă metoda propusă de mine nu s-a aplicat, atunci vă înștiințez că Ministerul Culturii și Patrimoniului Național a depus, alături de alte cinci bune proiecte, — în cadrul acestei operațiuni 3.2.1. — un proiect direct destinat internetizării serviciilor de bibliotecă, intitulat: Platforma națională integrată pentru management de bibliotecă publică” (cod SMIS: 14242).
Chiar dacă unora o să li se pară scandalos, vă rog să interveniți energic pentru ca acest proiect să fie selectat. Notez că serviciile de bibliotecă (greșit traduse în HG 195/2010 prin sintagma „librăria publică”) sunt pe poziția 8 între cele 20 de servicii monitorizate la nivel european, prin urmare proiectul Ministerului Culturii ar rezolva deplin unul dintre cele 20 de servicii prioritare ale programului eRomânia.

Sigur, se poate spune că există o comisie care evaluează proiectele pe baza unor reguli, iar eu vă cer să interveniți nereglementar. Se poate, dar o asemenea intervenție s-ar justifica printr-un interes superior — folosind cuvinte mari, aș putea chiar spune „interes național”. (În paranteză fie spus, concursul de proiecte din cadrul operațiunii 3.2.1. mi se pare straniu; parcă ar fi un concurs literar la care concurează romane-fluviu alături de epigrame.)

Sistemul biblioteconomic propus de Ministerul Culturii ar fi o componentă foarte utilă și foarte vizibilă a sistemului eRomânia. El ar oferi un mecanism la nivel național prin care, în principal:
  1. s-ar evita risipa de efort de catalogare (în prezent, dacă 100 de biblioteci achiziționează o carte, se elaborează 100 de fișe bibliografice, desigur în multe variante ușor diferite !);
  2. s-ar substanția împrumutul interbibliotecar (și acum biblioteca mea de cartier poate să împrumute pentru mine o carte de la altă bibliotecă; problema e că nu știe care bibliotecă din țară are cartea cu pricina).
Dar, în subsidiar, sistemul ar putea să ofere și alte funcționalități foarte utile. De pildă, editurile ar putea să-și ofere titlurile bibliotecilor/utilizatorilor, chiar înainte de a fi publicate, iar cercetătorii ar putea fi asistați să-și elaboreze bibliografiile de lucru într-unul din formatele consacrate, și în același timp s-ar acumula (gratuit) informații bibliografice într-o bază de date națională. Mai mult, dacă acest sistem va fi dezvoltat în regim open source, mai precis sub licența EUPL v1.1 (European Union Public Licence) care este promovată de Comisia Europeană, s-ar da un bun exemplu pentru viitoarele sisteme informatice dezvoltate pe bani publici.

Institutul de Memorie Culturală – CIMEC dezvoltă și întreține Catalogul Colectiv Național al Cărții Vechi Românești și Catalogul Colectiv Național al Incunabulelor. Așadar, în chestiunea informatizării colecțiilor de bibliotecă vă vorbesc în oarecare cunoștință de cauză, dar — mai ales — în calitate de important utilizator potențial al sistemului propus de proiect.

Prin urmare, insistând asupra utilității sociale a sistemului, vă rog să tratați cu bunăvoință propunerea mea.

Cu considerație,

Dan Matei, director (Institutul de Memorie Culturală – CIMEC)
PS. Breasla bibliotecară îmi șoptește că sunteți de mult un suporter important al bibliotecii publice din Onești. Asta îmi sporește speranțele.

PPS. Notă personală:
Chiar la o privire superficială asupra listei proiectelor propuse în cadrul operațiunii 3.2.1, se vede că zeci de autorități locale propun, practic, același proiect, cu titulaturi mai mult sau mai puțin imaginative. Să zicem că din acestea sunt selectate trei proiecte pentru consilii județene, cinci pentru primării de oraș și zece pentru primării de comună. Ce se va întâmpla ? Trei județe, cinci orașe și zece comune vor avea sisteme diferite, dar cu funcționalități similare. Și celelalte 38 județe ? și zeci de orașe ? și mii de comune ?

În condițiile date, mi s-ar părea rațional să se finanțeze dezvoltarea open source a:
  1. trei sisteme generice pentru consiliile județene;
  2. trei sisteme generice pentru prefecturi;
  3. trei sisteme generice pentru primăriile de oraș;
  4. trei sisteme generice pentru primăriile de comună,
desigur, toate compatibile între ele și compatibile cu sistemele guvernamentale, i.e. interoperabile, i.e. respectând standarde de intercomunicare, aprioric elaborate.

Apoi aceste sisteme să fie oferite gratuit tuturor autorităților publice. Zic câte trei sisteme (cifra e simbolică) , pentru ca beneficiarii să aibă de unde alege. Să nu li se pară că li se impune un singur stil. Ulterior, autoritățile publice n-ar mai avea motive să achiziționeze pe bani publici sisteme similare.
Nu spun că nu trebuie să existe o secțiune și pentru proiectele unicat. Dar această secțiune să fie separată și bugetată distinct.

Written by poliptic

8 Septembrie 2010 at 8:24 am

Publicat în cataloage, Uncategorized

IFLA a publicat forma finală a „Declarației de Principii Internaționale de Catalogare”

with one comment

 

La adresa www.ifla.org/VII/s13/icp/ poate fi citită forma finală a Declarației.

Am început o traducere (n-ar trebui să-mi fie prea greu, fiindca am tradus în 2004 prima formă, cea de la Frankfurt: www.cimec.ro/Metodologice/Catalogare.htm#Frank, deși forma de acum e de două ori mai lungă).

Problema mea acum: acuratețea traducerii formulărilor principiilor propriu-zise. De aceea le expun aici (preliminar), pentru a profita de eventualele critici.

Principiile, în versia mea, sunt:

2.1. Satisfacerea nevoilor de informare ale utilizatorului [convenience of the user]. Deciziile privind descrierile și formele controlate de apelațiuni din punctele de acces ar trebui luate din perspectiva utilizatorului.

2.2. Uzanța [common usage]. Vocabularul folosit în descrieri și acces ar trebui să fie conform cu cel al majorității utilizatorilor.

2.3. Reprezentativitatea [representation]. Descrierile și formele controlate ale numelor ar trebui să se bazeze pe felul în care o entitate se autodescrie.

2.4. Acuratețea [accurecy]. Entitatea descrisă ar trebui să fie înfățișată cu exactitate.

2.5. Suficiența și necesitatea [sufficiency and necessity]. Ar trebui incluse doar acele elemente ale descrierilor și ale formelor controlate de apela’iuni care sunt necesare operațiunilor utilizatorului și sunt esențiale pentru a identifica în mod unic o entitate.

2.6. Relevanța [significance]. Elementele informaționale ar trebui să fie semnificative din punct de vedere bibliografic.

2.7. Economia [economy]. Dacă există căi alternative de a atinge un obiectiv, ar trebui preferată calea care favorizează la maximum economia de ansamblu (i.e. costul cel mai redus sau abordarea cea mai simplă).

2.8. Coerența și standardizarea [consistency and standardization]. Descrierile și elaborarea punctelor de acces ar trebui să fie cât mai standardizate posibil. Aceasta asigură mai multă coerență care, la rândul ei, sporește posibilitățile de partajare a datelor bibliografice și de autoritate.

2.9. Tratarea unitară [integration]. Descrierile tuturor tipurilor de materiale și forme controlate de apelațiuni pentru toate tipurile de entități ar trebui să se bazeze pe un set comun de reguli, in măsura în care acesta este relevant.

Concizia principiilor face traducerea problematică. Mai ales din pricina mulțimii „falșilor prieteni”.

A doua problemă pe care aș vrea s-o expun (înainte de publicarea traducerii) este invenția adjectivului „subiectual/subiectuală”.  Adjectivul mi s-a părut convenabil în expresii precum „catalogarea subiectuală” pentru „subject cataloguing” (prin analogie cu „catalogare descriptivă” [descriptive cataloguing]) sau „tezaure subiectuale” pentru „subject thesauri”. Adjectivul e convenabil dar nu-s sigur că e „legitim”.

 

Actualizare (05.03.2009):

Prietana Florica Câmpeanu mi-a făcut câteva bune sugestii:

  • „reprezentativitate” în loc de „reprezentare”;
  • „exact înfățișată” în loc de „corect înfățișată”;
  • „semnificativitate” în loc de „însemnătate”.

Între timp văd că a apărut și versia franceză, care va fi de mare ajutor.

În povestea cu „subiectual”, încă nici Florica și nici Claudia nu m-au convins.  În calitate de terminolog (:-) sunt mare amator de neologisme. Dar ăsta n-ar fi un motiv suficient. Mie „subiectual” mi se pare sugestiv, iar „catalogarea pe subiecte” mi s-a părut totdeauna cam chinuit și — stilistic — șubred. Dacă am zice „catalogare pe materii” cum sugerează Florica, mă tem că tare puțină lume ar înțelege. Să ne mai gândim.

 

Actulizare (09.03.2009):

Colegele/colegii de la Brașov, mi-au făcut câteva bune sugestii. De pildă „relevanță” și „satisfacerea nevoilor de informare…”. Nu m-au convins cu toate sugestiile, dar nu-i timpul pierdut :-)

Pe de altă parte, m-am decis să folosesc „trebuie” pentru „must” și „ar trebui” pentru „should”.

Written by poliptic

1 Martie 2009 at 8:17 pm

Publicat în cataloage, catalogare

Din nou despre Catalogul Naţional Partajat (2): planurile de discuție

with one comment

Revin la discuția despre Catalogul Național Partajat [CNP]. E și timpul: pe 18 februarie se discută subiectul la Comisia Națională a Bibliotecilor și vreau să expun (din vreme) poziția pe care o să susțin acolo.

Mi se pare că problema se poate discuta pe trei nivele: „politic”, tehnic/catalografic și tehnic/informatic. La primul nivel se răspunde la întrebarea: da sau nu CNP. La celelalte se discută cum să se facă CNP. 

 

A. Nivelul „politic” 

Considerente politice rezolvă problema dacă să se dezvolte un CNP (în sensul de bază de date centralizată, în care se cataloghează, i.e. nu doar un catalog colectiv !) sau nu. Deoarece: 

  1. CNP este un serviciu public util pentru toți cetățenii (i.e. și toți contribuabilii) – în plus vizibil („aici sunt banii dumneavoastră”);
  2. CNP evită risipa de ban public, prin minimizarea duplicării de efort de catalogare, 

răspunsul este: da, trebuie să se dezvolte/instituționalizeze un Catalog Național Partajat. Mai mult: pentru organizațiile care cataloghează pe bani publici, folosirea curentă a CNP-ului n-ar trebui să fie opțională. 

<paranteză>

Nu spun că „interogările federalizate” [federated search] nu au rost. Au mare sens pentru baze de date disjuncte, e.g. colecțiile online de reviste științifice (e-journals) furnizate de diverși furnizori, de pildă EBSCO, ABI/Inform, Blackwell Synergy, ERIC, JSTOR, LexisNexis, ScienceDirect, SpringerLink. E puțin probabil să găsești același articol în două asemenea baze de date.

</paranteză> 

A doua chestiune în care intervin considerente politice este: elaborarea unui soft nou sau achiziționarea unui soft comercial existent ? 

Deoarece este un serviciu public pe termen lung (prin care se administrează și întreține o resursă publică națională), CNP-ul are nevoie de un soft care să fie proprietate publică in integrum. Cu alte cuvinte, softul poate fi dezvoltat de o companie comercială, dar sursele sale trebuie să devină proprietate publică, iar dezvoltatorul trebuie să cesioneze (desigur, neexclusiv) statului drepturile de proprietate intelectuală asupra produsului. (Așa se întâmplă, de pildă, în cazul softului care se dezvoltă acum – în cadrul unui proiect Phare – pentru sistemul informatic de protecție a patrimoniului cultural mobil, în care sunt implicați Ministerul Culturii, Poliția, Vama și Poliția de Frontieră.)

 

B. Nivelul catalografic

 La nivel tehnic/catalografic, cred că CNP ar trebui să gestioneze metadatele bibliografice într-un format generic, în care: 

a) entitățile bibliografice să fie convertibile (fără pierdere de informație) în (cel puțin): 

ba chiar și în ROMARC :-) 

b) entitățile „de autoritate” și să fie convertibile (fără pierdere de informație) în (cel puțin): 

În plus, formatul generic ar trebui să asigure compatibilitatea cu FRBR  (i.e. să aibă scheme pentru lucrări și expresii). 

Desigur, natura însăși a catalogului va impune reguli unitare de catalogare. 

Deși CNP trebuie să fie o bază de date centralizată, cred că extensii locale ale înregistrărilor bibliografice partajate ar fi foarte utile (e.g. descriptori locali, confidențiali). 

 

C. Nivelul informatic 

Din punct de vedere informatic, CNP ar trebui să înglobeze cele mai noi tehnologii web (chiar webul semantic), deoarece un sistem dezvoltat acum, va trebui să fie (tehnologic) proaspăt încă cel puțin 10 ani. 

Prin urmare, tehnologii precum: 

  • linked data;
  • Z39-88 (i.e. OpenURL);
  • servicii web (pentru particularizări de interfețe, pe lângă o interfață generică);
  • WSRP (pentru furnizarea de date bibliografice unor portleturi care să poată fi incluse în portaluri diferite). 

ar trebui de la început să fie implementate în softul pentru CNP.

Written by poliptic

16 Februarie 2009 at 1:14 am

Din nou despre Catalogul Naţional Partajat (1): catalogarea partajată

with one comment

Din fericire, Comisia Naţională a Bibliotecilor [CNB] a relansat discuţia despre Catalogul Naţional Partajat [CNP]. Aud că iniţiativa CNB a provocat şi o discuţie pe acest subiect la Asociaţia Bibliotecarilor din România [ABR] (deşi sunt membru, n-am auzit nimic „oficial”; era — probabil — numai pentru „inner circle”; nu ştiam că-n ABR sunt două categorii de membri !). Foarte bine ! Era şi vremea. Sper ca şi Ministerul Culturii să reia ideea de a finanţa proiectul (finanţare întreruptă — reamintesc — la jumătatea lui 2005).

Suntem câţiva „membri asociaţi” ai CNB şi, în această calitate, am primit spre comentare o propunere a dnei. Doina Ostafe. Cel mai bun „comentariu” la care m-am putut gândi a fost reluarea propunerii Asociaţiei Naţionale a Bibliotecarilor şi Bibliotecilor Publice din România [ANBPR] de acum mai bine de trei ani, (foarte) uşor adusă la zi. Zic uşor, fiindcă şi-a păstrat toate calităţile. E la fel de actuală (doar că mai urgentă) ca în 2005.

Şi fiindcă în mediile bibliotecare din România partajarea catalogării a fost mereu — de fapt — respinsă, cred că merită să se reia argumentarea pro.

De fapt nu mi-a fost niciodată limpede care sunt raţiunile profunde pentru care un catalog partajat naţional este respins. Mă tem că e o combinaţie de complexe de superioritate cu complexe de inferioritate, adică o neîncredere în ce fac alţii, combinată cu temerea că ne văd şi alţii erorile. Dă Doamne să mă înşel. Drept că mai aud şi argumente de genul: de ce să beneficieze şi alţii de munca noastră ? Dar acest argument se aduce pe şoptite: de fapt, cei care-l folosesc ştiu că prestează un serviciu public, deci e natural să beneficieze şi alţii.

În orice caz, cred — mai mult ca oricând — că un catalog naţional partajat (centralizat) este necesar.

Eu, în calitate de reprezentant al CIMEC, am şi un interes direct: noi avem de făcut catalogul colectiv al cărţii vechi. Poate în 2009 reuşim să terminăm (în mare) cartea românească până la 1830. Mai e mult de lucru la „transilvanice”, iar cartea străină (cu excepţia incunabulelor) nici nu e încă abordată. Sunt câteva zeci de mii de exemplare de prelucrat. E nevoie de un efort colectiv, ca să se termine într-un interval rezonabil. Acum n-avem un instrument informatic decent nici pentru a expune pe Net ceea ce e deja catalogat, darmite pentru a cataloga.

A. Argumentul economic, i.e. economia la catalogare

Dacă argumentul privind calitatea sporită a informaţiei catalografice pe care o oferă un catalog partajat nu e destul de convingător (deşi mie mi s-ar părea suficient), atunci o să recurg la (antipaticul) argument economic. Şi am de gând să pedalez intens pe el.

Plecăm de la premiza că majoritatea bibliotecilor din România sunt finanţate din banul public. Mă tem că e o premiză greu de contestat. Aşadar, şi o covârşitoare parte a catalogării (în care includ şi indexarea, clasificarea, cum convenim să-i spunem) se face pe bani publici.

Catalogând local se risipesc bani publici: dacă se achiziţionează un titlu în 100 de biblioteci, se fac 100 de fişe pentru acel titlu. Deci, de 99 de ori se duplică munca catalogatorului care a elaborat primul fişa cărţii. Adică se risipesc bani publici de 99 de ori. Mi se pare important ca finanţatorii bibliotecilor să ştie acest lucru.

Prin contrast (sigur, simplificând, dar nu prea mult), într-un catalog partajat naţional, prima fişă (cronologic vorbind) elaborată pentru un titlu este reutilizată de toţi cei care au de catalogat acelaşi titlu. Chiar dacă o mai ajustează/îmbăgăţesc/corectează, toţi fac economie de timp. Ca să nu mai vorbim că fişa poate fi elaborată (chiar dacă într-o formă preliminară) chiar de editor, şi astfel se mai economiseşte ceva timp (chiar dacă catalogatorii nu au încredere în datele bibliografice ale editorilor — de multe ori cu îndreptăţire —, tot se poate „recupera” ceva din fişele lor, titlul de pildă). Pe scurt, randamentul catalogatorilor creşte dramatic dacă se foloseşte un catalog partajat centralizat. Şi n-am nici o emoţie: catalogatorii nu-s în primejdie să rămână fără slujbe. După câte ştiu eu, retroconversiile o să dureze cel puţin două generaţii. (Iar dă Doamne să mă înşel.)

Mai mult, fişierele de autoritate ar trebui să fie partajate de biblioteci, muzee şi arhive, pentru a reduce şi mai mult duplicările de efort (deci risipa de ban public).

B. Argumentul interesului public

Un catalog naţional partajat este — implicit — un catalog colectiv naţional. În această postură, el oferă un serviciu public valoros: facilitează împrumutul interbibliotecar. Acum — după cum bine ştim — împrumutul interbibliotecar în România funcţionează rudimentar, mai ales din pricină că e greu pentru o bibliotecă să afle cine are cartea de care are nevoie clientul. Adică lipseşte catalogul colectiv naţional.

În al doilea rând, un catalog colectiv ar putea oferi (precum Google Book Search) trimiteri la saiturile editorilor, pentru cărţile care sunt de vânzare. Prin urmare ar fi şi în interesul editorilor (şi cumpărătorilor).

În al treilea rând, un catalog colectiv (făcut cu tehnologiile contemporane) ar putea fi o bună bază pentru realizarea/întreţinerea de cataloage ale bibliotecilor personale (precum LibraryThing, care are deja peste 34 de milioane de cărţi catalogate !). Şi aici am un interes direct (am început să uit ce cărţi am; nu atât din pricina numărului de cărţi, cât din pricina numărului de ani). Sunt sigur că 99,8% din cărţile pe care le am în casă sunt deja catalogate undeva în ţară. Deci, având acces la catalogul naţional, ar trebui să cataloghez eu însumi doar 0,2% din cărţile pe care le am.

Mai mult, e uşor de imaginat un mecanism prin care utilizatorii (elevii, studenţii, cercetătorii, autorii) să fie ajutaţi să-şi întocmească bibliografiile ataşate lucrărilor pe care le redactează. Înregistrările bibliografice pe care nu le găsesc gata elaborate, ar trebui să şi le elaboreze singuri, acestea rămânând în catalog şi pentru uzul altora. Ştiu: catalogatorii au oroare de datele furnizate de „amatori”. Dar n-ar fi nici o dificultate ca înregistrările furnizate de „amatori” să fie marcate distinct (de exemplu puse pe fond roşu), până la validarea de către un „profesionist”.

Nu sunt oare suficiente aceste argumente ?

Aspectele tehnice merită altă discuţie.

Written by poliptic

26 Decembrie 2008 at 12:27 pm

Publicat în cataloage, catalogare