Chestiuni documentaristice (inclusiv bibliologice)

Dan Matei (care îşi dă şi el cu părerea).

IFLA a publicat forma finală a „Declarației de Principii Internaționale de Catalogare”

cu un comentariu

 

La adresa www.ifla.org/VII/s13/icp/ poate fi citită forma finală a Declarației.

Am început o traducere (n-ar trebui să-mi fie prea greu, fiindca am tradus în 2004 prima formă, cea de la Frankfurt: www.cimec.ro/Metodologice/Catalogare.htm#Frank, deși forma de acum e de două ori mai lungă).

Problema mea acum: acuratețea traducerii formulărilor principiilor propriu-zise. De aceea le expun aici (preliminar), pentru a profita de eventualele critici.

Principiile, în versia mea, sunt:

2.1. Satisfacerea nevoilor de informare ale utilizatorului [convenience of the user]. Deciziile privind descrierile și formele controlate de apelațiuni din punctele de acces ar trebui luate din perspectiva utilizatorului.

2.2. Uzanța [common usage]. Vocabularul folosit în descrieri și acces ar trebui să fie conform cu cel al majorității utilizatorilor.

2.3. Reprezentativitatea [representation]. Descrierile și formele controlate ale numelor ar trebui să se bazeze pe felul în care o entitate se autodescrie.

2.4. Acuratețea [accurecy]. Entitatea descrisă ar trebui să fie înfățișată cu exactitate.

2.5. Suficiența și necesitatea [sufficiency and necessity]. Ar trebui incluse doar acele elemente ale descrierilor și ale formelor controlate de apela’iuni care sunt necesare operațiunilor utilizatorului și sunt esențiale pentru a identifica în mod unic o entitate.

2.6. Relevanța [significance]. Elementele informaționale ar trebui să fie semnificative din punct de vedere bibliografic.

2.7. Economia [economy]. Dacă există căi alternative de a atinge un obiectiv, ar trebui preferată calea care favorizează la maximum economia de ansamblu (i.e. costul cel mai redus sau abordarea cea mai simplă).

2.8. Coerența și standardizarea [consistency and standardization]. Descrierile și elaborarea punctelor de acces ar trebui să fie cât mai standardizate posibil. Aceasta asigură mai multă coerență care, la rândul ei, sporește posibilitățile de partajare a datelor bibliografice și de autoritate.

2.9. Tratarea unitară [integration]. Descrierile tuturor tipurilor de materiale și forme controlate de apelațiuni pentru toate tipurile de entități ar trebui să se bazeze pe un set comun de reguli, in măsura în care acesta este relevant.

Concizia principiilor face traducerea problematică. Mai ales din pricina mulțimii „falșilor prieteni”.

A doua problemă pe care aș vrea s-o expun (înainte de publicarea traducerii) este invenția adjectivului „subiectual/subiectuală”.  Adjectivul mi s-a părut convenabil în expresii precum „catalogarea subiectuală” pentru „subject cataloguing” (prin analogie cu „catalogare descriptivă” [descriptive cataloguing]) sau „tezaure subiectuale” pentru „subject thesauri”. Adjectivul e convenabil dar nu-s sigur că e „legitim”.

 

Actualizare (05.03.2009):

Prietana Florica Câmpeanu mi-a făcut câteva bune sugestii:

  • „reprezentativitate” în loc de „reprezentare”;
  • „exact înfățișată” în loc de „corect înfățișată”;
  • „semnificativitate” în loc de „însemnătate”.

Între timp văd că a apărut și versia franceză, care va fi de mare ajutor.

În povestea cu „subiectual”, încă nici Florica și nici Claudia nu m-au convins.  În calitate de terminolog (:-) sunt mare amator de neologisme. Dar ăsta n-ar fi un motiv suficient. Mie „subiectual” mi se pare sugestiv, iar „catalogarea pe subiecte” mi s-a părut totdeauna cam chinuit și — stilistic — șubred. Dacă am zice „catalogare pe materii” cum sugerează Florica, mă tem că tare puțină lume ar înțelege. Să ne mai gândim.

 

Actulizare (09.03.2009):

Colegele/colegii de la Brașov, mi-au făcut câteva bune sugestii. De pildă „relevanță” și „satisfacerea nevoilor de informare…”. Nu m-au convins cu toate sugestiile, dar nu-i timpul pierdut :-)

Pe de altă parte, m-am decis să folosesc „trebuie” pentru „must” și „ar trebui” pentru „should”.

Written by poliptic

1 martie 2009 at 8:17 pm

Postat in cataloage, catalogare

Din nou despre Catalogul Naţional Partajat (2): planurile de discuție

cu un comentariu

Revin la discuția despre Catalogul Național Partajat [CNP]. E și timpul: pe 18 februarie se discută subiectul la Comisia Națională a Bibliotecilor și vreau să expun (din vreme) poziția pe care o să susțin acolo.

Mi se pare că problema se poate discuta pe trei nivele: „politic”, tehnic/catalografic și tehnic/informatic. La primul nivel se răspunde la întrebarea: da sau nu CNP. La celelalte se discută cum să se facă CNP. 

 

A. Nivelul „politic” 

Considerente politice rezolvă problema dacă să se dezvolte un CNP (în sensul de bază de date centralizată, în care se cataloghează, i.e. nu doar un catalog colectiv !) sau nu. Deoarece: 

  1. CNP este un serviciu public util pentru toți cetățenii (i.e. și toți contribuabilii) – în plus vizibil („aici sunt banii dumneavoastră”);
  2. CNP evită risipa de ban public, prin minimizarea duplicării de efort de catalogare, 

răspunsul este: da, trebuie să se dezvolte/instituționalizeze un Catalog Național Partajat. Mai mult: pentru organizațiile care cataloghează pe bani publici, folosirea curentă a CNP-ului n-ar trebui să fie opțională. 

<paranteză>

Nu spun că „interogările federalizate” [federated search] nu au rost. Au mare sens pentru baze de date disjuncte, e.g. colecțiile online de reviste științifice (e-journals) furnizate de diverși furnizori, de pildă EBSCO, ABI/Inform, Blackwell Synergy, ERIC, JSTOR, LexisNexis, ScienceDirect, SpringerLink. E puțin probabil să găsești același articol în două asemenea baze de date.

</paranteză> 

A doua chestiune în care intervin considerente politice este: elaborarea unui soft nou sau achiziționarea unui soft comercial existent ? 

Deoarece este un serviciu public pe termen lung (prin care se administrează și întreține o resursă publică națională), CNP-ul are nevoie de un soft care să fie proprietate publică in integrum. Cu alte cuvinte, softul poate fi dezvoltat de o companie comercială, dar sursele sale trebuie să devină proprietate publică, iar dezvoltatorul trebuie să cesioneze (desigur, neexclusiv) statului drepturile de proprietate intelectuală asupra produsului. (Așa se întâmplă, de pildă, în cazul softului care se dezvoltă acum – în cadrul unui proiect Phare – pentru sistemul informatic de protecție a patrimoniului cultural mobil, în care sunt implicați Ministerul Culturii, Poliția, Vama și Poliția de Frontieră.)

 

B. Nivelul catalografic

 La nivel tehnic/catalografic, cred că CNP ar trebui să gestioneze metadatele bibliografice într-un format generic, în care: 

a) entitățile bibliografice să fie convertibile (fără pierdere de informație) în (cel puțin): 

ba chiar și în ROMARC :-) 

b) entitățile „de autoritate” și să fie convertibile (fără pierdere de informație) în (cel puțin): 

În plus, formatul generic ar trebui să asigure compatibilitatea cu FRBR  (i.e. să aibă scheme pentru lucrări și expresii). 

Desigur, natura însăși a catalogului va impune reguli unitare de catalogare. 

Deși CNP trebuie să fie o bază de date centralizată, cred că extensii locale ale înregistrărilor bibliografice partajate ar fi foarte utile (e.g. descriptori locali, confidențiali). 

 

C. Nivelul informatic 

Din punct de vedere informatic, CNP ar trebui să înglobeze cele mai noi tehnologii web (chiar webul semantic), deoarece un sistem dezvoltat acum, va trebui să fie (tehnologic) proaspăt încă cel puțin 10 ani. 

Prin urmare, tehnologii precum: 

  • linked data;
  • Z39-88 (i.e. OpenURL);
  • servicii web (pentru particularizări de interfețe, pe lângă o interfață generică);
  • WSRP (pentru furnizarea de date bibliografice unor portleturi care să poată fi incluse în portaluri diferite). 

ar trebui de la început să fie implementate în softul pentru CNP.

Written by poliptic

16 februarie 2009 at 1:14 am

Europeana.eu: „Incidentul românesc” și lecțiile lui

cu un comentariu

 

Ce este Europeana.eu (www.europeana.eu) ?

  Europeana - slogan

Descrierea „oficială” spune:

Europeana.eu — Biblioteca, Muzeul și Arhiva Digitală a Europei — este un proiect care a început în iulie 2007, având drept scop crearea prototipului unui sait care să ofere acces direct la circa două milioane de obiecte digitale (incluzând materiale filmate, fotografii, picturi, înregistrări sonore, hărţi, manuscrise, cărţi, ziare şi documente de arhivă).

Conţinutul digital al Europeana.eu va fi selectat din materialele deja digitizate şi disponibile online în muzeele, bibliotecile, arhivele şi colecţiile audio-vizuale ale Europei. Prototipul urmăreşte să expună conţinut reprezentativ provenind din toate aceste patru domenii ale patrimoniului cultural şi — totodată — provenind din întreaga Europă. Intenţia este ca, până în 2010, portalul Europeana.eu să ofere acces direct şi gratuit oricărui cetăţean, la peste şase milioane de cărţi, imagini, documente de arhivă, înregistrări sonore şi filme în format digital.

Ceva despre istoria proiectului se poate citi și în acest blog.

 

Doamna Viviane Reding (comisarul european pentru societatea informaţională şi mass-media) a „tăiat panglica” prototipului portalului Europeana.eu pe 20 noiembrie 2008, la Bruxelles, în prezenţa miniştrilor culturii din ţările membre ale Uniunii Europene (din România a participat secretarul de stat Demeter Andras). Lansarea publică a avut loc pe 27 noiembrie, la Paris (unde Preşedinţia franceză a Uniunii a organizat conferinţa „Numérisation du patrimoine culturel – Bibliothèque numérique européenne”, la Musée du quai Branly).

A doua zi după deschidere, portalul Europeana.eu, versiunea Beta (adică un prototip experimental) a fost închis din cauza unui număr record de accesări (zece milioane, se zice), care au blocat serverul. Redeschiderea a avut loc abia peste o lună, în jur de 20 decembrie 2008.

 

Pentru realizarea prototipului Europeana.eu s-a lansat, în iulie 2007, proiectul EDLnet [European Digital Library Network], la care au participat cel puţin câte o instituţie din fiecare ţară membră (din România, partenerul invitat a fost CIMEC – Institutul de Memorie Culturală). În 2008, partenerii din proiectul EDLnet au furnizat resurse culturale digitale care să fie expuse — experimental — publicului european prin acest portal. Miza este prezenţa patrimoniului cultural al fiecărui stat membru al Uniunii Europene în această „vitrină” a culturii europene.

Conform diverselor declaraţii oficiale (şi neoficiale), Comisia Europeană consideră această bibliotecă digitală principalul său proiect cultural, pentru următorii ani. Nimic surprinzător: fără îndoială este un proiect de mare importanţă şi semnificaţie atât culturală, cât şi politică.

   

Ce „știe” Europeana.eu

 Acum portalul, versiunea beta — accesibil public la adresa www.europeana.eu — permite căutarea după cuvinte-cheie (adică şiruri de caractere aflate, explicit, oriunde în conţinutul metadatelor unei resurse). Așa arată (acum) pagina lui natală:

  

clip_image004

  

De exemplu, la interogarea cu cuvântul-cheie „Europe” se obţin (acum: 31.01.2009) 152.870 de resurse digitale (texte, imagini, înregistrări audiovizuale, înregistrări audio). Observați că resursele audio n-au imagini-timbru (dar nici toate resursele imagini n-au încă).

  

clip_image006

La interogarea cu cuvântul-cheie „Europa”, se obţin 4.775 de resurse digitale (şi se poate observa că pe prima pagină apar şi trei resurse româneşti, provenite de la CIMEC):

  Interogarea "Europa"

În aceste interogări se văd binișor limitările curente ale portalului. De pildă nu „știe” că „Europe” și „Europa” e același lucru. Apoi, nu e limpede de ce piesele trimise de noi (i.e. CIMEC) apar la interogarea „Europa” (eu știu: în atributul „contributor” al acestor piese apare expresia „Şcoală din Europa centrală”; dar utilizatorul obișnuit, ar putea să afle asta doar mergând la detaliile piesei și apoi la contextul ei original, pe saitul CIMEC.)

Dar nu e grav ! Să nu uităm că acesta este un prototip ! Acest fapt a trecut cam neobservat de presă. Sigur, nici Comisia Europeană nu a subliniat suficient ca este (deocamdată) un experiment.

În practică, expunerea unei resurse culturale în Europeana.eu, presupune:

  • plasarea obiectului digital într-un „repozit” (i.e. un „depozit informatic”) naţional (la o adresă stabilă şi accesibilă permanent) — într-un format standard;
  • expedierea la Haga (locaţia portalului Europeana.eu) a fişei descriptive a respectivului obiect — într-un format standard — şi adresa lui (portalul se comportă ca un catalog de bibliotecă);
  • (eventual) plasarea fişei descriptive şi într-un portal naţional.

Diagramatic, un exemplu al acestui mecanism (statuia romană Şarpele Glycon de la Muzeul de Istorie Naţională şi Arheologie din Constanţa – în acest caz) este:

 

clip_image010

 

iar prezentarea resursei digitale respective în viitorul portal naţional va arăta nu foarte diferit de cum arată acum în lista bunurilor clasate (http://clasate.cimec.ro):

 

clip_image012

   

Ce se face în România ?

 Pentru a pune în practică un plan de perspectivă privind prezența românească în Europeana.eu, Ministerul Culturii şi Cultelor a elaborat la sfârşitul anului 2008 un Program naţional pentru digitizarea resurselor culturale naţionale şi crearea Bibliotecii Digitale a României — aprobat prin Hotărârea Guvernului nr. 1676 din 10/12/2008 — care permite demersuri coerente şi de durată pentru digitizarea patrimoniului românesc şi expunerea resurselor digitale astfel obţinute atât în Europeana.eu, cât şi în viitoarea Bibliotecă Digitală a României (probabil numită Culturalia.ro). Prin acest act, CIMEC – Institutul de Memorie Culturală a fost desemnat „agregatorul” naţional, cel ce administrează repozitul naţional de resurse culturale digitale şi asigură interfaţa dintre furnizorii de conţinut (instituţii publice sau alte organizaţii deţinătoare de resurse culturale din România) şi serviciul tehnic care gestionează portalul Europeana.eu. Organizaţional, Ministerul Culturii, Cultelor și Patrimoniului Național constituit cinci „piloni tematici” (cu comisiile de experţi aferente) pentru: patrimoniul scris (biblioteci), patrimoniu mobil (muzee), patrimoniu imobil (monumente şi arheologie), patrimoniul audio-vizual şi patrimoniul arhivistic.

Din punct de vedere practic,

  • până la 15 octombrie 2008 (termenul limită pentru 2008), CIMEC (în calitate de partener în proiectul european EDLnet) a constituit repozitul naţional şi a expus 3.299 de obiecte digitale (imagini de obiecte muzeale clasate provenite din baza de date a patrimoniului cultural naţional, administrată de CIMEC, prin urmare bunuri cu valoare deja confirmată de Comisia Naţională a Muzeelor, pentru care aveam şi imagini de calitate), a prelucrat (în formatul cerut) şi a expediat la Haga fişele descriptive pentru cele 3.299 de obiecte digitale.
  • s-au elaborat (și acum se experimentează) instrumente informatice care să permită prelucrarea resurselor digitale provenite de la pilonii patrimoniu mobil și patrimoniu imobil la „scară industrială”;
  • se lucrează la constituirea nucleului inițial al unui portal românesc (Culturalia.ro);
  • pentru fiecare pilon tematic în parte, comisiile de specialitate elaborează planuri care să stabilească ce se digitizează (și cu ce priorități);
  • pentru fiecare pilon tematic în parte, comisiile de specialitate elaborează metodologiile de fişare a obiectelor digitale.

În perspectivă (dacă totul merge bine şi va exista o susţinere financiară rezonabilă), din 2009 comunităţile profesionale se vor mobiliza:

  • să identifice, să fişeze şi să prelucreze resursele culturale deja digitizate (sistematic sau ocazional);
  • să digitizeze resurse culturale semnificative din patrimoniul naţional, să le fişeze și să le prelucreze;
  • să expună resursele astfel prelucrate atât în Europeana.eu, cât şi în Culturalia.ro.

Efortul va fi semnificativ: această integrare a resurselor culturale româneşti în contextul european impune o rigoare sporită şi cere — pe cât posibil — elaborarea de fişe descriptive şi în limbi de circulaţie. Însă această oportunitate majoră pentru imaginea României trebuie să fie valorificată.

 

„Incidentul românesc”

 Din păcate, la lansarea prototipului portalului Europeana.eu, la 20 noiembrie 2008, a apărut o situaţie neplăcută pentru România. La interogarea cu cuvântul-cheie „România” se obţinea următorul rezultat:

 

clip_image014

 

Chiar pe prima pagină a rezultatelor căutării, din cele 1.688 de rezultate (între care — după cum se vede în stânga — 1.482 provin din România), s-au nimerit 10 fotografii sinistre, cu copii din orfelinatele româneşti din 1990. Imaginile provin de pe un sait educațional scoţian (www.scran.ac.uk):

 

clip_image016

 

Desigur, nu era o conspiraţie. Dovadă: dacă se caută după cuvântul-cheie „României”, se obţineau:

 

clip_image018

 

adică 703 resurse, din care 697 provin de la CIMEC, iar pe prima pagină, din 12 resurse, 11 provin de la CIMEC.

Pe de altă parte, dacă se interoghează cu cuvântul-cheie „Roumanie”, se obţinea:

 

clip_image020

 

iar cu cuvântul-cheie „Rumänien”, se obținea:

 

clip_image022

 

Aşadar, nefericita situaţie este un simplu incident tehnic, datorat algoritmului de ordonare a obiectelor din rezultatul unei interogări (ranking algorithm). M-am interesat, desigur, și n-am aflat algoritmul complet. Dar, e sigur că resursele pentru care cuvântul-cheie căutat se găseşte explicit chiar în titlu au prioritate în listă, apoi urmează cele care au cuvântul-cheie în celelalte câmpuri (nu mi-e clar în ce ordine). În fine, resursele „echivalente” din punct de vedere al priorităților sunt sortate în ordinea inversă a introducerii în baza de date. Astfel, s-au conjugat următorii factori:

  • cuvântul-cheie „România” este transformat (automat) în „Romania” (unele caractere cu diacritice sunt convertite la caracterele de bază respective);
  • cuvântul „Romania” se află în titlurile acelor nefericite fotografii (e.g. „Children in Romania”);
  • puține dintre resursele trimise de noi aveau cuvântul „România” în titlu (mult mai multe aveau cuvântul „României”);
  • s-a întâmplat ca imaginile provenite de la Scran să fie introduse în baza de date mai târziu decât cele trimise de CIMEC.

Din păcate, situaţia a fost imediat observată în România şi a provocat — previzibil — o (prea) vie emoţie, cu accente de indignare (iar eu am primit și reproșuri, vagi, e adevărat).

Am semnalat situaţia administratorilor portalului (la Haga) încă din noaptea de 20 noiembrie (când — de altfel — saitul a fost închis, pe considerent că n-a făcut faţă marelui număr de accese), solicitând o remediere. Nu am cerut — desigur — să fie cenzurate imaginile incriminate, ci doar să fie mai „uniform” repartizate printre celelalte resurse rezultate în urma interogării cu „România”. Ba chiar, după câteva zile, am sugerat şi o soluţie tehnică simplă, „de avarie”. Din păcate, echipa de la Haga a neglijat pe moment problema (şi nici nu ne-a explicat la vreme cauzele întâmplării; între timp s-au scuzat că au fost plecați în concedii etc.), astfel că, la jumătatea lui decembrie — când saitul a fost repus online, fără tam-tam de astă dată — am constatat că nimic nu se schimbase.

Am încercat în repetate rânduri să contactăm echipa tehnică (chiar cu mesaje ce ameninţau voalat cu plângeri la CE) dar, poate din pricina sărbătorilor, n-am reuşit să obţinem nici o reacţie. Abia după 1 ianuarie am obţinut promisiunea unei abordări a problemei. Iar apoi, adică pe 6 ianuarie, a izbucnit scandalul în media românească şi acesta a ajuns iute la Comisia Europeană (prin intermediul comisarului Leonard Orban). Ca urmare a presiunilor de la Bruxelles, managementul proiectului (de altfel persoane de calitate şi competente) a reacţionat şi s-a găsit rapid o posibilă soluţie, dar care implica un efort tot din partea românilor: să mai trimitem (de urgenţă) un lot de obiecte digitale, astfel încât acestea, având o dată mai recentă de trimitere, să apară în primele pagini, conform algoritmului de ordonare actual din Europeana.eu.

Prin urmare, în 8 şi 9 ianuarie s-a lucrat foarte intens la CIMEC şi s-au pregătit alte peste 8.000 de înregistrări de bunuri culturale din patrimoniul naţional, și au fost trimise la Haga (de data asta, din păcate, cu imagini de mai slabă calitate, aşa cum se găsesc ele în dosarele de clasare în patrimoniul național). Astfel, acum, la interogarea „România” se obține:

 

clip_image024

 

Sigur, e cam bizar cum s-au grupat 8 scaune în primele 12 resurse. Dar i-am bodogănit deja destul pe amicii de la Haga…

Această situaţie putea fi — în cea mai mare măsură — evitată, dacă problema ar fi fost tratată serios de la început de echipa de la Haga, pentru că efortul de la începutul lui ianuarie puteam să-l facem la fel de bine și la sfârşitul lui noiembrie.

Ca o ironie, ia vedeți ce apare la interogarea „Hitler” (la 1.02.2009):

 

clip_image026

 

Primul exponat e un portret al lui Hitler pictat de un român (adevărat, mai celebru în Franța decât în România), încă din 1934 !

 

Problemele

 Acest incident a scos mai bine în evidență problemele proiectului Europeana.eu, cel puțin așa cum apar ele din perspectiva mea. Cele majore ar fi:

  • Biblioteca, muzeul și arhiva digitală a Europei n-ar trebui să fie un proiect finanțat din programe europene, adică discontinuu și incert. Europeana.eu ar trebui să fie un serviciu public, asigurat de o agenție europeană, finanțată continuu și adecvat (de altfel, acest serviciu ar utiliza cum nu se poate mai onorabil banii publici europeni).
  • Proiectul EDLnet a fost un proiect remarcabil de modest finanțat: a avut un buget de circa 1,5 milioane de euro, la o durată de 18 luni. Continuarea sa din cadrul programului eContentPlus, proiectul Europeana 1.0 (care-și propune realizarea serviciului operațional adevărat), are prevăzut un buget de câteva milioane de euro, pe o durată de 3 ani. Prin urmare, dacă CE declară că acesta este proiectul ei cultural major, de ce îl finanțează așa de precar ?
  • De altfel, cu ocazia acestui proiect s-au pus în evidență și unele deficiențe ale programelor europene, și anume lipsa de coordonare și de concentrare, atunci când acestea se dovedesc necesare. Astfel, între 2005 și 2008, CE se mândrește că a cheltuit circa 60 milioane de euro pentru proiecte legate de biblioteci digitale, dar atunci când a fost nevoie de o platformă informatică pentru o bibliotecă digitală adevărată, acesta a trebuit să fie — practic — improvizată în 6 luni, cu o echipă de dezvoltare de 3-4 oameni.
  • Europeana.eu ar trebui să revină la spiritul ei originar (așa cum a fost el sugerat, la începuturi, prin contrast cu „concurența”, i.e. Google Books Search, și anume o resursă cu material atent selectat, pe baza „semnificației culturale”. Cu alte cuvinte, se presupunea că vom expune în Europeana.eu doar resurse culturale cu adevărat semnificative (pentru a evita cuvântul „valoroase”). Or, în acest moment, deoarece pe parcurs a apărut ambiția de a expune (într-un prototip experimental !) peste 2 milioane de obiecte digitale, selecția materialului a fost — practic — abandonată. Cantitatea a doborât calitatea. La ce ne folosește ? Oricum, la cantitate Google ne va depăși cu mult.
  • Nu e OK să se expună resurse în Europeana fără, sau cu foarte puțină „interpretare”. Multe dintre resursele expuse au acum fișe descriptive cu totul rudimentare și deci, sunt lipsite de „context”. Sigur, un peisaj poate că n-are nevoie de multă „interpretare”. Dar „Mein Kampf” — de pildă — poate fi expus așa, pur și simplu ?
  • Prototipul este încă rudimentar, iar aceasta se trage — după mine — mai ales din rudimentaritatea metadatelor (un fel de Dublin Core, ușor extins). Fără „fișiere de autoritate”, căutarea o să dea mereu rezultate precare. Acum, sistemul nu „știe” că Firenze, Florența și Florence e același lucru, sau că (Firenze, Florența, Florence) e parte a (Italia, Italy, Italie).
  • Monolingvismul de facto al fișelor nu e acceptabil, pe termen lung. Desigur e o problemă grea de tot, dar nu poate fi amânată prea mult.

De altfel, la a 4-a reuniune a Grupului de Experți în Digitizare al Statelor Membre (Luxemburg, 29.01.2009), am sugerat formarea unui „consiliu editorial” al Europeana.eu, care să stabilească „regulile jocului”. Prima reacție a unui reprezentant al Comisiei Europene (de altfel o persoană foarte bine) a fost negativă, pe considerent că Europeana nu ar trebui să fie „cenzurată”, și că — de altfel — materialele sunt propuse de instituții culturale, deci … Nu era timp de multe discuții (și poate nici nu era locul potrivit), așa că n-am insistat. Eu cred că un asemenea consiliu ar trebui să filtreze nu atât ce se expune, cât cum se expune. În orice caz, o să încerc să conving ministerul nostru să insiste pe această idee.

Pe de altă parte, în chestiunea traducerilor, sunt conștient că tot noi, vorbitorii de „limbi mici”, avem de lucru. Dacă vrem să ne „vadă” mai multă lume, trebuie să ne traducem fișele în englezește, franțuzește, nemțește. Pe când, dacă vrem ca românofonii să „vadă” resursele britanice, franceze, germane, tot noi o să trebuiască să le traducem în românește. C’est la vie…

Pour terminer, Europeana.eu mi se pare un demers de toată lauda. Nu numai că ar putea fi în sine un serviciu cultural paneuropean realmente important și semnificativ (care ar întări sentimentul unității culturii europene !), dar ne-ar obliga și pe noi, operatorii culturali, ca, la noi acasă, să fim mai riguroși și mai grijulii cu resursele noastre digitale. Tocmai de aceea, abordarea lui ezitantă mi se pare regretabilă.

Written by poliptic

1 februarie 2009 at 4:30 pm

Din nou despre Catalogul Naţional Partajat (1): catalogarea partajată

cu un comentariu

Din fericire, Comisia Naţională a Bibliotecilor [CNB] a relansat discuţia despre Catalogul Naţional Partajat [CNP]. Aud că iniţiativa CNB a provocat şi o discuţie pe acest subiect la Asociaţia Bibliotecarilor din România [ABR] (deşi sunt membru, n-am auzit nimic „oficial”; era — probabil — numai pentru „inner circle”; nu ştiam că-n ABR sunt două categorii de membri !). Foarte bine ! Era şi vremea. Sper ca şi Ministerul Culturii să reia ideea de a finanţa proiectul (finanţare întreruptă — reamintesc — la jumătatea lui 2005).

Suntem câţiva „membri asociaţi” ai CNB şi, în această calitate, am primit spre comentare o propunere a dnei. Doina Ostafe. Cel mai bun „comentariu” la care m-am putut gândi a fost reluarea propunerii Asociaţiei Naţionale a Bibliotecarilor şi Bibliotecilor Publice din România [ANBPR] de acum mai bine de trei ani, (foarte) uşor adusă la zi. Zic uşor, fiindcă şi-a păstrat toate calităţile. E la fel de actuală (doar că mai urgentă) ca în 2005.

Şi fiindcă în mediile bibliotecare din România partajarea catalogării a fost mereu — de fapt — respinsă, cred că merită să se reia argumentarea pro.

De fapt nu mi-a fost niciodată limpede care sunt raţiunile profunde pentru care un catalog partajat naţional este respins. Mă tem că e o combinaţie de complexe de superioritate cu complexe de inferioritate, adică o neîncredere în ce fac alţii, combinată cu temerea că ne văd şi alţii erorile. Dă Doamne să mă înşel. Drept că mai aud şi argumente de genul: de ce să beneficieze şi alţii de munca noastră ? Dar acest argument se aduce pe şoptite: de fapt, cei care-l folosesc ştiu că prestează un serviciu public, deci e natural să beneficieze şi alţii.

În orice caz, cred — mai mult ca oricând — că un catalog naţional partajat (centralizat) este necesar.

Eu, în calitate de reprezentant al CIMEC, am şi un interes direct: noi avem de făcut catalogul colectiv al cărţii vechi. Poate în 2009 reuşim să terminăm (în mare) cartea românească până la 1830. Mai e mult de lucru la „transilvanice”, iar cartea străină (cu excepţia incunabulelor) nici nu e încă abordată. Sunt câteva zeci de mii de exemplare de prelucrat. E nevoie de un efort colectiv, ca să se termine într-un interval rezonabil. Acum n-avem un instrument informatic decent nici pentru a expune pe Net ceea ce e deja catalogat, darmite pentru a cataloga.

A. Argumentul economic, i.e. economia la catalogare

Dacă argumentul privind calitatea sporită a informaţiei catalografice pe care o oferă un catalog partajat nu e destul de convingător (deşi mie mi s-ar părea suficient), atunci o să recurg la (antipaticul) argument economic. Şi am de gând să pedalez intens pe el.

Plecăm de la premiza că majoritatea bibliotecilor din România sunt finanţate din banul public. Mă tem că e o premiză greu de contestat. Aşadar, şi o covârşitoare parte a catalogării (în care includ şi indexarea, clasificarea, cum convenim să-i spunem) se face pe bani publici.

Catalogând local se risipesc bani publici: dacă se achiziţionează un titlu în 100 de biblioteci, se fac 100 de fişe pentru acel titlu. Deci, de 99 de ori se duplică munca catalogatorului care a elaborat primul fişa cărţii. Adică se risipesc bani publici de 99 de ori. Mi se pare important ca finanţatorii bibliotecilor să ştie acest lucru.

Prin contrast (sigur, simplificând, dar nu prea mult), într-un catalog partajat naţional, prima fişă (cronologic vorbind) elaborată pentru un titlu este reutilizată de toţi cei care au de catalogat acelaşi titlu. Chiar dacă o mai ajustează/îmbăgăţesc/corectează, toţi fac economie de timp. Ca să nu mai vorbim că fişa poate fi elaborată (chiar dacă într-o formă preliminară) chiar de editor, şi astfel se mai economiseşte ceva timp (chiar dacă catalogatorii nu au încredere în datele bibliografice ale editorilor — de multe ori cu îndreptăţire —, tot se poate „recupera” ceva din fişele lor, titlul de pildă). Pe scurt, randamentul catalogatorilor creşte dramatic dacă se foloseşte un catalog partajat centralizat. Şi n-am nici o emoţie: catalogatorii nu-s în primejdie să rămână fără slujbe. După câte ştiu eu, retroconversiile o să dureze cel puţin două generaţii. (Iar dă Doamne să mă înşel.)

Mai mult, fişierele de autoritate ar trebui să fie partajate de biblioteci, muzee şi arhive, pentru a reduce şi mai mult duplicările de efort (deci risipa de ban public).

B. Argumentul interesului public

Un catalog naţional partajat este — implicit — un catalog colectiv naţional. În această postură, el oferă un serviciu public valoros: facilitează împrumutul interbibliotecar. Acum — după cum bine ştim — împrumutul interbibliotecar în România funcţionează rudimentar, mai ales din pricină că e greu pentru o bibliotecă să afle cine are cartea de care are nevoie clientul. Adică lipseşte catalogul colectiv naţional.

În al doilea rând, un catalog colectiv ar putea oferi (precum Google Book Search) trimiteri la saiturile editorilor, pentru cărţile care sunt de vânzare. Prin urmare ar fi şi în interesul editorilor (şi cumpărătorilor).

În al treilea rând, un catalog colectiv (făcut cu tehnologiile contemporane) ar putea fi o bună bază pentru realizarea/întreţinerea de cataloage ale bibliotecilor personale (precum LibraryThing, care are deja peste 34 de milioane de cărţi catalogate !). Şi aici am un interes direct (am început să uit ce cărţi am; nu atât din pricina numărului de cărţi, cât din pricina numărului de ani). Sunt sigur că 99,8% din cărţile pe care le am în casă sunt deja catalogate undeva în ţară. Deci, având acces la catalogul naţional, ar trebui să cataloghez eu însumi doar 0,2% din cărţile pe care le am.

Mai mult, e uşor de imaginat un mecanism prin care utilizatorii (elevii, studenţii, cercetătorii, autorii) să fie ajutaţi să-şi întocmească bibliografiile ataşate lucrărilor pe care le redactează. Înregistrările bibliografice pe care nu le găsesc gata elaborate, ar trebui să şi le elaboreze singuri, acestea rămânând în catalog şi pentru uzul altora. Ştiu: catalogatorii au oroare de datele furnizate de „amatori”. Dar n-ar fi nici o dificultate ca înregistrările furnizate de „amatori” să fie marcate distinct (de exemplu puse pe fond roşu), până la validarea de către un „profesionist”.

Nu sunt oare suficiente aceste argumente ?

Aspectele tehnice merită altă discuţie.

Written by poliptic

26 decembrie 2008 at 12:27 pm

Postat in cataloage, catalogare

IFLA propune o zonă O ISBD şi invită la comentarii

leave a comment »

IFLA ne invită să comentăm (până pe 30 ianuarie) propunerea de Zonă 0  ISBD (forma conţinutului şi a tipului de suport).

Mi se pare important, ca idee şi ca demers de standardizare terminologică.

Textul englezesc (însoţit de exemple) se află la www.ifla.org/VII/s13/isbdrg/ISBD_Area_0_WWR.htm.

Am stat câteva ceasuri şi am produs o ciornă de traducere românească. M-ar bucura sugestii de corecţii.

Aşa, la prima impresie, nu-mi convine recomandarea ca termenii să fie asignaţi în limba agenţiei catalografice. ce ne facem cu cataloagele internaţionale ? Ar fi preferabil (după mine) să se recomande asignarea de concepte (în loc de termeni), iar OPAC-urile să facă bine să aleagă automat termenii în limba utilizatorului.

Written by poliptic

14 decembrie 2008 at 12:34 am

Postat in catalogare, indexare