Chestiuni documentaristice (inclusiv bibliologice)

Dan Matei (care îşi dă şi el cu părerea).

O metodologie de indexare (pentru următorii 10 ani ?)

cu un comentariu

Iertare: urmează un post lung cât o zi de post (dar cu poze !).

 

1. Context

 Zilele astea (5 – 6 iunie) s-a discutat la Biblioteca Naţională „Ghidul de indexare LIVES-Ro”  (adaptarea românească a „Guide d’indexation RAMEAU”, redactat de Biblioteca Naţională a Franţei).

 Am participat doar la discuţiile despre subdiviziunile de formă (continuare a discuţiilor de la sesiunea secţiei de indexare a ABR de la Iaşi) şi la prezentarea de către Monica Achiri a schemei de indexare FAST: Faceted Application of Subject Terminology.

 Au fost suficiente „subdiviziunile de formă” pentru a se ajunge la problema fundamentală: care să fie maniera de indexare în bibliotecile româneşti, în viitor ? Şi, premiza mea — sugerată în titlul postul — este că ceea ce alegem acum, alegem pentru cel puţin 10 ani. Aşadar, trebuie să fim atenţi şi să alegem ce e mai avansat, nu ce e deja demodat, dar supravieţuieşte prin inerţie.

 

2. Teza (de la bun început)

 Cred că:

ar trebui să deconstruim complet ghidul de indexare RAMEAU şi să (re)construim unul complet nou, bazat pe tehnologiile contemporane.

Şi asta fără să ţinem seama (i.e. să fim inhibaţi) de capabilităţile softurilor prezente acum pe piaţă. Şi fără să fim marcaţi de „paradigma MARC”. Mai mult:

 simultan, ar trebui să elaborăm şi cerinţele minimale pentru softurile care:

  1. permit maniera de indexare care ar rezulta şi
  2. pun în valoare acea indexare în OPAC.

Tot de la bun început, mă declar un ferm susţinător al tradiţionalilor descriptori precoordonaţi („vedete de subiect”, cum — restrictiv — li se mai spune) şi îmi exprim opoziţia fermă faţă de „relaxarea” lor propusă de schema FAST (care, propune o degradare a indexării, prin parţiala „coborâre” la simpla asignare de cuvinte-cheie, într-o — vană, după mine — speranţă că prin coborârea standardelor va creşte calitatea şi productivitatea).

[paranteză]

Ironic: şi la noi unii bibliotecari sunt îngrijoraţi de costul ridicat al catalogării/indexării profesionale. În acelaşi timp, nu aud bibliotecari dornici să economisească prin catalogare partajată !

[/paranteză]

[paranteză]

Folosesc prilejul pentru a declara că — (cel puţin) în materie de biblioteconomie — sunt un „conservator progresist” (am furat expresia „progressive conservative” din numele unui fost partid canadian).

[/paranteză]

 

3. Cum şi cu ce să indexăm ?

Să rememorăm: de ce sunt buni descriptorii precoordonaţi (i.e. lanţuri de descriptori simpli) ? Păi pentru că:

  1.  împiedică falsa coordonare (fenomen frecvent în cazul căutării postcoordonate);
  2. permit colocarea elegantă a subiectelor/obiectelor în index, deci o baleiere sistematică;
  3. dau căutătorului o idee asupra subiectelor resursei pe care o indexează (mult mai bună decât cea dată de o simplă succesiune de cuvinte-cheie izolate).

Mi se par motive temeinice să-i păstrăm. Desigur, nu pot fi impuşi, ci doar recomandaţi şi elaborarea lor facilitată. Dar aş fi furibund împotriva unor softuri care să-i interzică !

Aşadar, separată pe două planuri, propunerea mea este:

A. La momentul indexării:

Indexatorul să fie liber (aproape total) în construirea descriptorului, cu alte cuvinte să fie (aproape total) liber în alegerea  elementelor pe care să le precoordoneze.

[paranteză]

Aş fi foarte mulţumit dacă s-ar admite prefixarea fiecărui element (ezit să folosesc „termen”; o să explic mai jos de ce) cu un rol, aşa cum se făcea în defuncta (dar geniala) schema de indexare a lui Derek Austin, numită PRECIS [Preserved Context Indexing System].

[referinţă]

Lucrarea originară (ediţia a II-a):

Austin, Derek William; Dykstra, Mary. PRECIS: A manual of concept analysis and subject indexing. — London : British Library Bibliographic Services Division, 1984

Maximum ce-am găsit online:

www.musiclibraryassoc.org/BCC/BCC-Historical/BCC95/95WGFAM2.html

http://dlist.sir.arizona.edu/1764/01/SIG-CR2004Kwasnik.pdf

[/referinţă]

De altfel, cam aşa imaginasem — grupul în care lucram — în anii ‘80, aşa zisele „fraze de indexare FOCUS”. Din păcate „frazele de indexare” au rămas doar pe hârtie. Păcatele tinereţii…

[/paranteză]

 

B. În prealabil:

Să construim un „sistem de organizare a cunoştinţelor” [SOC] complex (mai complex decât RAMEAU !), de fapt o ontologie, în care să comasăm toate fişierele de autoritate (existente sau doar râvnite), şi care să furnizeze indexatorului „prefabricatele” convenabile pentru construirea descriptorilor precoordonaţi.

 

4. Fabulaţiune despre cum să fie „sistemul de organizare a cunoştinţelor” (adică ontologia)

[paranteză]

Definiţia clasică a sistemelor de organizare a cunoştinţelor, după Gail Hodge: 

The term knowledge organization systems is intended to encompass all types of schemes for organizing information and promoting knowledge management. Knowledge organization systems include classification and categorization schemes that organize materials at a general level, subject headings that provide more detailed access, and authority files that control variant versions of key information such as geographic names and personal names. Knowledge organization systems also include highly structured vocabularies, such as thesauri, and less traditional schemes, such as semantic networks and ontologies. Because knowledge organization systems are mechanisms for organizing information, they are at the heart of every library, museum, and archive.

 

Termenul „sisteme de organizare a cunoştinţelor” este menit să acopere toate tipurile de scheme pentru organizarea informaţiei şi promovarea managementului cunoştinţelor. Sistemele de organizare a cunoştinţelor includ schemele de clasificare şi de categorizare (?) care organizează materialele la nivel general, vedetele de subiect care oferă un acces mai fin şi fişierele de autoritate care gestionează diferitele versiuni informaţiilor-cheie, cum ar fi numele geografice şi numele personale. Sistemele de organizare a cunoştinţelor includ şi vocabularele înalt structurate, cum ar fi tezaurele, ca şi scheme mai puţin tradiţionale, precum reţelele semantice şi ontologiile. Deoarece sistemele de organizare a cunoştinţelor sunt mecanisme pentru organizarea informaţiei, ele se află în nucleul fiecărei biblioteci, fiecărui muzeu şi fiecărei arhive.

 

Hodge, G. (2000). Systems of Knowledge Organization for Digital libraries. Beyond traditional authority files. Washington, DC: the Council on Library and Information Resources.

 

Şi definiţia ontologiei după Tom Gruber:

 

Cea clasică (1992) – http://www-ksl.stanford.edu/kst/what-is-an-ontology.html

 

An ontology is a specification of a conceptualization.

 

O ontologie este o specificare a unei conceptualizări.

 

Ediţia recentă (2007) – http://tomgruber.org/writing/ontology-definition-2007.htm 

In the context of computer and information sciences, an ontology defines a set of representational primitives with which to model a domain of knowledge or discourse.  The representational primitives are typically classes (or sets), attributes (or properties), and relationships (or relations among class members).  The definitions of the representational primitives include information about their meaning and constraints on their logically consistent application.  In the context of database systems, ontology can be viewed as a level of abstraction of data models, analogous to hierarchical and relational models, but intended for modeling knowledge about individuals, their attributes, and their relationships to other individuals.  Ontologies are typically specified in languages that allow abstraction away from data structures and implementation strategies; in practice, the languages of ontologies are closer in expressive power to first-order logic than languages used to model databases.  For this reason, ontologies are said to be at the “semantic” level, whereas database schema are models of data at the “logical” or “physical” level.  Due to their independence from lower level data models, ontologies are used for integrating heterogeneous databases, enabling interoperability among disparate systems, and specifying interfaces to independent, knowledge-based services.  In the technology stack of the Semantic Web standards, ontologies are called out as an explicit layer.  There are now standard languages and a variety of commercial and open source tools for creating and working with ontologies. 

În contextul informaticii şi a ştiinţei informaţiei (aşa se zice pe româneşte ?), o ontologie defineşte un set de primitive reprezentaţionale, cu care să se modeleze un domeniul al cunoaşterii sau al discursului. Primitivele reprezentaţionale tipice sunt clasele (sau seturile), atributele (sau proprietăţile) şi relaţionările (sau relaţiile între membrii claselor)… 

(iertare: mi-e lene să traduc mai departe; e tehnic şi nu-mi foloseşte aici)

[/paranteză]

 

Aşadar, entităţile ontologiei ar trebui să fie: 

  •  concepte
  • clase
  • persoane
  • colectivităţi
  • locuri geografice
  • entităţii temporale
  • situaţii (asocieri de mai multe entităţi):
  • entităţi geo-politice
  • evenimente
  • identităţi bibliografice
  • situaţii cu nume (e.g. „cearta universaliilor”)
  • situaţii (fără nume), e.g. subiecte, clase
  • lucrări
  • expresii 

Din entităţile grupului 1 FRBR, n-aş băga în ontologie (convenţional): 

  • manifestările
  • exemplarele 

care — să zicem — să rămână „obiectele bibliografice”. Deşi, atât manifestările cât şi exemplarele pot fi foarte bine subiecte de lucrări. 

Ca să-mi ilustrez propunerea, o să folosesc un exemplu. Să zicem că am de catalogat/indexat: 

Varşovia : Insurecţia din 1944 / Norman Davies ; Traducere din limba engleză de Diana Elena Puşcaşu. — Bucureşti : RAO International Publishing Company, 2008. — ISBN 978-973-103-493-5 

Văd că-i o traducere; găsesc repede la OCLC, în WorldCat zece manifestări (i.e. ediţii; văd că există două expresii, ambele de limbă engleză: text şi audioînregistrare) şi o aleg pe cea care-mi pare a fi prima (presupun că titlul ei e şi al lucrării): 

Rising ‘44 : the Battle for Warsaw / Norman Davies. — London : Macmillan, 2003. — ISBN 0333905687 9780333905685 

Există deja cel puţin două expresii ale lucrării, aşa că merită să fac o înregistrare de lucrare, două de expresie şi înregistrarea manifestării al cărei reprezentant îl am în mână. Să zicem: 

„Rising '44”

fig. 1

[lucrare]

id w-1
titlu [en] Rising ‘44 : the Battle for Warsaw
titlu [ro] Insurecţia ‘44 : bătălia pentru Varşovia
autor p-1 (i.e. “Norman Davies”)
tip text
gen non-ficţiune

 

[expresie]

id e-1
realizează w-1 (i.e. „Rising ‘44 : the Battle for Warsaw”)
limba en

 

[expresie]

id e-2
realizează w-1 (i.e. „Rising ‘44 : the Battle for Warsaw”)
limba română
traducător p-2 (i.e. “Diana Elena Puşcaşu”)

 

[manifestare]

id m-1
încorporează e-2
titlu şi m.r. Varşovia : Insurecţia din 1944 / Norman Davies ; Traducere din limba engleză de Diana Elena Puşcaşu

  

[persoană]

id p-1
signatură Norman Davies (istoric englez) (1938 – )

 

[persoană]

id p-2
signatură Diana Elena Puşcaşu (traducătoare)

  

Acum mai trebuie să asignez lucrării (nu manifestării ! — conform filozofiei FRBR) subiectele. Să presupunem că în ontologia pe care o am la dispoziţie, am:

 

fragment de ontologie

fig. 2 

[entitate geopolitică]

id egp-1
apelaţiune [ro] România
apelaţiune [en] Romania

  

[entitate geopolitică]

id egp-2
apelaţiune [ro] Polonia
apelaţiune [en] Poland

 

[clasă]

id c-1
termen >> [ro] istorie
termen >> [en] history

 

[clasă]

id c-2
termen >> [ro] războaie
termen >> [en] wars
subclasă a c-1 (i.e. “istorie”)

 

[situaţie]

id s-1
componentă egp-1 (i.e. “România”)
componentă c-1 (i.e. “istorie”)

 

[situaţie]

id s-2
componentă egp-2 (i.e. “Polonia”)
componentă c-1 (i.e. “istorie”)

 

[eveniment]

id ev-1
apelaţiune [ro] Al Doilea Război Mondial (1939-1945)
apelaţiune [en] WW II (1939-1945)
membru a c-2 (i.e. “războaie”)

 

[situaţie]

id s-3
componentă ev-1 (i.e. “Al Doilea Război Mondial”)
componentă s-1 (i.e. “România <> istorie”)

 

[situaţie]

id s-4
componentă ev-1 (i.e. “Al Doilea Război Mondial”)
componentă s-2 (i.e. “Polonia <> istorie”)

 

[eveniment]

id ev-2
apelaţiune [ro] Lovitura de stat de la 23 august 1944
apelaţiune [en] The August 23 Coup d’état
apelaţiune [en] King Michael Coup (August 23, 1944)
parte a s-3 (i.e. “România <> Al Doilea Război Mondial”)

 

[eveniment]

id ev-3
apelaţiune [ro] Insurecţia varşoviană (august – octombrie 1944)
apelaţiune [en] Warsaw Uprising (August – October 1944)
parte a s-4 (i.e. “Polonia <> Al Doilea Război Mondial”)

 

Note: 

  1. În cazul claselor (e.g. “istorie”, “războaie”) situaţia e mai complicată. Termenii (substantive comune) prin care sunt designate sunt entităţi distincte (o să revin mai jos); de asta i-am prefixat în diagramă cu “>>”.
  2. Fiindcă în cazul unor situaţii ordinea componentelor nu e fixă, am vrut să sugerez asta prin conectorul “<>” (în loc de “–”).
  3. Ca să scot în evidenţă faptul că „neutralitatea faţă de limbă” (i.e. multilingvismul) e important în acest context, am consemnat apelaţiuni în două limbi pentru entităţile primare.
  4. Notez că la evenimentul „23 august” i-am consemnat două apelaţiuni sinonime în englezeşte, ca să semnalez că îmi doresc şi această (foarte posibilă) facilitate.
  5. Entitatea „istorie” am considerat-o aici o clasă (în sensul de „mulţimea evenimentelor istorice”). De fapt are o natură dublă, i.e. e şi un concept. 

Aşadar, mă folosesc de evenimentul ev-3, gata predefinit, pe care-l asignez ca subiect lucrării mele: 

Norman Davies. Insurecţia ‘44 : bătălia pentru Varşovia

Insurecţia varşoviană (august – octombrie 1944) [despre] 

Acum, apelaţiunea lui poate apărea în prezentarea tuturor manifestărilor lucrării cu pricina, subiectul fiind „moştenit” de toate expresiile şi manifestările unei lucrări: 

Varşovia : Insurecţia din 1944 / Norman Davies ; Traducere din limba engleză de Diana Elena Puşcaşu. — Bucureşti : RAO International Publishing Company, 2008. — ISBN 978-973-103-493-5.

Insurecţia varşoviană (august – octombrie 1944) [despre] 

 

Rising ‘44 : the Battle for Warsaw / Norman Davies. — London : Macmillan, 2003. — ISBN 0333905687 9780333905685

Insurecţia varşoviană (august – octombrie 1944) [despre] 

Notez en passant că, dacă nu aveam predefinit evenimentul, ar fi trebuit să pot să-l definesc şi să-l introduc în ontologie (vreau să zic că indexatorul trebuie să aibă posibilitatea să propună extensii ale ontologiei, chiar dacă, în practică, decizia lui poate fi schimbată de indexatorii „seniori” care — se presupune —supervizează ontologia). 

 

5. Fabulaţiune despre cum să se prezinte indexul de descriptori 

Spuneam mai sus, că unul dintre atuurile majore ale descriptorilor precoordonaţi este — după mine — posibilitatea de baleiere elegantă a indexului, pe care o oferă. Acum, mergând pe exemplul dat, să vedem cum ar putea un soft deştept să prezinte indexul, pe baza informaţiilor pe care le are din ontologie. Astfel, folosind doar signaturile în româneşte şi permutând componentele, un index „clasic” ar fi:  

 

Al Doilea Război Mondial (1939 – 1945)

Al Doilea Război Mondial — Polonia

Al Doilea Război Mondial — Polonia — Insurecţia varşoviană

Al Doilea Război Mondial — România

Al Doilea Război Mondial — România — Lovitura de stat de la 23 august 1944

Insurecţia varşoviană (august – octombrie 1944)

istorie

istorie — războaie

istorie — războaie — Al Doilea Război Mondial

istorie — războaie — Al Doilea Război Mondial — Polonia

istorie — războaie — Al Doilea Război Mondial — Polonia — Insurecţia varşoviană

istorie — războaie — Al Doilea Război Mondial — România

istorie — războaie — Al Doilea Război Mondial — România — Lovitura de stat de la 23 august 1944

istorie — Polonia

istorie — Polonia — războaie

istorie — Polonia — războaie — Al Doilea Război Mondial

istorie — Polonia — războaie — Al Doilea Război Mondial — Insurecţia varşoviană

istorie — România

istorie — România — războaie

istorie — România — războaie — Al Doilea Război Mondial

istorie — România — războaie — Al Doilea Război Mondial — Lovitura de stat de la 23 august 1944

Lovitura de stat de la 23 august 1944

Polonia

Polonia — istorie

Polonia — istorie — războaie

Polonia — istorie — războaie — Al Doilea Război Mondial

Polonia — istorie — războaie — Al Doilea Război Mondial — Insurecţia varşoviană

războaie

războaie — Al Doilea Război Mondial

războaie — Al Doilea Război Mondial — Polonia

războaie — Al Doilea Război Mondial — Polonia — Insurecţia varşoviană

războaie — Al Doilea Război Mondial — România

războaie — Al Doilea Război Mondial — România — Lovitura de stat de la 23 august 1944

România

România — istorie

România — istorie — războaie

România — istorie — războaie — Al Doilea Război Mondial

România — istorie — războaie — Al Doilea Război Mondial — Lovitura de stat de la 23 august 1944

 

Iar o prezentare mai bună ar fi: 

 

Al Doilea Război Mondial (1939 – 1945) [n1 resurse]

                Polonia [n1-1 resurse]

                                Insurecţia varşoviană  [n1-1-1 resurse]

                România [n1-2 resurse]

                                Lovitura de stat de la 23 august 1944 [n1-2-1 resurse]

Insurecţia varşoviană (august – octombrie 1944) [n2 resurse]

istorie [n3 resurse]

                războaie [n3-1 resurse]

                                Al Doilea Război Mondial [n3-1-1 resurse]

                                                Polonia [n3-1-1-1 resurse]

                                                                Insurecţia varşoviană [n3-1-1-1-1 resurse]

                                                România [n3-1-1-2 resurse]

                                                                Lovitura de stat de la 23 august 1944 [n3-1-1-2-1 resurse]

                Polonia [n3-2 resurse]

                                războaie [n3-2-1 resurse]

                                                Al Doilea Război Mondial [n3-2-1-1 resurse]

                                                                Insurecţia varşoviană [n3-2-1-1-1 resurse]

                România [n3-3 resurse]

                                războaie [n3-3-1 resurse]

                                                Al Doilea Război Mondial [n3-3-1-1 resurse]

                                                                Lovitura de stat de la 23 august 1944 [n3-3-1-1-1 resurse]

Lovitura de stat de la 23 august 1944 [n4 resurse]

Polonia [n5 resurse]

                istorie [n5-1 resurse]

                                războaie [n5-1-1 resurse]

                                                Al Doilea Război Mondial [n5-1-1-1 resurse]

                                                                Insurecţia varşoviană [n5-1-1-1-1 resurse]

războaie [n6 resurse]

                Al Doilea Război Mondial [n6-1 resurse]

                                Polonia [n6-1-1 resurse]

                                                Insurecţia varşoviană [n6-1-1-1 resurse]

                                România [n6-1-2 resurse]

                                                Lovitura de stat de la 23 august 1944 [n6-1-2-1 resurse]

România [n7 resurse]

                istorie [n7-1 resurse]

                                războaie [n7-1-1 resurse]

                                                Al Doilea Război Mondial [n7-1-1-1 resurse]

                                                                Lovitura de stat de la 23 august 1944 [n7-1-1-1-1 resurse] 

(Din pricina simetriei exemplului meu) lucrarea lui Davies apare sub jumătate dintre aceste intrări. Se observă că descriptorii formaţi din mai multe componente apar ca intrări sub fiecare componentă (componentele sunt permutate) şi astfel, cu o singură asignare, am pus lucrarea lui Davies sub 22 de intrări de index ! 

[paranteză]

Numărul ăsta poate să crească în timp, dacă cineva rafinează ontologia şi introduce locul geografic „Europa” şi situaţia „războaie <> Europa” şi reconfigurează corespunzător relaţiile existente.

[/paranteză] 

Şi asta, în timp ce în Worldcat, la OCLC, găsesc doar 3 subiecte asignate manifestării englezeşti: 

 

World War, 1939-1945 — Poland — Warsaw.

Warsaw (Poland) — History — Uprising, 1944.

Poland — History — Occupation, 1939-1945. 

 

Întrebarea e: să se genereze toate intrările posibile ? Cred că nu e cazul, şi anume, intrări precum:  

Al Doilea Război Mondial — istorie

Insurecţia varşoviană — Polonia

Lovitura de stat de la 23 august 1944 — România

Polonia — Al Doilea Război Mondial — istorie

România — Al Doilea Război Mondial — istorie 

 

adică intrări în care o componentă cu sens mai larg apare mai la dreapta uneia cu un sens mai restrâns, nu folosesc, din logica prezentării ierarhice (arborescente), unde progresia spre dreapta semnifică restrângere de sens. 

 

6. Despre libertatea indexatorului 

Să reluăm: în acest scenariu, indexatorul are la dispoziţie o ontologie din care îşi ia componentele pentru a construi descriptorii de care are nevoie. Aşadar, el ar trebui să fie (relativ) liber să facă asocierile pe care le consideră necesare pentru a construi descriptorii cei mai specifici pentru caracterizarea resursei (fie aceasta asignarea unui subiect sau încadrarea într-o clasă — NB. nu clasă în sens CZU). 

Mai mult: dacă nu găseşte în ontologie componentele de care are nevoie (sau descriptorii gata construiţi), el trebuie să poată să-şi extindă corespunzător ontologia. 

De pildă, să presupunem că am de indexat lucrarea: 

Ion Petrică. Confluenţe culturale româno-polone : a doua jumătate a sec. al XIX-lea 

încorporată în manifestarea: 

Confluenţe culturale româno-polone : (a doua jumătate a sec. al XIX-lea) / Ion Petrică. — Bucureşti : Minerva, 1976 

şi vreau să-i asignez descriptorul: “Polonia <> România <> relaţii culturale — a doua jumătate a sec. XIX”. 

Atunci, având deja „România” şi „Polonia” mai trebuie să adaug în ontologie doar conceptul „relaţii culturale” şi situaţia „Polonia <> România <> relaţii culturale”. Apoi asignez această situaţie — prin relaţia „subiect” — lucrării mele. Astfel, ea va apărea în indexul de subiecte sub intrările:  

Polonia

                România

                                relaţii culturale

România

                Polonia

                                relaţii culturale

relaţii culturale

                România

                                Polonia

                Polonia

                                România 

Mai e un aspect de discutat aici: subdiviziunile. După părerea mea, din raţiuni practice, subdiviziunile trebuie să fie doar caracterizări fine ale relaţiei „subiect” dintre o lucrare şi un descriptor. Cu alte cuvinte, să aibă statut de proprietăţi ale relaţiei şi nu să nu facă parte din ontologie. În exemplul ăsta, „a doua jumătate a sec. XIX” este o astfel de subdiviziune, şi ea trebuie să fie expusă la prezentarea lucrării, dar nu şi în indexul de subiecte. 

Ion Petrică. Confluenţe culturale româno-polone : a doua jumătate a sec. al XIX-lea

                Polonia — România — relaţii culturale — a doua jumătate a sec. XIX [despre] 

[paranteză]

Similar, astfel de proprietăţi se pot atribui şi altor relaţii între diverse entităţi. De pildă relaţiei „afiliere” dintre o „persoană” şi o „colectivitate” i se poate ataşa legitim o perioadă.

[/paranteză] 

 

7. Conceptele, clasele şi termenii 

La discuţia care a provocat acest text, dna. Denis Rotaru a ridicat — la un moment dat — o problemă ce mi se pare importantă: distincţia dintre „poezie” ca subiect şi „poezii” ca „subdiviziune de formă” (în jargonul RAMEAU). Mie, soluţia radicală pentru acest tip de probleme (precis foarte frecvente) este introducerea în ontologie atât a conceptului „poezie/poetry”, cât şi a clasei „poezii/poems”. Şi aplicarea soluţiei terminologice standard: introducerea termenilor în ontologie ca entităţi distincte şi designarea acestei perechi concept-clasă cu un acelaşi termen în româneşte (dar cu termeni diferiţi în englezeşte, de pildă). 

 

designări

fig. 3 

Aşadar, conceptul „poezie” (cf. DEX: modalitate a literaturii care exprimă mesajul artistic cu ajutorul imaginilor expresive, al unui limbaj concentrat, al afectivităţii, al rimei, al ritmului etc.) este asociat — prin relaţia „designat de” cu termenul „poezie, poezii”, iar signatura lui este „poezie” (putem conveni că relaţia de designare între un concept şi un termen expune singularul termenului). Pe de altă parte, clasa „poezii” (cf. DEX: (concr.) creaţie literară în versuri) este asociată (în româneşte) cu acelaşi termen, iar signatura ei este „poezii” (putem conveni că relaţia de designare între o clasă şi un termen expune pluralul termenului). 

Lasă că, pe de altă parte, termenul englezesc „poem, poems” designează atât clasa „poezii” cât şi subclasa sa „poeme” (sau nu ? există un termen englezesc ?). 

Tot atunci, dna. Nina Botez a ridicat şi o altă problemă care mi se pare importantă: clasele complexe. Acestea — de dragul generării intrărilor de index permutabile — ar trebui să fie reprezentate în propunerea mea ca situaţii (unele chiar cu nume propriu). Exemplul este: „scriitori de limbă maghiară din România”. Las pe altă dată discuţia fină despre ce înseamnă „din România”: născuţi pe teritoriul actual al României ? cetăţeni români ? care au trăit minimum 10 ani în România ? etc. 

 

scriitori maghiari din România

fig. 4 

Aşadar, am „construit” clasa „scriitori de limbă maghiară din România”, ca o situaţie: „scriitori <> limba maghiară <> România”.  

[clasă]

id c-3
termen >> [ro] scriitori

 

[concept]

id co-1
termen >> [ro] limba maghiară

 

[situaţie]

id s-5
componentă egp-1 (i.e. “România”)
subclasă a c-3 (i.e. “scriitori”)
componentă co-1 (i.e. “limba maghiară”)
apelaţiune [ro] scriitori de limbă maghiară din România

 

Deci, intrările de index (generabile automat) ar fi:  

limba maghiară

                scriitori

                                România

                România

                                scriitori

România

                limba maghiară

                                scriitori

                scriitori

                                limba maghiară

scriitori

                limba maghiară

                                România

                România

                                limba maghiară 

dar, în afara indexului, s-ar putea folosi direct apelaţiunea (mai naturală) “scriitori de limbă maghiară din România”. 

Sigur, o să-mi spuneţi că în indexuri, în loc de “limba maghiară” ar trebui să se folosească “maghiară, limba”, ca să intre la “M”. Cred că cel mai bine e să intre atât la “L”, cât şi la “M” (n-avem de ce să facem economie de intrări). După mintea mea, oricare entitate poate genera multiple intrări de index (chiar dacă unele „ascunse”). În cazul astă, mi s-ar părea OK să avem şi „apelaţiunea fantomă” “maghiară, limba”. 

 

8. Epilog 

Vestea proastă e că multe detalii ale unei asemenea scheme mai trebuie gândite bine. Şi sunt destule probleme nerezolvate. Spun una de care sunt (de mult) conştient: cum să reprezinţi dinamica în timp a unei entităţi geopolitice ? Ce e aia „România” ? Statul cu acest nume având teritoriul din 2008 ? Din 1941 ? Din 1920 ? Din 1914 ? 

Apoi, cum să pui în indexuri unităţile administrativ-teritoriale ? Exemplu: 

România

                jud. Maramureş

                                com. Şomcuta Mare

                                                Vălenii Şomcutei 

sau chiar signatura: 

Vălenii Şomcutei (com. Şomcuta Mare, jud. Maramureş, România). 

Eu le-aş pune pe ambele. Bine o fi ? 

Dar, pe lângă dificultăţi, cred că ceea ce vă propun aici e în ton cu dezvoltările tehnologice contemporane, chiar dacă google-izarea webului pare a zice că trendul e spre simplu şi amatoristic.

Written by poliptic

15 iunie 2008 at 12:08 am

Biblioteca Digitală a României [BDR]: „cu ce oameni se va lucra ?”

cu 5 comentarii

În comentariul la postul precedent, doamna Şerbănuţă îmi pune două întrebări importante. Încerc să răspund aici la prima (care e multiplă :-) La a doua, poate mâine.

Aşadar, zice doamna Şerbănuţă:

… as repeta aici intrebarea mea postata pe Prolibro legata de acest proiect: cu ce oameni se va lucra ? Stiu ca bugetul va rezolva o parte din probleme, dar pregatirea oamenilor ia timp. Cine se va ocupa de asta ? Impresia mea este ca CIMEC-ul nu e foarte mare…se va extinde in viitor pentru a putea sustine acest proiect ? Vor fi adusi sa lucreze in proiect informaticienii ? Sau bibliotecarii? (Stiut fiind ca la noi rare sunt intersectiile dintre ei).

Întâi, răspunsurile scurte:

 

  1. Cu oamenii existenţi: a) pentru digitizări pretenţioase există firme specializate; scanări simple ştie/învaţă oricine; b) catalogatori (încă) există.
  2. CIMEC are cam 40 de oameni şi nu (cred că) se va extinde (poate va avea ocazionale colaborări externe). Şi n-am zis că proiectul BDR e strict treaba CIMEC.
  3. Desigur: trebuie „aduşi” informaticieni, bibliotecari, muzeografi, arhivişti.

 

Răspunsul lung:

Memento: de ce e nevoie ? a) de resurse digitale (text, imagine, sunet, video) şi b) de metadate, adică de fişe catalografice pentru fiecare resursă.

 

Sursele de material digital pe care le întrevăd (acum) sunt:

 

A. Clasările în patrimoniul cultural naţional: Comisia Muzeelor şi Colecţiilor clasează cam 300 de piese pe lună. Acum, imaginile pieselor sunt — de regulă — de slabă calitate. Dar descrierea catalografică e făcută de experţii care propun clasările. Aşadar, calitatea metadatelor e — cel mai adesea — OK.

Sigur că atât imaginile cât şi metadatele necesită postprocesare. Aceasta poate fi făcută de CIMEC.

 

B. Proiecte de digitizare importante (finanţate mai ales de stat) — câte-or fi —, cum a fost cel de facsimilare digitală de manuscrise medievale de la Batthyaneum (peste 100.000 de pagini).

În asemenea proiecte — fiindcă se presupune că sunt finanţate semnificativ, nu printre picături — digitizările le fac firmele specializate, iar metadatele le produc catalogatori angajaţi sau (uneori) catalogatorii instituţiilor deţinătoare (poate sunt deja produse, în cataloagele existente).

 

C. Digitizări locale, în instituţii ale memoriei, i.e. în biblioteci, muzee, arhive. Câte-or fi. Şi sunt deja (e.g. BCU Cluj, Metropolitana din Bucureşti).

În asemenea proiecte, instituţiile fac şi digitizările şi produc şi metadatele. Şi în acest caz e nevoie de postprocesări, desigur. Măcar să fie aşa de multe, cât să nu facem faţă !

 

D. Repozite externe, e.g. Google Books, Live Books, Internet Archive (aşa cum am inventariat pe www.biblioteca-digitala.ro).

Şi aici e nevoie de fişe catalografice româneşti. Pentru aceasta e însă suficient de angajat un catalogator, doi.

 

E. Voluntarii.

Oricât ar părea de ciudat (în România), există destui voluntari — mai ales tineri, pentru care munca voluntară nu e o activitate discreditată — dispuşi să digitizeze texte (de pildă). Vezi ro.wikisource.org. Sigur că şi în acest caz ar fi nevoie (uneori) de postprocesări. Un corector şi un catalogator ar fi suficienţi pentru început.

 

În concluzie, nu văd dificultăţi insurmontabile. Tot banii rămân problema, nu persoanalul. După părerea mea.

Written by poliptic

26 mai 2008 at 10:59 pm

Biblioteca Digitală a României [BDR]: planuri şi speranţe

cu 2 comentarii

 

Postul ăsta (şi cel anterior) au fost provocate, de fapt, de postul al lui Nicolaie Constantinescu, care semnalează bucuros existenţa unei propuneri de de politică publică privind digitizarea resurselor culturale naţionale şi crearea Bibliotecii Digitale a României.

Sunt implicat în proiectul Bibliotecii Digitale a României. Dar, (mai) înăuntru fiind, nu împărtăşesc optimismul amicului Nicolaie Constantinescu. Sper ca el să aibă dreptate.

Adevărat: propunerea de „politică publică” a Ministerului Culturii este, în principiu, agreată de guvern. Dar până nu se alocă un buget, e doar un gând pios. Iar anul astă nu mă aştept să i se aloce un buget. Dă Doamne să mă înşel !

Adevărat: ministrul meu (Adrian Iorgulescu) a declarat public că BDR e una dintre priorităţile ministerului. Aici am ceva mai multe nădejdi, adică tot la bugetul existent.

 

A. Care e planul ?

1. Să inventariem ce e deja digitizat.

2. Să constituim un repozit (repository), unde să depunem resursele pe care le obţinem, împreună cu aplicaţiile de prezentare (randare), dacă sunt necesare, e.g. o aplicaţie de răsfoire. Şi să asigurăm URL-uri stabile.

3. Să constituim o bază de date cu metadatele descriptive ale acestor resurse (disponibile pentru recoltare de către europeana.eu).

4. Să dezvoltăm portalul naţional, i.e. BDR, cu interfaţă românească (şi măcar şi cu una englezească), şi care să permită acces nu doar la resursele din repozitul local, ci şi la alte resurse „de interes românesc” din repozite străine (i.e. Google Books, Live Books) sau resurse care — din diverse motive — nu sunt încă accesibile prin europeana. eu (de pildă fiindcă n-au metadatele conforme cu cerinţele acesteia).

NB. Europeana.eu nu va accepta resurse din repozite concurente (e.g. Google Books), aşa că BDR va colecta mai multe resurse „româneşti” decât europeana.eu. Ca să vedeţi ce vreau să zic: într-un week-end (în toamnă) am făcut un exerciţiu de vreo 3-4 ore. Am încercat să identific resurse „româneşti” în trei repozite mari (Google Books, Live Books şi Internet Archive). În acestea, neavând cataloage, e greu de găsit ceva, dacă nu ştii exact ce cauţi. Iniţial, am căutat orbeşte, folosind cuvinte cât mai „româneşti”, precum „mămăligă” sau „suflet”. Pe urmă am dat-o pe „Romania”, „Transylvania”, „Valachia” şi altele asemenea. Tot am găsit 102 cărţi. Iată rezultatul la www.biblioteca-digitala.ro.

5. Să încurajăm orice digitizare în ţară (plătită sau voluntară). Să convingem autorităţile (centrale şi locale) să nu finanţeze nici o digitizare, dacă rezultatul nu se include în BDR.

 

B. Conexiunea cu europeana.eu

Schematic vorbind, asocierea BDR cu Biblioteca Digitală Europeană Europeana.eu se va face în modul următor:

  • portalul Europeana.eu îşi va recolta metadatele (de sorginte românească) din baza de date BDR (prin protocolul OAI-PMH). Utilizatorii portalului Europeana.eu vor avea acces la resursele româneşti (pentru care s-au recoltat metadate) din repozitul românesc (alături de celelalte repozite europene);
  • utilizatorii BDR vor avea acces la toate resursele din repozitul românesc, dar şi la resurse din alte repozite (pentru care portalul are metadate).

Diagramatic (şi foarte simplificat), mecanismul sugerat este:

 Relatia-BDR-Europeana

… în care se vede cam cum e planul.

 

C. Care-i problema ?

Se poate rezuma astfel: (deocamdată) nu avem banii pentru softul adecvat.

Dar am intrat într-un parteneriat „european” şi am aplicat la apelul 3 (aprilie) la FP7, ca să obţinem finanţare pentru dezvoltarea unei platforme pentru biblioteci digitale („gen BDR” :-).

Încalc (puţin) confidenţialitatea ca să arăt cam ce mi-aş dori. Folosesc o variaţiune a unui exemplu pe care l-am pus în textul aplicaţiei (unul dintre parteneri e un laborator din Prato, aşa că – din simpatie – am ales un „exponat” pratoan).

Să presupunem că avem în biblioteca digitală următoarea resursă digitală:

 

 Prato-duomo-Globalgeografia.com

O foarte simplă înregistrare metadatală [metadata record] pentru ea ar fi:

 

[ro] Legendă: catedrala din Prato, după amiaza.

[en] Caption: Prato Cathedral in the afternoon.

ã Globalgeografia.com

  

O înregistrare metadatală mai complexă, ar fi o înregistrarea “Dublin Core” [ISO 15836:2003(E)]:

 

Title

prato1.jpg
Creator    ? 
Subject [en]   The Prato Cathedral    

Subject [ro]   Catedrala din Prato  
Description [en]   A photo of the famous Prato Cathedral (Santo Stefano di Borgo al Cornio) in the afternoon. Architect: Guidetto da Como. Creation date: 12th-15th century. Style: Romanesque; Gothic.  
Description [ro]   fotografie a faimoasei catedrale din Prato (Santo Stefano di Borgo al Cornio), la orele după amiezii. Arhitect: Guidetto da Como. Datare: sec. XII – XV. Stil: romanic; gotic.  
Publisher    Globalgeografia.com  
Contributor    ?  
Date    2002-2004 (?)  
Type [en]   digital image  
Type [ro]   imagine digitală  
Format    jpeg  
Identifier    www.globalgeografia.com/album/italia/toscana/prato1.jpg  
Source    www.globalgeografia.com  
Language    -  
Relation    -  
Coverage [en]   Prato, Italy  
Coverage [ro]   Prato, Italia  
Rights    ã Globalgeografia.com  

O reprezentare mai folositoare (şi nu mult mai complexă) ar arăta (diagramatic) cam aşa:

 

PratoArgument

Aşadar, pentru a reprezenta „obiecte culturale” (care sunt — prin natura lor — complexe), e necesar un model de date complex. Acel model de date trebuie să includă mai multe tipuri de înregistrări metadatale şi multe tipuri de relaţii între acestea, împreună cu exprimări plurilingve a termenilor implicaţi.

Astfel, un vizitator al prezumtivei noastre biblioteci digitale ar avea şansă să descopere imaginea frumoasei basilici pratoane nu doar după numele ei, ci şi baleind ale lucruri interesante aflate în Toscana sau construite în secolul XV sau aparţinând clasei „arhitectură” sau fiind asociate cumva cu Sfântul Ştefan. Utilizatorul nostru ar putea profita astfel nu doar de metadatele oferite de furnizorul imaginii, ci şi de cunoştinţele consemnate de alţi furnizori de conţinut, cum ar fi:

  • Prato se află în Toscana;
  • Toscana face parte din Italia;
  • basilica este o entitate arhitecturală.

     

  •  Dacă e relativ uşor (nu şi pentru mine !) să faci maioneză din ouă şi ulei, e foarte dificil să separi oul de uleiul dintr-o maioneză. Similar, e relativ uşor să degradezi [dumb-down] o asociere complexă de înregistrări metadatale (precum cele sugerate în diagramă) ca să obţii o înregistrarea Dublin Core (sau chiar o simplă legendă), dar este foarte dificil să transformi (automat) o înregistrare Dublin Core într-un set de înregistrări metadatale logic interconectate („degradarea” e aproape o funcţie neinversabilă — cum ar zice matematicianul).

    Morala e că ar fi nevoie de elaborarea unor modalităţi de reprezentare a informaţiei culturale complexe într-un format rafinat şi de a defini un model de date care să încurajeze experţii să-şi consemneze cunoştinţele culturale astfel încât să se favorizeze multiple căi de descoperire de către utilizator a resurselor dintr-o bibliotecă digitală. Din fericire, deja se cam ştie cum să se facă asta.

    Ne-ar plăcea ca Biblioteca Digitală a României să fie organizată astfel (cam ca o enciclopedie), ca să permită utilizatorului nu doar căutarea unei resurse bine precizate, ci şi baleierea şi navigarea printre entităţile asociate de catalogatori/indexatori cu resursele digitale aflate în acea bibliotecă. Să ne ţinem pumnii !

    Written by poliptic

    24 mai 2008 at 12:21 pm

    Europeana.eu: puţină istorie şi câteva comentarii (mai acide)

    cu un comentariu

     

    Zilele trecute, amicii de pe lista TIC-Lobby m-au „provocat” să comentez „politica publică privind digitizarea resurselor culturale naţionale şi crearea Bibliotecii Digitale a României, propusă de Ministerul Culturii şi Cultelor”. M-am conformat (cu chiu cu vai — sunt leneş la scris) şi am început expunând „rădăcinile istorice” ale acestei propuneri.

     

    A. Istoria

     

    14 decembrie 2004:

    Google anunţă proiectul “Google Print for Libraries” (acum se numeşte, oficial, Google Book Search): digitizarea a 15 milioane de cărţi (i.e. 4,5 miliarde de pagini), materialul provenind de la 5 (mari) biblioteci „anglo-saxone” (4 americane: Harvard, Stanford, Michigan, New York Public; una engleză: Oxford).

    Iniţial am crezut că ziariştii au notat greşit, şi că anunţul corect era de 15 milioane de pagini. Ei bine nu; era de 15 milioane de cărţi. Drept e că nu se specifică durata proiectului, dar se pare că e de 10 ani. NB. Se zice că au digitizat deja peste 2 milioane de cărţi.

     

    23 ianuarie 2005:

    Jean-Noël Jeanneney (preşedinte – atunci – al Bibliotecii Naţionale a Franţei publică „Quand Google défie l’Europe” în Le Monde (se poate citi şi pe www.lemonde.fr, dar costă).  Jeanneney se îngrozeşte de potenţiala hegemonie a „culturii anglo-saxone” pe Net.

    Citat:

    Le vrai défi est ailleurs, et il est immense. Voici que s’affirme le risque d’une domination écrasante de l’Amérique dans la définition de l’idée que les prochaines générations se feront du monde. [...] les critères du choix seront puissamment marqués (même si nous contribuons nous-mêmes, naturellement sans bouder, à ces richesses) par le regard qui est celui des Anglo-Saxons, avec ses couleurs spécifiques par rapport à la diversité des civilisations.

    (The real challenge is different, and it is huge. Here we have the risk of a crushing domination by America in defining the idea that later generations will have of the world [...] the criteria of choice will be powerfully marked (even if we contribute ourselves, naturally without sulking, to these riches) by the perspective which is that of the Anglo-Saxons, with its specific coloration with respect to the diversity of civilizations.)

    Mai târziu, în 2005, el publică şi o carte: „Quand Google défie l’Europe : plaidoyer pour un sursaut”.  Citat din prezentarea editorului american:

    Jean-Noël Jeanneney, president of France’s Bibliothèque Nationale, here takes aim at what he sees as a far more troubling aspect of Google’s Library Project: its potential to misrepresent—and even damage—the world’s cultural heritage. In this impassioned work, Jeanneney argues that Google’s unsystematic digitization of books from a few partner libraries and its reliance on works written mostly in English constitute acts of selection that can only extend the dominance of American culture abroad. This danger is made evident by a Google book search the author discusses here—one run on Hugo, Cervantes, Dante, and Goethe that resulted in just one non-English edition, and a German translation of Hugo at that. An archive that can so easily slight the masters of European literature—and whose development is driven by commercial interests—cannot provide the foundation for a universal library.

     

    1 iunie 2005:

    Comisia Europeană publică „strategia” “i2010 – A European Information Society for growth and employment“. Nu se pomeneşte de biblioteci digitale (nici cuvântul „cultură” nu-l găsesc), dar printre „provocări” e şi:

    “rich content: increased legal and economic certainty to encourage new services and on-line content”.

    Încurajator.

     

    28 aprilie 2005:

    Faimoasa scrisoare Chirac (co-semnată de Kwasniewski, Schroeder, Berlusconi, Zapatero, Gyurcsany) prin care se cere o „reacţie” europeană la iniţiativa Google (fără ca aceasta să fie numită).

    Citat:

    C’est la raison pour laquelle nous souhaitons prendre appui sur les actions de numérisation déjà engagées par nombre de bibliothèques européennes pour les mettre en réseau et constituer ainsi ce qu’on pourrait appeler une bibliothèque numérique européenne, c’est-àdire une action concertée de mise à disposition large et organisée de notre patrimoine culturel et scientifique sur les réseaux informatiques mondiaux.

     

    7 iulie 2005:

    Răspunsul lui Barosso, pozitiv, dar fără să angajeze Comisia Europeană.

    Citat:

    … le principe de subsidiarité doit etre respecté. Ce sont donc le Etats membres qui sont responsables au premier chef de leur politiques culturelles.

     

    30 septembrie 2005:

    Comisia Europeană adoptă cominicatul „i2010: Digital Libraries”, prin care îşi schiţează „viziunea” în chestiunea bibliotecilor digitale.

    Citat:

    Organising and funding the digitisation of cultural collections and digital preservation is primarily a responsibility of the Member States.

    Within the eContentplus programme, 60 MEUR will be available in the period 2005-2008 for projects improving the accessibility and usability of European cultural and scientific content. Achieving interoperability between national digital collections and services (e.g. through common standards) and facilitating access and use of the material in a multilingual context will be core objectives.

     

    24 august 2006:

    Recomandarea (2006/585/ce) a Comisiei Europene “on the digitisation and online accessibility of cultural material and digital preservation”.

    Citat:

    4. set-up and sustain large scale digitisation facilities, as part of, or in close collaboration with, competence centres for digitisation in Europe;

    5. promote a European digital library, in the form of a multilingual common access point to Europe’s distributed — that is to say, held in different places by different organisations — digital cultural material, by:

    (a) encouraging cultural institutions, as well as publishers and other rightholders to make their digitised material searchable through the European digital library,

    (b) ensuring that cultural institutions, and where relevant private companies, apply common digitisation standards in order to achieve interoperability of the digitised material at European level and to facilitate cross-language searchability;

    11. make provision in their legislation for the preservation of web-content by mandated institutions using techniques for collecting material from the Internet such as web harvesting, in full respect of Community and international legislation on intellectual property rights;

     

    27 septembrie 2007:

    Parlamentul European adoptă o rezoluţie care sprijină viziunea Comisie Europene expusă în „i2010: Digital Libraries”.

    Citat:

    1.  Recommends setting up in stages a European digital library in the form of a single, direct and multilingual access point for the European cultural heritage;

    13.  Points out that, although Community programmes are not able to fund digitisation as such, new methods of financing must be developed, including partnerships with the private sector, on the understanding, however, that every effort must be made to prevent digitisation proceeding at different paces in different Member States;

    14.  Encourages the establishment of a common interface providing access to content of guaranteed quality and accuracy via an integrated search engine enabling searches for meta-information and direct text when documents have been digitised in text mode;

    15.  Underlines the importance of achieving a multilingual interface giving direct access to content in all European Union languages in order to accommodate not just searches by author or title, but also searches by topic or keyword, the results of which must ultimately encompass the data from every library involved and in every catalogue language;

    18.  Points out that it would be desirable not to limit the European cultural heritage to the European Union’s own works, but also to take account of the cultural contributions of other European countries;

     

    B. Comentariile

     

    1. După mine, Jeanneney a perceput prea panicos proiectul Google Books: Google lucrează pe scară mare şi — acum se cam ştie — nimeni nu stă să aleagă cu grijă cărţile care se scanează. Se iau rafturi întregi. Şi, desigur, bibliotecile alea de elită (acum sunt mai multe) am masiv „cultură europeană”. Dovadă: am găsit şi cărţi „româneşti”.

    Dar, ţipătul lui a provocat emulaţie şi entuziasm — vezi „scrisoarea Chirac” — pentru care sunt foarte recunoscător. Drept că entuziasmul iniţial al guvernelor şi al Comisiei Europene (care-mi amintea de entuziasmul belicos din august 1914, când mergeam (aproape) toţi europenii, cântând, la răzbel) s-a pleoştit repede, adică nu s-a materializat în buget. S-a decis că statele membre îşi finanţează singure digitizările. Mă deranjează că nici măcar simbolic Comisia Europeană nu finanţează digitizări.

    <paranteză>

    Sigur, decizia asta are o logică, şi e normal ca în primul rând statele să-şi digitizeze producţiile culturale proprii. Totuşi, măcar simbolic …

    La o conferinţă dedicată unde era şi Horst Forster (Director responsible for “Digital content and cognitive systems” in the European Commission’s Directorate general for Information Society and Media”), m-am obraznicit şi am deplâns această decizie. Am propus ca CE să finanţeze măcar nişte digitizări de „material de interes european” dinafara UE. Şi am dat exemple: biblioteca Vaticanului, arhivele de la Washington, Moscova şi Istanbul, muzeele Ermitaj şi Metropolitan. Să avem şi o „avere digitală” comună. N-am provocat nici o reacţie „oficială”. Doar bătăi pe umăr şi glumiţe aprobatoare, în pauze.

    </paranteză>

     

    2. Îmi place la „viziunea europeană” trans-domenialitatea, i.e. Biblioteca Digitală Europeană [EDL] va conţine nu doar texte, ci material cultural în toate formele (aşadar, denumirea de „bibliotecă” e prea restrictivă; s-a şi remediat pe parcurs). Îmi pare singurul „selling point” real în concurenţă cu Google Books. Altfel, de ce ar merge un vizitator la EDL în loc să meargă la Google Books ? În 2010, EDL va avea (se presupune) 6 miloane de „items” vs. 15 milioane de cărţi pe care le va avea Google Books. Mai mult (după cum zicea amicul meu Theo van Veen de la Biblioteca Regală a Olandei): orice truc tehnic am inventa noi, Google o să-l facă mai bine.

     

    3. Nu-mi place ideea de „distribuit” („… European digital library, in the form of a multilingual common access point to Europe’s distributed — that is to say, held in different places by different organisations — digital cultural material…”). S-a decis că European Digital Library [EDL] să fie doar un portal (index, catalog …) şi ca resursele digitale propriu-zise să stea la mama lor. Aceasta va avea drept consecinţă (în mintea mea) că timpii de răspuns vor fi mereu mai proşti decât la Google. În plus, mi-ar fi plăcut ca toate resursele digitale să aibă şi câte o copie la Haga (măcar din raţiuni de securitate; memento: LOCKSS – Lots of Copies Keep the Stuff Safe).

     

    4. În prezent, continuă să se „cerceteze” în UE (pe bani bunişori – programul eContentPlus, de pildă) bibliotecile digitale (de parcă nu s-ar şti binişor să se facă asta). N-am nimic împotriva cercetării, bineînţeles, dar mi-ar plăcea să se cheltuie bani europeni şi pe chestii mai stabile, cumulative, cu alte cuvinte „resurse” cum ar fi — de pildă — „Biblioteca Digitală Europeană” sau „Ontologia Europeană” sau „Enciclopedia Europeană”.

     

    C. Ce se întâmplă (practic) la nivel european: Europeana.eu

     

    Ştiu câte ceva, deoarece CIMEC (angajatorul meu) e partener în proiectul EDLnet (mai nou „Europeana”). Asta înseamnă că particip – cam o dată la două luni – la şedinţele tehnice ale WG2, la Haga:

    • WG 2.1: Standards and Interoperability of Standards (focused on metadata)
    • WG 2.2: Semantic and Multilingual Interoperability
    • WG 2.3: Technical Architecture.

    Discuţiile sunt plăcute şi interesante, oamenii sunt competenţi şi drăguţi. Treaba noastră e să „proiectăm” portalul european europeana.eu (care nu e doar o bibliotecă ci e „the European digital library, museum and archive”. Dar — mă tem — va ieşi un tipic produs proiectat de un comitet. Dă Doamne să mă înşel.

    EDLnet este un proiect slab finanţat (se şi termină în toamnă) şi e construit pe o contradicţie (după mine): pe de o parte, proiectăm produsul final, iar pe de altă parte, echipa de dezvoltare (vreo 4-5 oameni angajaţi temporar) produce un prototip, care trebuie să fie lansat în noiembrie. Între cele două planuri nu e clară legătura, iar ce „producem” noi reflectă confuzia (după gustul meu). Puteţi să vă faceţi o idee despre „arhitectura” Europeana.eu, la www.edlproject.eu/conference/downloads/EDLconf_Gradmann.pdf.

    Pe plan politic, stăm relativ prost — (iar) după gustul meu. Pentru moment, ideea e ca portalul Europeana.eu să fie patronat de EDL Foundation, care e o asociaţie ce trăieşte din cotizaţii.

    <paranteză>

    Eu sunt scandalizat (asta-i cuvântul !) că draga de Comisie Europeană nu tratează europeana.eu ca pe „biblioteca, muzeul, arhiva unională”, i.e. a Uniunii Europene. Cu alte cuvinte, pe lângă milioanele de agenţii (bine bugetate) ale UE, nu se poate inventa o agenţie stabilă şi pentru asta ?

    </paranteză>

     

    Politico-arhitectural, este deja convenit ca fiecare ţară membră să aibă cel puţin un „agregator” (susţinut de ministerul culturii respectiv), care să adune resursele digitale din ţara respectivă, să le asigure URL-uri stabile, să le pregătească metadatele descriptive şi să le furnizeze portalului european. În practică vor fi mai mulţi agregatori, deoarece în unele ţări există diviziuni greu de reconciliat (e.g. pe domenii, pe limbi). Până la noi ordine, agregatorul român desemnat este CIMEC – Institutul de Memorie Culturală.

    Din pricina acestor „agregări”, mai multe ţări sunt decise să-şi organizeze (şi) portaluri naţionale. De altfel e şi o recomandare discretă a EDL Foundation:

    Citat:

    Strategic priorities for Ministries:

    • Support national portals for museums, audio-visual collections, libraries and archives. National portals establish consistent standards for digitised content, enabling Europeana to harvest heritage media of different types.
    • Support the development of digitisation programmes to bring priority national collections into Europeana.

     

    În următorul post o să spun câte ceva şi despre planurile Bibliotecii Digitale a României.

    Written by poliptic

    22 mai 2008 at 10:19 pm