Chestiuni documentaristice (inclusiv bibliologice)

Dan Matei (care își dă și el cu părerea).

Archive for the ‘indexare’ Category

Expunerea în Europeana: șoc cultural în instituțiile memoriei

with one comment

I. Din nou despre bibliotecile digitale (contemporane)

„Noua generație” de biblioteci digitale a fost inaugurată de Biblioteca Digitală Europeană: Europeana. Aceasta este – de fapt – un catalog colectiv de resurse culturale digitale expuse online (mai ales) de către țările membre ale Uniunii Europene. Așadar, ea oferă acces la metadatele (i.e. fișele catalografice ale) obiectelor digitale care sunt efectiv consultabile pe saiturile contributorilor (peste 3.500 în întreaga Europă), deci într-un mod foarte distribuit. Expunerea metadatelor se face în două moduri: printr-un portal și printr-o interfață programată – API [Application Programming Interface]. Prin portal (fig. 1), utilizatorii pot interoga direct colecția, iar prin API, programatorii afiliați pot dezvolta interfețe de consultare proprii și pot îngloba înregistrări în propriile lor aplicații.

fig-1-europeana-landing

Fig. 1. Pagina natală a portalului Europeana (decembrie 2016)

Europeana a constituit un model pentru alte biblioteci digitale majore. Una dintre cele mai importante este Digital Public Library of America [DPLA] (fig. 2). De notat: DPLA că este una dintre (nu prea multele) inovații europene majore adoptate de americani în ultimii 25 de ani !

fig-2-dpla-landing

Fig. 2. Pagina natală a portalului DPLA (decembrie 2016)

La nivel european, Statele Membre (care se respectă) au dezvoltat biblioteci digitale naționale, pandante ale Europeana. Cea mai masivă este Deutsche Digitale Bibliothek [DDB] (fig. 3).

fig-3-ddb-landing

Fig. 3. Pagina natală a DDB (decembrie 2016)

Se observă că aceste biblioteci digitale expun colecții de multe milioane de lucrări. Dar, cu cele peste 54 de milioane de exponate, Europeana este de peste trei ori mai voluminoasă decât DPLA.

II. Expunerea online

Întâi, o banalitate prea des uitată: de ce conservăm colecțiile ? Desigur, pentru a ne bucura de ele. Adică publicul – cât mai larg – să se bucure de ele ! Prin „bucurie” înțeleg, de bună seamă, satisfacții estetice și intelectuale. De ce merită (re)amintită această banalitate ? Fiindcă, prea adesea instituțiile memoriei uită că trebuie să fie (mereu) orientate către public. Iar expunerea pe web, adică accesibilă celui mai larg public, scoate și mai tare în evidență deficiențele de prezentare ale multor instituții ale memoriei.

Să ne reamintim: la ce e bună expunerea online ? Răspunsurile mele:

  • Contracarează – (măcar) într-o oarecare măsură – „discriminarea geografică” oraș-sat și capitală-provincie. Un bun cultural expus online – chiar dacă sub forma de surogat digital, în cazul lucrărilor tangibile, mai ales obiectele muzeale – are șanse semnificativ mai mari de a ajunge la ochii unui cetățean defavorizat (cultural) de localizarea sa geografică. Iar un text online e la fel de „veritabil” ca și versiunea lui tipărită.
  • Dezvăluie și piesele „ascunse” veșnic prin depozite. Doar e de notorietate că mai toate muzeele își pot expune în expoziția permanentă abia o mică parte a colecției.
  • Permite afișarea de „legende” ample și conexiuni pentru piesele expuse, ceea ce în expozițiile „fizice” rareori se întâmplă.

III. De ce produce Europeana un șoc cultural în instituțiile memoriei ?

În esență: Europeana fiind o platformă online destinată publicului larg, instituțiile memoriei expozante sunt puse în situația de a-și (re)orienta fișele descriptive ale resurselor culturale expuse către ochiul utilizatorului și nu doar al profesionistului.

De regulă, muzeele nici nu-și expun public cataloagele, iar bibliotecile și arhivele pun în fișele lor – pe lângă descrierea pedantă a cărții ca obiect – cel mult câteva vedete de subiect și nelipsiții (dar inutilii) indici CZU. Așadar, cataloagele „tradiționale” nu prea se adresează „clientului”.

Prin urmare, în context digital, metadatele asociate unei lucrări – care în mod tradițional sunt destinate custodelui/curatorului/bibliotecarului – trebuie extinse cu informații destinate utilizatorului. Piesa se cere interpretată, i.e. plasată în context istoric și geografic, iar subiectul și eventualele aluzii, explicate. Așadar, exponatul – fie el imagine sau text – trebuie „înfășurat” într-o poveste contextualizantă.

Exemplificarea 1 (muzee):

Celebrul tablou al lui Poussin „Răpirea sabinelor”. O fișă precum cea din fig. 4 nu spune prea multe privitorului. La „descrierea” „par Poussin”, ce să zici ? Apoi, elementele „cifrate” (e.g. 77.P.Z.) poate semnifică ceva cel mult pentru custodele colecției. Ca să nu mai zicem de inducerea în eroare: „Type: Monograph” (chiar dacă imaginea este extrasă dintr-o monografie). Mai bine ne-ar spune ceva care să sporească înțelegerea lucrării: cine-s sabinele ? cine le răpește ? de ce ? În plus: informarea privind datarea reproducerii (1899) e mult mai puțin relevantă decât ar fi cea despre datarea originalului (c. 1640).
fig-4-poussin-sabine-europeana-2016-10-08a

 Fig. 4. Poussin. „Răpirea Sabinelor”. Fișa unei reproduceri

Din fericire, Luvru însuși oferă o expunere adecvată (fig. 5).

fig-5-poussin-sabine-louvre-2016-10-08

Fig. 5. Poussin. „Răpirea Sabinelor”. Expunerea pe saitul Luvrului

Încă un și mai bun exemplu găsim pe saitul Muzeului Național de Artă al României. „Adorația păstorilor” al lui El Greco (fig. 6.). Pe lângă o descriere textuală adecvată, o avem și în format audio, ba chiar și în format gestual ! (Păcat că la o scară așa de mică – doar 40 de piese se bucură de o asemenea expunere).

fig-6-mnar-el-greco-2016-10-09a

Fig. 6. El Greco. „Adorația păstorilor”. Expunerea pe saitul MNAR

Exemplificarea 2 (biblioteci):

Un roman „obscur”: „Război și pace”. Fișa din fig. 7 ne cam derutează: „2011” ? Sigur, meseriașii înțeleg că ăsta e anul ediției (al manifestării și nu al expresiei sau lucrării, în jargon FRBR). Dar cititorul obișnuit înțelege asta, sau crede că e anul genezei lucrării ? Nimic despre 1863-1869, nimic despre războaiele napoleoniene, nimic despre Borodino. Nici chiar despre Rusia ! Deci nu aflăm nimic despre subiectul romanului ! Și câtă lume înțelege că „821.161.1” înseamnă „literatură rusă”10 ? Și câți bibliotecari – în afara clasificatorilor – înțeleg ? Așadar, cui folosește limbajul ăsta cifrat ?

fig-7-tolstoi-razboi-si-pace-bna

Fig. 7. Tolstoi. „Război și Pace”

Nici fișa din fig. 8 nu e mai grozavă. Ce să înțelegi din „limba: rumrus” ? Că s-a tradus din rusă ? Frumos exprimat ! Apoi, bietul Tolstoi nici nu și-a închipuit că a scris o carte având drept subiecte „literatura rusă” și „roman” ! Similară și fișa din fig. 9.

fig-8-tolstoi-razboi-si-pace-bara

Fig. 8. Tolstoi. „Război și pace”

fig-9-tolstoi-razboi-si-pace-bcua

Fig. 9. Tolstoi. „Război și pace”

Exemplificarea 3 (arhive):

O imagine de arhivă, cu un personaj notoriu (fig. 10). Descriptori semnificativi ? „Künstler” (= artist) ? Apoi: „limba: germană” ? Ce e „lingvistic” în fotografie ? În schimb nu aflăm nimic despre cine mai e în fotografie ? Când a fost făcută ? În ce context ? Nu aflăm nici măcar cine e fotograful. Cu alte cuvinte, ce semnificație culturală are această fotografie ? De ce merită efortul s-o digitizăm, s-o expunem și să o privim ?

fig-10-hitler-ddb-2016-10-08a

Fig. 10. „Adolf Hitler”  în portalul Deutsche Digitale Bibliothek

Exemplele provin de la instituții de frunte. Dacă cele din „liga întâi” nu sunt adaptate încă „expunerii în piața publică”, ce pretenții să avem de la instituțiile mai mici, cu resurse semnificativ mai restrânse !

IV. Cum să ne adaptăm (noi, instituțiile memoriei) ?

Bineînțeles că adaptarea la mediul online nu e simplă și nici imediată. Cere eforturi. Prima cerință este – cred – conștientizarea faptului că trebuie schimbată mentalitatea. Și apoi regândirea fiecărei fișe (i.e. a codurilor de catalogare) prin prisma utilizatorului. Chiar și imaginile trebuie, poate, prelucrate având publicul în minte. Și expunerea textelor trebuie gândită pentru comoditatea utilizatorului. De pildă, fișiere pdf gigantice nu sunt recomandabile: poți aștepta îndelung să se descarce o carte în pdf (și poate să și plătești), ca apoi să constați că te interesau doar două pagini (sau nici măcar atât). Ca să nu mai zicem că fișierele pdf nu-s comod de citit pe dispozitive mobile, i.e. pe ecrane mici. Dacă se poate, e preferabil ca textele să fie expuse în HTML pur.

În privința descrierilor, putem imagina câteva „tactici” practice.

a) Să recuperăm textele descriptive din cataloagele de expoziție.

Mai ales muzeografii obișnuiesc să descrie amplu măcar unele piese pe care le expun, în cataloagele expozițiilor (un exemplu ilustrativ în fig. 11). De regulă, acestea sunt uitate după închiderea respectivelor expoziții. Și e păcat. Aceste descrieri pot fi reutilizate în fișele expuse online, în beneficiul privitorului.

fig-11-altar-votiv

Fig. 11. Text descriptiv dintr-un catalog de expoziție

b) Să „cooperăm” cu editorii și librarii

Putem prelua (cu folos) în fișele catalografice descrierile oferite de editori. În definitiv e și în interesul lor: poate unii utilizatori ai catalogului, decid să cumpere cartea, inspirați de acea descriere. În fig. 12 se vede o asemenea descriere, mult mai expresivă decât fișele catalografice obișnuite.

fig-12-tolstoi-razboi-si-pace-polirom

Fig. 12. Prezentarea unei ediții a romanului „Război și pace”, pe saitul editurii

c) Să „cooperăm” cu Wikipedia

Multă lume din comunitățile noastre profesionale tratează cu dispreț articolele din Wikipedia. Nejustificat. Și în orice caz, în detrimentul clienților noștri. Dacă nu suntem mulțumiți de un articol, n-avem decât să-l îmbunătățim ! Uite, de pildă, o fișa foarte „profesională” (fig. 13), în comparație cu un articol „de amatori” despre aceeași lucrare, din Wikipedia (fig. 14).

fig-13-brancusi-cumintenia-clasate-2016-10-10a

Fig. 13. Fișa „Cumințeniei Pământului” în Inventarul Bunurilor Culturale Mobile Clasate

fig-14-brancusi-cumintenia-wikipedia

Fig. 14. Articolul despre „Cumințenia Pământului” din Wikipedia

Pe de altă parte, să nu ne facem iluzii ! Când un utilizator caută o resursă culturală anume, interoghează Google. Așadar, contează foarte tare unde se regăsește pagina în lista de răspunsuri Google. În cazul „Cumințeniei Pământului”, în decembrie 2016, articolul Wikipedia era pe poziția 4, pe prima pagină, iar fișa din Inventarul clasatelor nu apărea nici în primele 15 pagini ! Bine, să zicem că „scandalul” Cumințeniei alterează ierarhia. Dar, de pildă, în căutarea bustului „Vitellius” al lui Brâncuși, articolul Wikipedia apare pe poziția 1, pe când fișa din Inventarul clasatelor apare abia pe poziția 7.

d) Să renunțăm la CZU

Clasificarea Zecimală Universală [CZU] a fost o mare realizare intelectuală, de mare folos în secolul XIX și secolul XX, până la pătrunderea calculatoarelor în biblioteci. De atunci însă, este un jargon profesional, chiar criptic, parcă anume făcut să ascundă informație prețioasă utilizatorilor. Bineînțeles că o lucrare trebuie clasificată. Dar de ce să mai folosim un limbaj cifrat pentru asta ? Limbajul natural nu e mai „natural” ? Occidentalii de ce folosesc de ani mulți vedete de subiect și descriptori ? Utilizatorul, nedecriptând indicii CZU (deci neavând un limbaj comun cu clasificatorul), poate rata regăsiri utile.

În plus, codificând în CZU, clasificatorii risipesc timp prețios, fiindcă, desigur, găsirea indicelui adecvat este mai consumatoare de timp decât găsirea (sau „inventarea”) unei vedete de subiect adecvate.

e) Să renunțăm la MARC(uri)

Și formatul MARC a fost o mare realizare biblioteconomică a anilor ’60. Dar, acum, după jumătate de secol, cramponarea de el este păguboasă. Nu degeaba Biblioteca Congresului – unde, de altfel, s-a inventat MARC – se pregătește (cam demult !) să treacă la BIBFRAME, un format mai adecvat vremurilor.

În fig. 15 se vede înregistrarea UNIMARC a unei ediții a romanului „Război și pace”. O să mă rezum la obiecția majoră, și anume: ce rost mai are efortul de a evidenția părțile titlului și a mențiunii de responsabilitate ? În afară de a permite afișarea în formalismul ISBD (la ce mai folosește acesta ? nici măcar stilurile consacrate de citare nu folosesc sintaxa ISBD), cui folosește ? N-am întâlnit OPAC care să-ți permită căutarea doar în „mențiunea secundară de responsabilitate”, să zicem. Și chiar dacă softurile ar permite, câți dintre utilizatori măcar înțeleg ce înseamnă această expresie ? Așadar, o transcriere brută sau, și mai bine, ocerizarea paginii de titlu ar fi mai economicoasă.

fig-15-marc-a

Fig. 15. Înregistrarea UNIMARC a fișei din fig. 7

În locul pedantei transcrieri a paginii de titlu, catalogatorii și-ar folosi mai profitabil expertiza la a identifica și caracteriza lucrarea/lucrările și expresia/expresiile cuprinse în manifestarea prelucrată.

Pentru clasificări – în cadrul formatului MARC (la care, desigur, bibliotecile cu ILS-uri tradiționale nu pot renunța, decât odată cu softul) – aș folosi (neortodox) câmpul 686 – Other Class Numbers, adică, în loc de indici numerici aș folosi (fără jenă) limbaj natural.

V. În loc de concluzii

Nu că ar putea asta să ne consoleze, dar nici alții nu-s (mult) mai breji. Vezi (fig. 16; Richard Pevear și Larissa Volokhonsky coautori cu Tolstoi ?).

fig-16-tolstoi-war-and-peace-worldcat-a

Fig. 16. Fișa „Război și pace” în WorldCat

În rezumat, teza mea este că schimbarea de paradigmă pe care o impune Europeana ne impune să ne concentrăm pe descriptori și pe descrieri cât mai ample. O lucrare, cu cât este mai semnificativă cultural, merită să fie „înfășurată” într-o poveste, adică să i se dezvăluie contextul geografic, istoric și cultural, să i se specifice nuanțat subiectul și să i se semnaleze conexiunile cu alte lucrări. Mai mult efort trebuie investit în descrierea lucrărilor, nu a „containerelor”. De pildă, nu descrierea fină a numărului de revistă e interesantă, ci a articolelor dinăuntru ! Și totul, având în minte utilizatorul final: publicul larg.

În fine, mari speranțe îmi pun în viitorul catalog național partajat: culturalia.ro. Acesta va fi deschis atât bibliotecilor, cât și muzeelor și arhivelor și va cuprinde și Biblioteca Digitală a României, pandantul național al Europeana. Modelul său de date se va baza pe modelele conceptuale CIDOC-CRM și FRBRoo, deci va fi foarte contemporan.

 

Written by poliptic

19 Ianuarie 2017 at 5:52 pm

Culturalia: Un portal românesc (?) [2]

leave a comment »

În postarea anterioară  — unde am început să schițez „arhitectura” bazei de date care ar sta la baza saitului culturalia.ro  (cam ezit să-i spun portal) — am promis că o să explic și indexul general. Amân, pentru că prieteni programatori (mai programatori ca mine) mi-au semnalat un serios punct slab la jurnalizare, adică la mecanismul de monitorizare a modificărilor, adică al trasabilității genealogiei fiecărei resurse. Așa că, o re-gândire a dus la modificări. Structura nouă a tabelei-jurnal apare în figura 1.

Fig. 1. Culturalia. Structura unei înregistrări în tabela-jurnal

O intrare constă din:

  • resourceGuid – identificatorul resursei (entitate sau aserțiune) afectate;
  • provenanceGuid – identificatorul entității-eveniment (de tip „asignare de atribut”) care agregă informațiile despre cine și pe ce bază a operat asupra resursei;
  • timeStamp – momentul în care s-a produs intervenția asupra resursei;
  • previousStatus – starea resursei înainte de intervenție.

Dacă acțiunile asupra resurselor (i.e. înregistrărilor) ar fi:

  • creare;
  • modificare;
  • ștergere (din motive de redondanță);
  • revizie (validare, invalidare, punere la îndoială);
  • fuziune a două (sau mai multe);
  • scindare,

atunci stările posibile ale resurselor (i.e. ale înregistrărilor) ar fi:

-4

arhivată (clonă)

-3

arhivată (invalidată)

-2

arhivată (redondantă)

-1

arhivată (înlocuită)

0

creată

1

creată (înlocuitoare)

2

problematică

3

validată

iată tranziția stărilor, în funcție de acțiuni (și de drepturile editorilor) ar fi:

a) asupra celor originare/înlocuite:

Creare

Punere la îndoială

Validare

Înlocuire

Fisiune

Ștergere

Invalidare

0

2

3

0

2

3

-1

-4

-2

-3

1

2

3

-1

-4

-2

-3

2

3

-1

-4

-2

-3

3

2

-1

-4

-2

-3

-1

2

3

-2

3

-1

-3

2

3

-1

-4

b) asupra celor înlocuitoare:

Înlocuire

Fisiune

Punere la îndoială

Validare

1

1

2

3

Scenariile editoriale importante ar fi:

a) modificările unei aserțiuni individuale, care ar fi:

  • subiectul: înlocuirea identificatorului resursei (unificare de identificatori);
  • predicatul: 1) înlocuirea identificatorului predicatului (unificare de identificatori), 2) rafinare (înlocuirea cu o subproprietate);
  • obiectul unei proprietăți: înlocuirea identificatorului resursei (unificare de identificatori);
  • obiectul unui atribut: corecție;
  • celelalte elemente: 1) adăugare, 2) modificare, 3) ștergere.

b ) fuziunea a două relații (provenite din surse diferite):

Exemplu: două atribute:

subiect

predicat

object

id1(Twain) id(nume) Mark Twain

subiect

predicat

object

id2(Twain) id(nume) Twain, Mark

fuzionează în:

subiect

predicat

object

id2(Twain) id(nume) Mark Twain

dacă se preferă id2(Twain) din a doua relație, dar se preia literalul din prima.

Fig. 2. Fuziunea a două atribute, plus două revizii

În exemplificarea din figura 2 avem trei momente:

  • t1 – cele două atribute fuzionează, dând naștere celei de-a treia, fapt consemnat în trei înregistrări de jurnal distincte;
  • t2 – o revizie pune la îndoială noul atribut (starea lui trece din 1 în 2), fapt consemnat în jurnal;
  • t3 – o nouă revizie validează noul atribut (starea lui trece din 2 în 3), fapt consemnat în jurnal.

Aserțiunile modificate sunt arhivate (întră în starea -1) și punctează către aserțiunile înlocuitoare/succesoare (care intră în starea 1)  — cum se sugerează și în figură. Identificatorul aserțiunii succesoare este consemnat în câmpul „successorGuid” (vezi figurile 5 și 6).

c) fisiunea unui atribut:

Exemplu: un atribut:

subiect

predicat

object

id(Zenobia) id(autor) Gellu Naum

… fisionează în trei aserțiuni (o relație și două atribute):

subiect

predicat

object

id(Zenobia) id(autor) id(Naum)
id(Naum) id(prenume) Gellu
id(Naum) id(nume de familie) Naum

Fig. 3. Fisiunea unui atribut (cu clonele evidențiate)

În exemplificarea din figura 3 se sugerează soluția (nu prea elegantă — poate-mi sugerează cineva una mai isteață) prin care se memorează legătura dintre o aserțiune și succesoarele ei: aserțiunea originară este clonată (starea -4), doar ca să fie loc pentru fiecare pointer către succesoarele sale (în „successorGuid”). În plus, clonele memorează (refolosind „predicateTypeGuid”) pointeri către aserțiunea clonată. (Pentru economie de spațiu, s-ar putea renunța la stocarea literalului în clonele atributelor.)

Această soluție (care consumă spațiu, prin clonele generate și înregistrările de jurnal aferente) — i.e. cu pointeri de la aserțiunile înlocuite către cele înlocuitoare (în loc de invers) — fac mai „ieftine” fuziunile decât fisiunile. Și asta, din pricină că presupun — știind datele cu care vom avea de-a face — că fuziunile vor fi mai multe decât fisiunile. Iar dacă practica va dovedi că se consumă cam mult spațiu cu clonele, poate că s-ar putea adăuga o tabelă specifică pentru memorarea pointerilor de la aserțiunile înlocuite spre cele înlocuitoare.

Figurile 4, 5 și 6 arată noile versiuni ale tabelelor „entitate”, „instanță de relație” și „atribut”. La fiecare, noutatea semnificativă este „successorGuid”.

Fig. 4. Culturalia. Structura unei intrări din tabela „entitate”

Fig. 5. Culturalia. Structura unei intrări din tabela instanțelor de relație

Fig. 6. Culturalia. Structura unei intrări din tabela instanțelor de atribut

Abia în postarea următoare se va comenta (promisul) index general.

Written by poliptic

17 Iunie 2012 at 11:34 pm

IFLA propune o zonă O ISBD şi invită la comentarii

leave a comment »

IFLA ne invită să comentăm (până pe 30 ianuarie) propunerea de Zonă 0  ISBD (forma conţinutului şi a tipului de suport).

Mi se pare important, ca idee şi ca demers de standardizare terminologică.

Textul englezesc (însoţit de exemple) se află la www.ifla.org/VII/s13/isbdrg/ISBD_Area_0_WWR.htm.

Am stat câteva ceasuri şi am produs o ciornă de traducere românească. M-ar bucura sugestii de corecţii.

Aşa, la prima impresie, nu-mi convine recomandarea ca termenii să fie asignaţi în limba agenţiei catalografice. ce ne facem cu cataloagele internaţionale ? Ar fi preferabil (după mine) să se recomande asignarea de concepte (în loc de termeni), iar OPAC-urile să facă bine să aleagă automat termenii în limba utilizatorului.

Written by poliptic

14 Decembrie 2008 at 12:34 am

Publicat în catalogare, indexare

O metodologie de indexare (pentru următorii 10 ani ?)

with one comment

Iertare: urmează un post lung cât o zi de post (dar cu poze !).

 

1. Context

 Zilele astea (5 – 6 iunie) s-a discutat la Biblioteca Naţională „Ghidul de indexare LIVES-Ro”  (adaptarea românească a „Guide d’indexation RAMEAU”, redactat de Biblioteca Naţională a Franţei).

 Am participat doar la discuţiile despre subdiviziunile de formă (continuare a discuţiilor de la sesiunea secţiei de indexare a ABR de la Iaşi) şi la prezentarea de către Monica Achiri a schemei de indexare FAST: Faceted Application of Subject Terminology.

 Au fost suficiente „subdiviziunile de formă” pentru a se ajunge la problema fundamentală: care să fie maniera de indexare în bibliotecile româneşti, în viitor ? Şi, premiza mea — sugerată în titlul postul — este că ceea ce alegem acum, alegem pentru cel puţin 10 ani. Aşadar, trebuie să fim atenţi şi să alegem ce e mai avansat, nu ce e deja demodat, dar supravieţuieşte prin inerţie.

 

2. Teza (de la bun început)

 Cred că:

ar trebui să deconstruim complet ghidul de indexare RAMEAU şi să (re)construim unul complet nou, bazat pe tehnologiile contemporane.

Şi asta fără să ţinem seama (i.e. să fim inhibaţi) de capabilităţile softurilor prezente acum pe piaţă. Şi fără să fim marcaţi de „paradigma MARC”. Mai mult:

 simultan, ar trebui să elaborăm şi cerinţele minimale pentru softurile care:

  1. permit maniera de indexare care ar rezulta şi
  2. pun în valoare acea indexare în OPAC.

Tot de la bun început, mă declar un ferm susţinător al tradiţionalilor descriptori precoordonaţi („vedete de subiect”, cum — restrictiv — li se mai spune) şi îmi exprim opoziţia fermă faţă de „relaxarea” lor propusă de schema FAST (care, propune o degradare a indexării, prin parţiala „coborâre” la simpla asignare de cuvinte-cheie, într-o — vană, după mine — speranţă că prin coborârea standardelor va creşte calitatea şi productivitatea).

[paranteză]

Ironic: şi la noi unii bibliotecari sunt îngrijoraţi de costul ridicat al catalogării/indexării profesionale. În acelaşi timp, nu aud bibliotecari dornici să economisească prin catalogare partajată !

[/paranteză]

[paranteză]

Folosesc prilejul pentru a declara că — (cel puţin) în materie de biblioteconomie — sunt un „conservator progresist” (am furat expresia „progressive conservative” din numele unui fost partid canadian).

[/paranteză]

 

3. Cum şi cu ce să indexăm ?

Să rememorăm: de ce sunt buni descriptorii precoordonaţi (i.e. lanţuri de descriptori simpli) ? Păi pentru că:

  1.  împiedică falsa coordonare (fenomen frecvent în cazul căutării postcoordonate);
  2. permit colocarea elegantă a subiectelor/obiectelor în index, deci o baleiere sistematică;
  3. dau căutătorului o idee asupra subiectelor resursei pe care o indexează (mult mai bună decât cea dată de o simplă succesiune de cuvinte-cheie izolate).

Mi se par motive temeinice să-i păstrăm. Desigur, nu pot fi impuşi, ci doar recomandaţi şi elaborarea lor facilitată. Dar aş fi furibund împotriva unor softuri care să-i interzică !

Aşadar, separată pe două planuri, propunerea mea este:

A. La momentul indexării:

Indexatorul să fie liber (aproape total) în construirea descriptorului, cu alte cuvinte să fie (aproape total) liber în alegerea  elementelor pe care să le precoordoneze.

[paranteză]

Aş fi foarte mulţumit dacă s-ar admite prefixarea fiecărui element (ezit să folosesc „termen”; o să explic mai jos de ce) cu un rol, aşa cum se făcea în defuncta (dar geniala) schema de indexare a lui Derek Austin, numită PRECIS [Preserved Context Indexing System].

[referinţă]

Lucrarea originară (ediţia a II-a):

Austin, Derek William; Dykstra, Mary. PRECIS: A manual of concept analysis and subject indexing. — London : British Library Bibliographic Services Division, 1984

Maximum ce-am găsit online:

www.musiclibraryassoc.org/BCC/BCC-Historical/BCC95/95WGFAM2.html

http://dlist.sir.arizona.edu/1764/01/SIG-CR2004Kwasnik.pdf

[/referinţă]

De altfel, cam aşa imaginasem — grupul în care lucram — în anii ’80, aşa zisele „fraze de indexare FOCUS”. Din păcate „frazele de indexare” au rămas doar pe hârtie. Păcatele tinereţii…

[/paranteză]

 

B. În prealabil:

Să construim un „sistem de organizare a cunoştinţelor” [SOC] complex (mai complex decât RAMEAU !), de fapt o ontologie, în care să comasăm toate fişierele de autoritate (existente sau doar râvnite), şi care să furnizeze indexatorului „prefabricatele” convenabile pentru construirea descriptorilor precoordonaţi.

 

4. Fabulaţiune despre cum să fie „sistemul de organizare a cunoştinţelor” (adică ontologia)

[paranteză]

Definiţia clasică a sistemelor de organizare a cunoştinţelor, după Gail Hodge: 

The term knowledge organization systems is intended to encompass all types of schemes for organizing information and promoting knowledge management. Knowledge organization systems include classification and categorization schemes that organize materials at a general level, subject headings that provide more detailed access, and authority files that control variant versions of key information such as geographic names and personal names. Knowledge organization systems also include highly structured vocabularies, such as thesauri, and less traditional schemes, such as semantic networks and ontologies. Because knowledge organization systems are mechanisms for organizing information, they are at the heart of every library, museum, and archive.

 

Termenul „sisteme de organizare a cunoştinţelor” este menit să acopere toate tipurile de scheme pentru organizarea informaţiei şi promovarea managementului cunoştinţelor. Sistemele de organizare a cunoştinţelor includ schemele de clasificare şi de categorizare (?) care organizează materialele la nivel general, vedetele de subiect care oferă un acces mai fin şi fişierele de autoritate care gestionează diferitele versiuni informaţiilor-cheie, cum ar fi numele geografice şi numele personale. Sistemele de organizare a cunoştinţelor includ şi vocabularele înalt structurate, cum ar fi tezaurele, ca şi scheme mai puţin tradiţionale, precum reţelele semantice şi ontologiile. Deoarece sistemele de organizare a cunoştinţelor sunt mecanisme pentru organizarea informaţiei, ele se află în nucleul fiecărei biblioteci, fiecărui muzeu şi fiecărei arhive.

 

Hodge, G. (2000). Systems of Knowledge Organization for Digital libraries. Beyond traditional authority files. Washington, DC: the Council on Library and Information Resources.

 

Şi definiţia ontologiei după Tom Gruber:

 

Cea clasică (1992) – http://www-ksl.stanford.edu/kst/what-is-an-ontology.html

 

An ontology is a specification of a conceptualization.

 

O ontologie este o specificare a unei conceptualizări.

 

Ediţia recentă (2007) – http://tomgruber.org/writing/ontology-definition-2007.htm 

In the context of computer and information sciences, an ontology defines a set of representational primitives with which to model a domain of knowledge or discourse.  The representational primitives are typically classes (or sets), attributes (or properties), and relationships (or relations among class members).  The definitions of the representational primitives include information about their meaning and constraints on their logically consistent application.  In the context of database systems, ontology can be viewed as a level of abstraction of data models, analogous to hierarchical and relational models, but intended for modeling knowledge about individuals, their attributes, and their relationships to other individuals.  Ontologies are typically specified in languages that allow abstraction away from data structures and implementation strategies; in practice, the languages of ontologies are closer in expressive power to first-order logic than languages used to model databases.  For this reason, ontologies are said to be at the „semantic” level, whereas database schema are models of data at the „logical” or „physical” level.  Due to their independence from lower level data models, ontologies are used for integrating heterogeneous databases, enabling interoperability among disparate systems, and specifying interfaces to independent, knowledge-based services.  In the technology stack of the Semantic Web standards, ontologies are called out as an explicit layer.  There are now standard languages and a variety of commercial and open source tools for creating and working with ontologies. 

În contextul informaticii şi a ştiinţei informaţiei (aşa se zice pe româneşte ?), o ontologie defineşte un set de primitive reprezentaţionale, cu care să se modeleze un domeniul al cunoaşterii sau al discursului. Primitivele reprezentaţionale tipice sunt clasele (sau seturile), atributele (sau proprietăţile) şi relaţionările (sau relaţiile între membrii claselor)… 

(iertare: mi-e lene să traduc mai departe; e tehnic şi nu-mi foloseşte aici)

[/paranteză]

 

Aşadar, entităţile ontologiei ar trebui să fie: 

  •  concepte
  • clase
  • persoane
  • colectivităţi
  • locuri geografice
  • entităţii temporale
  • situaţii (asocieri de mai multe entităţi):
  • entităţi geo-politice
  • evenimente
  • identităţi bibliografice
  • situaţii cu nume (e.g. „cearta universaliilor”)
  • situaţii (fără nume), e.g. subiecte, clase
  • lucrări
  • expresii 

Din entităţile grupului 1 FRBR, n-aş băga în ontologie (convenţional): 

  • manifestările
  • exemplarele 

care — să zicem — să rămână „obiectele bibliografice”. Deşi, atât manifestările cât şi exemplarele pot fi foarte bine subiecte de lucrări. 

Ca să-mi ilustrez propunerea, o să folosesc un exemplu. Să zicem că am de catalogat/indexat: 

Varşovia : Insurecţia din 1944 / Norman Davies ; Traducere din limba engleză de Diana Elena Puşcaşu. — Bucureşti : RAO International Publishing Company, 2008. — ISBN 978-973-103-493-5 

Văd că-i o traducere; găsesc repede la OCLC, în WorldCat zece manifestări (i.e. ediţii; văd că există două expresii, ambele de limbă engleză: text şi audioînregistrare) şi o aleg pe cea care-mi pare a fi prima (presupun că titlul ei e şi al lucrării): 

Rising ’44 : the Battle for Warsaw / Norman Davies. — London : Macmillan, 2003. — ISBN 0333905687 9780333905685 

Există deja cel puţin două expresii ale lucrării, aşa că merită să fac o înregistrare de lucrare, două de expresie şi înregistrarea manifestării al cărei reprezentant îl am în mână. Să zicem: 

„Rising '44”

fig. 1

[lucrare]

id w-1
titlu [en] Rising ’44 : the Battle for Warsaw
titlu [ro] Insurecţia ’44 : bătălia pentru Varşovia
autor p-1 (i.e. „Norman Davies”)
tip text
gen non-ficţiune

 

[expresie]

id e-1
realizează w-1 (i.e. „Rising ’44 : the Battle for Warsaw”)
limba en

 

[expresie]

id e-2
realizează w-1 (i.e. „Rising ’44 : the Battle for Warsaw”)
limba română
traducător p-2 (i.e. „Diana Elena Puşcaşu”)

 

[manifestare]

id m-1
încorporează e-2
titlu şi m.r. Varşovia : Insurecţia din 1944 / Norman Davies ; Traducere din limba engleză de Diana Elena Puşcaşu

  

[persoană]

id p-1
signatură Norman Davies (istoric englez) (1938 – )

 

[persoană]

id p-2
signatură Diana Elena Puşcaşu (traducătoare)

  

Acum mai trebuie să asignez lucrării (nu manifestării ! — conform filozofiei FRBR) subiectele. Să presupunem că în ontologia pe care o am la dispoziţie, am:

 

fragment de ontologie

fig. 2 

[entitate geopolitică]

id egp-1
apelaţiune [ro] România
apelaţiune [en] Romania

  

[entitate geopolitică]

id egp-2
apelaţiune [ro] Polonia
apelaţiune [en] Poland

 

[clasă]

id c-1
termen >> [ro] istorie
termen >> [en] history

 

[clasă]

id c-2
termen >> [ro] războaie
termen >> [en] wars
subclasă a c-1 (i.e. „istorie”)

 

[situaţie]

id s-1
componentă egp-1 (i.e. „România”)
componentă c-1 (i.e. „istorie”)

 

[situaţie]

id s-2
componentă egp-2 (i.e. „Polonia”)
componentă c-1 (i.e. „istorie”)

 

[eveniment]

id ev-1
apelaţiune [ro] Al Doilea Război Mondial (1939-1945)
apelaţiune [en] WW II (1939-1945)
membru a c-2 (i.e. „războaie”)

 

[situaţie]

id s-3
componentă ev-1 (i.e. „Al Doilea Război Mondial”)
componentă s-1 (i.e. „România <> istorie”)

 

[situaţie]

id s-4
componentă ev-1 (i.e. „Al Doilea Război Mondial”)
componentă s-2 (i.e. „Polonia <> istorie”)

 

[eveniment]

id ev-2
apelaţiune [ro] Lovitura de stat de la 23 august 1944
apelaţiune [en] The August 23 Coup d’état
apelaţiune [en] King Michael Coup (August 23, 1944)
parte a s-3 (i.e. „România <> Al Doilea Război Mondial”)

 

[eveniment]

id ev-3
apelaţiune [ro] Insurecţia varşoviană (august – octombrie 1944)
apelaţiune [en] Warsaw Uprising (August – October 1944)
parte a s-4 (i.e. „Polonia <> Al Doilea Război Mondial”)

 

Note: 

  1. În cazul claselor (e.g. „istorie”, „războaie”) situaţia e mai complicată. Termenii (substantive comune) prin care sunt designate sunt entităţi distincte (o să revin mai jos); de asta i-am prefixat în diagramă cu „>>”.
  2. Fiindcă în cazul unor situaţii ordinea componentelor nu e fixă, am vrut să sugerez asta prin conectorul „<>” (în loc de „–„).
  3. Ca să scot în evidenţă faptul că „neutralitatea faţă de limbă” (i.e. multilingvismul) e important în acest context, am consemnat apelaţiuni în două limbi pentru entităţile primare.
  4. Notez că la evenimentul „23 august” i-am consemnat două apelaţiuni sinonime în englezeşte, ca să semnalez că îmi doresc şi această (foarte posibilă) facilitate.
  5. Entitatea „istorie” am considerat-o aici o clasă (în sensul de „mulţimea evenimentelor istorice”). De fapt are o natură dublă, i.e. e şi un concept. 

Aşadar, mă folosesc de evenimentul ev-3, gata predefinit, pe care-l asignez ca subiect lucrării mele: 

Norman Davies. Insurecţia ’44 : bătălia pentru Varşovia

Insurecţia varşoviană (august – octombrie 1944) [despre] 

Acum, apelaţiunea lui poate apărea în prezentarea tuturor manifestărilor lucrării cu pricina, subiectul fiind „moştenit” de toate expresiile şi manifestările unei lucrări: 

Varşovia : Insurecţia din 1944 / Norman Davies ; Traducere din limba engleză de Diana Elena Puşcaşu. — Bucureşti : RAO International Publishing Company, 2008. — ISBN 978-973-103-493-5.

Insurecţia varşoviană (august – octombrie 1944) [despre] 

 

Rising ’44 : the Battle for Warsaw / Norman Davies. — London : Macmillan, 2003. — ISBN 0333905687 9780333905685

Insurecţia varşoviană (august – octombrie 1944) [despre] 

Notez en passant că, dacă nu aveam predefinit evenimentul, ar fi trebuit să pot să-l definesc şi să-l introduc în ontologie (vreau să zic că indexatorul trebuie să aibă posibilitatea să propună extensii ale ontologiei, chiar dacă, în practică, decizia lui poate fi schimbată de indexatorii „seniori” care — se presupune —supervizează ontologia). 

 

5. Fabulaţiune despre cum să se prezinte indexul de descriptori 

Spuneam mai sus, că unul dintre atuurile majore ale descriptorilor precoordonaţi este — după mine — posibilitatea de baleiere elegantă a indexului, pe care o oferă. Acum, mergând pe exemplul dat, să vedem cum ar putea un soft deştept să prezinte indexul, pe baza informaţiilor pe care le are din ontologie. Astfel, folosind doar signaturile în româneşte şi permutând componentele, un index „clasic” ar fi:  

 

Al Doilea Război Mondial (1939 – 1945)

Al Doilea Război Mondial – Polonia

Al Doilea Război Mondial – Polonia – Insurecţia varşoviană

Al Doilea Război Mondial – România

Al Doilea Război Mondial – România – Lovitura de stat de la 23 august 1944

Insurecţia varşoviană (august – octombrie 1944)

istorie

istorie – războaie

istorie – războaie – Al Doilea Război Mondial

istorie – războaie – Al Doilea Război Mondial – Polonia

istorie – războaie – Al Doilea Război Mondial – Polonia – Insurecţia varşoviană

istorie – războaie – Al Doilea Război Mondial – România

istorie – războaie – Al Doilea Război Mondial – România – Lovitura de stat de la 23 august 1944

istorie – Polonia

istorie – Polonia – războaie

istorie – Polonia – războaie – Al Doilea Război Mondial

istorie – Polonia – războaie – Al Doilea Război Mondial – Insurecţia varşoviană

istorie – România

istorie – România – războaie

istorie – România – războaie – Al Doilea Război Mondial

istorie – România – războaie – Al Doilea Război Mondial – Lovitura de stat de la 23 august 1944

Lovitura de stat de la 23 august 1944

Polonia

Polonia – istorie

Polonia – istorie – războaie

Polonia – istorie – războaie – Al Doilea Război Mondial

Polonia – istorie – războaie – Al Doilea Război Mondial – Insurecţia varşoviană

războaie

războaie – Al Doilea Război Mondial

războaie – Al Doilea Război Mondial – Polonia

războaie – Al Doilea Război Mondial – Polonia – Insurecţia varşoviană

războaie – Al Doilea Război Mondial – România

războaie – Al Doilea Război Mondial – România – Lovitura de stat de la 23 august 1944

România

România – istorie

România – istorie – războaie

România – istorie – războaie – Al Doilea Război Mondial

România – istorie – războaie – Al Doilea Război Mondial – Lovitura de stat de la 23 august 1944

 

Iar o prezentare mai bună ar fi: 

 

Al Doilea Război Mondial (1939 – 1945) [n1 resurse]

                Polonia [n1-1 resurse]

                                Insurecţia varşoviană  [n1-1-1 resurse]

                România [n1-2 resurse]

                                Lovitura de stat de la 23 august 1944 [n1-2-1 resurse]

Insurecţia varşoviană (august – octombrie 1944) [n2 resurse]

istorie [n3 resurse]

                războaie [n3-1 resurse]

                                Al Doilea Război Mondial [n3-1-1 resurse]

                                                Polonia [n3-1-1-1 resurse]

                                                                Insurecţia varşoviană [n3-1-1-1-1 resurse]

                                                România [n3-1-1-2 resurse]

                                                                Lovitura de stat de la 23 august 1944 [n3-1-1-2-1 resurse]

                Polonia [n3-2 resurse]

                                războaie [n3-2-1 resurse]

                                                Al Doilea Război Mondial [n3-2-1-1 resurse]

                                                                Insurecţia varşoviană [n3-2-1-1-1 resurse]

                România [n3-3 resurse]

                                războaie [n3-3-1 resurse]

                                                Al Doilea Război Mondial [n3-3-1-1 resurse]

                                                                Lovitura de stat de la 23 august 1944 [n3-3-1-1-1 resurse]

Lovitura de stat de la 23 august 1944 [n4 resurse]

Polonia [n5 resurse]

                istorie [n5-1 resurse]

                                războaie [n5-1-1 resurse]

                                                Al Doilea Război Mondial [n5-1-1-1 resurse]

                                                                Insurecţia varşoviană [n5-1-1-1-1 resurse]

războaie [n6 resurse]

                Al Doilea Război Mondial [n6-1 resurse]

                                Polonia [n6-1-1 resurse]

                                                Insurecţia varşoviană [n6-1-1-1 resurse]

                                România [n6-1-2 resurse]

                                                Lovitura de stat de la 23 august 1944 [n6-1-2-1 resurse]

România [n7 resurse]

                istorie [n7-1 resurse]

                                războaie [n7-1-1 resurse]

                                                Al Doilea Război Mondial [n7-1-1-1 resurse]

                                                                Lovitura de stat de la 23 august 1944 [n7-1-1-1-1 resurse] 

(Din pricina simetriei exemplului meu) lucrarea lui Davies apare sub jumătate dintre aceste intrări. Se observă că descriptorii formaţi din mai multe componente apar ca intrări sub fiecare componentă (componentele sunt permutate) şi astfel, cu o singură asignare, am pus lucrarea lui Davies sub 22 de intrări de index ! 

[paranteză]

Numărul ăsta poate să crească în timp, dacă cineva rafinează ontologia şi introduce locul geografic „Europa” şi situaţia „războaie <> Europa” şi reconfigurează corespunzător relaţiile existente.

[/paranteză] 

Şi asta, în timp ce în Worldcat, la OCLC, găsesc doar 3 subiecte asignate manifestării englezeşti: 

 

World War, 1939-1945 – Poland – Warsaw.

Warsaw (Poland) – History – Uprising, 1944.

Poland – History – Occupation, 1939-1945. 

 

Întrebarea e: să se genereze toate intrările posibile ? Cred că nu e cazul, şi anume, intrări precum:  

Al Doilea Război Mondial – istorie

Insurecţia varşoviană – Polonia

Lovitura de stat de la 23 august 1944 – România

Polonia – Al Doilea Război Mondial – istorie

România – Al Doilea Război Mondial – istorie 

 

adică intrări în care o componentă cu sens mai larg apare mai la dreapta uneia cu un sens mai restrâns, nu folosesc, din logica prezentării ierarhice (arborescente), unde progresia spre dreapta semnifică restrângere de sens. 

 

6. Despre libertatea indexatorului 

Să reluăm: în acest scenariu, indexatorul are la dispoziţie o ontologie din care îşi ia componentele pentru a construi descriptorii de care are nevoie. Aşadar, el ar trebui să fie (relativ) liber să facă asocierile pe care le consideră necesare pentru a construi descriptorii cei mai specifici pentru caracterizarea resursei (fie aceasta asignarea unui subiect sau încadrarea într-o clasă — NB. nu clasă în sens CZU). 

Mai mult: dacă nu găseşte în ontologie componentele de care are nevoie (sau descriptorii gata construiţi), el trebuie să poată să-şi extindă corespunzător ontologia. 

De pildă, să presupunem că am de indexat lucrarea: 

Ion Petrică. Confluenţe culturale româno-polone : a doua jumătate a sec. al XIX-lea 

încorporată în manifestarea: 

Confluenţe culturale româno-polone : (a doua jumătate a sec. al XIX-lea) / Ion Petrică. — Bucureşti : Minerva, 1976 

şi vreau să-i asignez descriptorul: „Polonia <> România <> relaţii culturale – a doua jumătate a sec. XIX”. 

Atunci, având deja „România” şi „Polonia” mai trebuie să adaug în ontologie doar conceptul „relaţii culturale” şi situaţia „Polonia <> România <> relaţii culturale”. Apoi asignez această situaţie — prin relaţia „subiect” — lucrării mele. Astfel, ea va apărea în indexul de subiecte sub intrările:  

Polonia

                România

                                relaţii culturale

România

                Polonia

                                relaţii culturale

relaţii culturale

                România

                                Polonia

                Polonia

                                România 

Mai e un aspect de discutat aici: subdiviziunile. După părerea mea, din raţiuni practice, subdiviziunile trebuie să fie doar caracterizări fine ale relaţiei „subiect” dintre o lucrare şi un descriptor. Cu alte cuvinte, să aibă statut de proprietăţi ale relaţiei şi nu să nu facă parte din ontologie. În exemplul ăsta, „a doua jumătate a sec. XIX” este o astfel de subdiviziune, şi ea trebuie să fie expusă la prezentarea lucrării, dar nu şi în indexul de subiecte. 

Ion Petrică. Confluenţe culturale româno-polone : a doua jumătate a sec. al XIX-lea

                Polonia – România – relaţii culturale – a doua jumătate a sec. XIX [despre] 

[paranteză]

Similar, astfel de proprietăţi se pot atribui şi altor relaţii între diverse entităţi. De pildă relaţiei „afiliere” dintre o „persoană” şi o „colectivitate” i se poate ataşa legitim o perioadă.

[/paranteză] 

 

7. Conceptele, clasele şi termenii 

La discuţia care a provocat acest text, dna. Denis Rotaru a ridicat — la un moment dat — o problemă ce mi se pare importantă: distincţia dintre „poezie” ca subiect şi „poezii” ca „subdiviziune de formă” (în jargonul RAMEAU). Mie, soluţia radicală pentru acest tip de probleme (precis foarte frecvente) este introducerea în ontologie atât a conceptului „poezie/poetry”, cât şi a clasei „poezii/poems”. Şi aplicarea soluţiei terminologice standard: introducerea termenilor în ontologie ca entităţi distincte şi designarea acestei perechi concept-clasă cu un acelaşi termen în româneşte (dar cu termeni diferiţi în englezeşte, de pildă). 

 

designări

fig. 3 

Aşadar, conceptul „poezie” (cf. DEX: modalitate a literaturii care exprimă mesajul artistic cu ajutorul imaginilor expresive, al unui limbaj concentrat, al afectivităţii, al rimei, al ritmului etc.) este asociat — prin relaţia „designat de” cu termenul „poezie, poezii”, iar signatura lui este „poezie” (putem conveni că relaţia de designare între un concept şi un termen expune singularul termenului). Pe de altă parte, clasa „poezii” (cf. DEX: (concr.) creaţie literară în versuri) este asociată (în româneşte) cu acelaşi termen, iar signatura ei este „poezii” (putem conveni că relaţia de designare între o clasă şi un termen expune pluralul termenului). 

Lasă că, pe de altă parte, termenul englezesc „poem, poems” designează atât clasa „poezii” cât şi subclasa sa „poeme” (sau nu ? există un termen englezesc ?). 

Tot atunci, dna. Nina Botez a ridicat şi o altă problemă care mi se pare importantă: clasele complexe. Acestea — de dragul generării intrărilor de index permutabile — ar trebui să fie reprezentate în propunerea mea ca situaţii (unele chiar cu nume propriu). Exemplul este: „scriitori de limbă maghiară din România”. Las pe altă dată discuţia fină despre ce înseamnă „din România”: născuţi pe teritoriul actual al României ? cetăţeni români ? care au trăit minimum 10 ani în România ? etc. 

 

scriitori maghiari din România

fig. 4 

Aşadar, am „construit” clasa „scriitori de limbă maghiară din România”, ca o situaţie: „scriitori <> limba maghiară <> România”.  

[clasă]

id c-3
termen >> [ro] scriitori

 

[concept]

id co-1
termen >> [ro] limba maghiară

 

[situaţie]

id s-5
componentă egp-1 (i.e. „România”)
subclasă a c-3 (i.e. „scriitori”)
componentă co-1 (i.e. „limba maghiară”)
apelaţiune [ro] scriitori de limbă maghiară din România

 

Deci, intrările de index (generabile automat) ar fi:  

limba maghiară

                scriitori

                                România

                România

                                scriitori

România

                limba maghiară

                                scriitori

                scriitori

                                limba maghiară

scriitori

                limba maghiară

                                România

                România

                                limba maghiară 

dar, în afara indexului, s-ar putea folosi direct apelaţiunea (mai naturală) „scriitori de limbă maghiară din România”. 

Sigur, o să-mi spuneţi că în indexuri, în loc de „limba maghiară” ar trebui să se folosească „maghiară, limba”, ca să intre la „M”. Cred că cel mai bine e să intre atât la „L”, cât şi la „M” (n-avem de ce să facem economie de intrări). După mintea mea, oricare entitate poate genera multiple intrări de index (chiar dacă unele „ascunse”). În cazul astă, mi s-ar părea OK să avem şi „apelaţiunea fantomă” „maghiară, limba”. 

 

8. Epilog 

Vestea proastă e că multe detalii ale unei asemenea scheme mai trebuie gândite bine. Şi sunt destule probleme nerezolvate. Spun una de care sunt (de mult) conştient: cum să reprezinţi dinamica în timp a unei entităţi geopolitice ? Ce e aia „România” ? Statul cu acest nume având teritoriul din 2008 ? Din 1941 ? Din 1920 ? Din 1914 ? 

Apoi, cum să pui în indexuri unităţile administrativ-teritoriale ? Exemplu: 

România

                jud. Maramureş

                                com. Şomcuta Mare

                                                Vălenii Şomcutei 

sau chiar signatura: 

Vălenii Şomcutei (com. Şomcuta Mare, jud. Maramureş, România). 

Eu le-aş pune pe ambele. Bine o fi ? 

Dar, pe lângă dificultăţi, cred că ceea ce vă propun aici e în ton cu dezvoltările tehnologice contemporane, chiar dacă google-izarea webului pare a zice că trendul e spre simplu şi amatoristic.

Written by poliptic

15 Iunie 2008 at 12:08 am