Chestiuni documentaristice (inclusiv bibliologice)

Dan Matei (care îşi dă şi el cu părerea).

Arhiva pentru categoria ‘catalogare

IFLA a publicat forma finală a „Declarației de Principii Internaționale de Catalogare”

cu un comentariu

 

La adresa www.ifla.org/VII/s13/icp/ poate fi citită forma finală a Declarației.

Am început o traducere (n-ar trebui să-mi fie prea greu, fiindca am tradus în 2004 prima formă, cea de la Frankfurt: www.cimec.ro/Metodologice/Catalogare.htm#Frank, deși forma de acum e de două ori mai lungă).

Problema mea acum: acuratețea traducerii formulărilor principiilor propriu-zise. De aceea le expun aici (preliminar), pentru a profita de eventualele critici.

Principiile, în versia mea, sunt:

2.1. Satisfacerea nevoilor de informare ale utilizatorului [convenience of the user]. Deciziile privind descrierile și formele controlate de apelațiuni din punctele de acces ar trebui luate din perspectiva utilizatorului.

2.2. Uzanța [common usage]. Vocabularul folosit în descrieri și acces ar trebui să fie conform cu cel al majorității utilizatorilor.

2.3. Reprezentativitatea [representation]. Descrierile și formele controlate ale numelor ar trebui să se bazeze pe felul în care o entitate se autodescrie.

2.4. Acuratețea [accurecy]. Entitatea descrisă ar trebui să fie înfățișată cu exactitate.

2.5. Suficiența și necesitatea [sufficiency and necessity]. Ar trebui incluse doar acele elemente ale descrierilor și ale formelor controlate de apela’iuni care sunt necesare operațiunilor utilizatorului și sunt esențiale pentru a identifica în mod unic o entitate.

2.6. Relevanța [significance]. Elementele informaționale ar trebui să fie semnificative din punct de vedere bibliografic.

2.7. Economia [economy]. Dacă există căi alternative de a atinge un obiectiv, ar trebui preferată calea care favorizează la maximum economia de ansamblu (i.e. costul cel mai redus sau abordarea cea mai simplă).

2.8. Coerența și standardizarea [consistency and standardization]. Descrierile și elaborarea punctelor de acces ar trebui să fie cât mai standardizate posibil. Aceasta asigură mai multă coerență care, la rândul ei, sporește posibilitățile de partajare a datelor bibliografice și de autoritate.

2.9. Tratarea unitară [integration]. Descrierile tuturor tipurilor de materiale și forme controlate de apelațiuni pentru toate tipurile de entități ar trebui să se bazeze pe un set comun de reguli, in măsura în care acesta este relevant.

Concizia principiilor face traducerea problematică. Mai ales din pricina mulțimii „falșilor prieteni”.

A doua problemă pe care aș vrea s-o expun (înainte de publicarea traducerii) este invenția adjectivului „subiectual/subiectuală”.  Adjectivul mi s-a părut convenabil în expresii precum „catalogarea subiectuală” pentru „subject cataloguing” (prin analogie cu „catalogare descriptivă” [descriptive cataloguing]) sau „tezaure subiectuale” pentru „subject thesauri”. Adjectivul e convenabil dar nu-s sigur că e „legitim”.

 

Actualizare (05.03.2009):

Prietana Florica Câmpeanu mi-a făcut câteva bune sugestii:

  • „reprezentativitate” în loc de „reprezentare”;
  • „exact înfățișată” în loc de „corect înfățișată”;
  • „semnificativitate” în loc de „însemnătate”.

Între timp văd că a apărut și versia franceză, care va fi de mare ajutor.

În povestea cu „subiectual”, încă nici Florica și nici Claudia nu m-au convins.  În calitate de terminolog (:-) sunt mare amator de neologisme. Dar ăsta n-ar fi un motiv suficient. Mie „subiectual” mi se pare sugestiv, iar „catalogarea pe subiecte” mi s-a părut totdeauna cam chinuit și — stilistic — șubred. Dacă am zice „catalogare pe materii” cum sugerează Florica, mă tem că tare puțină lume ar înțelege. Să ne mai gândim.

 

Actulizare (09.03.2009):

Colegele/colegii de la Brașov, mi-au făcut câteva bune sugestii. De pildă „relevanță” și „satisfacerea nevoilor de informare…”. Nu m-au convins cu toate sugestiile, dar nu-i timpul pierdut :-)

Pe de altă parte, m-am decis să folosesc „trebuie” pentru „must” și „ar trebui” pentru „should”.

Written by poliptic

1 martie 2009 at 8:17 pm

Postat in cataloage, catalogare

Din nou despre Catalogul Naţional Partajat (2): planurile de discuție

cu un comentariu

Revin la discuția despre Catalogul Național Partajat [CNP]. E și timpul: pe 18 februarie se discută subiectul la Comisia Națională a Bibliotecilor și vreau să expun (din vreme) poziția pe care o să susțin acolo.

Mi se pare că problema se poate discuta pe trei nivele: „politic”, tehnic/catalografic și tehnic/informatic. La primul nivel se răspunde la întrebarea: da sau nu CNP. La celelalte se discută cum să se facă CNP. 

 

A. Nivelul „politic” 

Considerente politice rezolvă problema dacă să se dezvolte un CNP (în sensul de bază de date centralizată, în care se cataloghează, i.e. nu doar un catalog colectiv !) sau nu. Deoarece: 

  1. CNP este un serviciu public util pentru toți cetățenii (i.e. și toți contribuabilii) – în plus vizibil („aici sunt banii dumneavoastră”);
  2. CNP evită risipa de ban public, prin minimizarea duplicării de efort de catalogare, 

răspunsul este: da, trebuie să se dezvolte/instituționalizeze un Catalog Național Partajat. Mai mult: pentru organizațiile care cataloghează pe bani publici, folosirea curentă a CNP-ului n-ar trebui să fie opțională. 

<paranteză>

Nu spun că „interogările federalizate” [federated search] nu au rost. Au mare sens pentru baze de date disjuncte, e.g. colecțiile online de reviste științifice (e-journals) furnizate de diverși furnizori, de pildă EBSCO, ABI/Inform, Blackwell Synergy, ERIC, JSTOR, LexisNexis, ScienceDirect, SpringerLink. E puțin probabil să găsești același articol în două asemenea baze de date.

</paranteză> 

A doua chestiune în care intervin considerente politice este: elaborarea unui soft nou sau achiziționarea unui soft comercial existent ? 

Deoarece este un serviciu public pe termen lung (prin care se administrează și întreține o resursă publică națională), CNP-ul are nevoie de un soft care să fie proprietate publică in integrum. Cu alte cuvinte, softul poate fi dezvoltat de o companie comercială, dar sursele sale trebuie să devină proprietate publică, iar dezvoltatorul trebuie să cesioneze (desigur, neexclusiv) statului drepturile de proprietate intelectuală asupra produsului. (Așa se întâmplă, de pildă, în cazul softului care se dezvoltă acum – în cadrul unui proiect Phare – pentru sistemul informatic de protecție a patrimoniului cultural mobil, în care sunt implicați Ministerul Culturii, Poliția, Vama și Poliția de Frontieră.)

 

B. Nivelul catalografic

 La nivel tehnic/catalografic, cred că CNP ar trebui să gestioneze metadatele bibliografice într-un format generic, în care: 

a) entitățile bibliografice să fie convertibile (fără pierdere de informație) în (cel puțin): 

ba chiar și în ROMARC :-) 

b) entitățile „de autoritate” și să fie convertibile (fără pierdere de informație) în (cel puțin): 

În plus, formatul generic ar trebui să asigure compatibilitatea cu FRBR  (i.e. să aibă scheme pentru lucrări și expresii). 

Desigur, natura însăși a catalogului va impune reguli unitare de catalogare. 

Deși CNP trebuie să fie o bază de date centralizată, cred că extensii locale ale înregistrărilor bibliografice partajate ar fi foarte utile (e.g. descriptori locali, confidențiali). 

 

C. Nivelul informatic 

Din punct de vedere informatic, CNP ar trebui să înglobeze cele mai noi tehnologii web (chiar webul semantic), deoarece un sistem dezvoltat acum, va trebui să fie (tehnologic) proaspăt încă cel puțin 10 ani. 

Prin urmare, tehnologii precum: 

  • linked data;
  • Z39-88 (i.e. OpenURL);
  • servicii web (pentru particularizări de interfețe, pe lângă o interfață generică);
  • WSRP (pentru furnizarea de date bibliografice unor portleturi care să poată fi incluse în portaluri diferite). 

ar trebui de la început să fie implementate în softul pentru CNP.

Written by poliptic

16 februarie 2009 at 1:14 am

Din nou despre Catalogul Naţional Partajat (1): catalogarea partajată

cu un comentariu

Din fericire, Comisia Naţională a Bibliotecilor [CNB] a relansat discuţia despre Catalogul Naţional Partajat [CNP]. Aud că iniţiativa CNB a provocat şi o discuţie pe acest subiect la Asociaţia Bibliotecarilor din România [ABR] (deşi sunt membru, n-am auzit nimic „oficial”; era — probabil — numai pentru „inner circle”; nu ştiam că-n ABR sunt două categorii de membri !). Foarte bine ! Era şi vremea. Sper ca şi Ministerul Culturii să reia ideea de a finanţa proiectul (finanţare întreruptă — reamintesc — la jumătatea lui 2005).

Suntem câţiva „membri asociaţi” ai CNB şi, în această calitate, am primit spre comentare o propunere a dnei. Doina Ostafe. Cel mai bun „comentariu” la care m-am putut gândi a fost reluarea propunerii Asociaţiei Naţionale a Bibliotecarilor şi Bibliotecilor Publice din România [ANBPR] de acum mai bine de trei ani, (foarte) uşor adusă la zi. Zic uşor, fiindcă şi-a păstrat toate calităţile. E la fel de actuală (doar că mai urgentă) ca în 2005.

Şi fiindcă în mediile bibliotecare din România partajarea catalogării a fost mereu — de fapt — respinsă, cred că merită să se reia argumentarea pro.

De fapt nu mi-a fost niciodată limpede care sunt raţiunile profunde pentru care un catalog partajat naţional este respins. Mă tem că e o combinaţie de complexe de superioritate cu complexe de inferioritate, adică o neîncredere în ce fac alţii, combinată cu temerea că ne văd şi alţii erorile. Dă Doamne să mă înşel. Drept că mai aud şi argumente de genul: de ce să beneficieze şi alţii de munca noastră ? Dar acest argument se aduce pe şoptite: de fapt, cei care-l folosesc ştiu că prestează un serviciu public, deci e natural să beneficieze şi alţii.

În orice caz, cred — mai mult ca oricând — că un catalog naţional partajat (centralizat) este necesar.

Eu, în calitate de reprezentant al CIMEC, am şi un interes direct: noi avem de făcut catalogul colectiv al cărţii vechi. Poate în 2009 reuşim să terminăm (în mare) cartea românească până la 1830. Mai e mult de lucru la „transilvanice”, iar cartea străină (cu excepţia incunabulelor) nici nu e încă abordată. Sunt câteva zeci de mii de exemplare de prelucrat. E nevoie de un efort colectiv, ca să se termine într-un interval rezonabil. Acum n-avem un instrument informatic decent nici pentru a expune pe Net ceea ce e deja catalogat, darmite pentru a cataloga.

A. Argumentul economic, i.e. economia la catalogare

Dacă argumentul privind calitatea sporită a informaţiei catalografice pe care o oferă un catalog partajat nu e destul de convingător (deşi mie mi s-ar părea suficient), atunci o să recurg la (antipaticul) argument economic. Şi am de gând să pedalez intens pe el.

Plecăm de la premiza că majoritatea bibliotecilor din România sunt finanţate din banul public. Mă tem că e o premiză greu de contestat. Aşadar, şi o covârşitoare parte a catalogării (în care includ şi indexarea, clasificarea, cum convenim să-i spunem) se face pe bani publici.

Catalogând local se risipesc bani publici: dacă se achiziţionează un titlu în 100 de biblioteci, se fac 100 de fişe pentru acel titlu. Deci, de 99 de ori se duplică munca catalogatorului care a elaborat primul fişa cărţii. Adică se risipesc bani publici de 99 de ori. Mi se pare important ca finanţatorii bibliotecilor să ştie acest lucru.

Prin contrast (sigur, simplificând, dar nu prea mult), într-un catalog partajat naţional, prima fişă (cronologic vorbind) elaborată pentru un titlu este reutilizată de toţi cei care au de catalogat acelaşi titlu. Chiar dacă o mai ajustează/îmbăgăţesc/corectează, toţi fac economie de timp. Ca să nu mai vorbim că fişa poate fi elaborată (chiar dacă într-o formă preliminară) chiar de editor, şi astfel se mai economiseşte ceva timp (chiar dacă catalogatorii nu au încredere în datele bibliografice ale editorilor — de multe ori cu îndreptăţire —, tot se poate „recupera” ceva din fişele lor, titlul de pildă). Pe scurt, randamentul catalogatorilor creşte dramatic dacă se foloseşte un catalog partajat centralizat. Şi n-am nici o emoţie: catalogatorii nu-s în primejdie să rămână fără slujbe. După câte ştiu eu, retroconversiile o să dureze cel puţin două generaţii. (Iar dă Doamne să mă înşel.)

Mai mult, fişierele de autoritate ar trebui să fie partajate de biblioteci, muzee şi arhive, pentru a reduce şi mai mult duplicările de efort (deci risipa de ban public).

B. Argumentul interesului public

Un catalog naţional partajat este — implicit — un catalog colectiv naţional. În această postură, el oferă un serviciu public valoros: facilitează împrumutul interbibliotecar. Acum — după cum bine ştim — împrumutul interbibliotecar în România funcţionează rudimentar, mai ales din pricină că e greu pentru o bibliotecă să afle cine are cartea de care are nevoie clientul. Adică lipseşte catalogul colectiv naţional.

În al doilea rând, un catalog colectiv ar putea oferi (precum Google Book Search) trimiteri la saiturile editorilor, pentru cărţile care sunt de vânzare. Prin urmare ar fi şi în interesul editorilor (şi cumpărătorilor).

În al treilea rând, un catalog colectiv (făcut cu tehnologiile contemporane) ar putea fi o bună bază pentru realizarea/întreţinerea de cataloage ale bibliotecilor personale (precum LibraryThing, care are deja peste 34 de milioane de cărţi catalogate !). Şi aici am un interes direct (am început să uit ce cărţi am; nu atât din pricina numărului de cărţi, cât din pricina numărului de ani). Sunt sigur că 99,8% din cărţile pe care le am în casă sunt deja catalogate undeva în ţară. Deci, având acces la catalogul naţional, ar trebui să cataloghez eu însumi doar 0,2% din cărţile pe care le am.

Mai mult, e uşor de imaginat un mecanism prin care utilizatorii (elevii, studenţii, cercetătorii, autorii) să fie ajutaţi să-şi întocmească bibliografiile ataşate lucrărilor pe care le redactează. Înregistrările bibliografice pe care nu le găsesc gata elaborate, ar trebui să şi le elaboreze singuri, acestea rămânând în catalog şi pentru uzul altora. Ştiu: catalogatorii au oroare de datele furnizate de „amatori”. Dar n-ar fi nici o dificultate ca înregistrările furnizate de „amatori” să fie marcate distinct (de exemplu puse pe fond roşu), până la validarea de către un „profesionist”.

Nu sunt oare suficiente aceste argumente ?

Aspectele tehnice merită altă discuţie.

Written by poliptic

26 decembrie 2008 at 12:27 pm

Postat in cataloage, catalogare

IFLA propune o zonă O ISBD şi invită la comentarii

fără comentarii

IFLA ne invită să comentăm (până pe 30 ianuarie) propunerea de Zonă 0  ISBD (forma conţinutului şi a tipului de suport).

Mi se pare important, ca idee şi ca demers de standardizare terminologică.

Textul englezesc (însoţit de exemple) se află la www.ifla.org/VII/s13/isbdrg/ISBD_Area_0_WWR.htm.

Am stat câteva ceasuri şi am produs o ciornă de traducere românească. M-ar bucura sugestii de corecţii.

Aşa, la prima impresie, nu-mi convine recomandarea ca termenii să fie asignaţi în limba agenţiei catalografice. ce ne facem cu cataloagele internaţionale ? Ar fi preferabil (după mine) să se recomande asignarea de concepte (în loc de termeni), iar OPAC-urile să facă bine să aleagă automat termenii în limba utilizatorului.

Written by poliptic

14 decembrie 2008 at 12:34 am

Postat in catalogare, indexare

O metodologie de indexare (pentru următorii 10 ani ?)

cu un comentariu

Iertare: urmează un post lung cât o zi de post (dar cu poze !).

 

1. Context

 Zilele astea (5 – 6 iunie) s-a discutat la Biblioteca Naţională „Ghidul de indexare LIVES-Ro”  (adaptarea românească a „Guide d’indexation RAMEAU”, redactat de Biblioteca Naţională a Franţei).

 Am participat doar la discuţiile despre subdiviziunile de formă (continuare a discuţiilor de la sesiunea secţiei de indexare a ABR de la Iaşi) şi la prezentarea de către Monica Achiri a schemei de indexare FAST: Faceted Application of Subject Terminology.

 Au fost suficiente „subdiviziunile de formă” pentru a se ajunge la problema fundamentală: care să fie maniera de indexare în bibliotecile româneşti, în viitor ? Şi, premiza mea — sugerată în titlul postul — este că ceea ce alegem acum, alegem pentru cel puţin 10 ani. Aşadar, trebuie să fim atenţi şi să alegem ce e mai avansat, nu ce e deja demodat, dar supravieţuieşte prin inerţie.

 

2. Teza (de la bun început)

 Cred că:

ar trebui să deconstruim complet ghidul de indexare RAMEAU şi să (re)construim unul complet nou, bazat pe tehnologiile contemporane.

Şi asta fără să ţinem seama (i.e. să fim inhibaţi) de capabilităţile softurilor prezente acum pe piaţă. Şi fără să fim marcaţi de „paradigma MARC”. Mai mult:

 simultan, ar trebui să elaborăm şi cerinţele minimale pentru softurile care:

  1. permit maniera de indexare care ar rezulta şi
  2. pun în valoare acea indexare în OPAC.

Tot de la bun început, mă declar un ferm susţinător al tradiţionalilor descriptori precoordonaţi („vedete de subiect”, cum — restrictiv — li se mai spune) şi îmi exprim opoziţia fermă faţă de „relaxarea” lor propusă de schema FAST (care, propune o degradare a indexării, prin parţiala „coborâre” la simpla asignare de cuvinte-cheie, într-o — vană, după mine — speranţă că prin coborârea standardelor va creşte calitatea şi productivitatea).

[paranteză]

Ironic: şi la noi unii bibliotecari sunt îngrijoraţi de costul ridicat al catalogării/indexării profesionale. În acelaşi timp, nu aud bibliotecari dornici să economisească prin catalogare partajată !

[/paranteză]

[paranteză]

Folosesc prilejul pentru a declara că — (cel puţin) în materie de biblioteconomie — sunt un „conservator progresist” (am furat expresia „progressive conservative” din numele unui fost partid canadian).

[/paranteză]

 

3. Cum şi cu ce să indexăm ?

Să rememorăm: de ce sunt buni descriptorii precoordonaţi (i.e. lanţuri de descriptori simpli) ? Păi pentru că:

  1.  împiedică falsa coordonare (fenomen frecvent în cazul căutării postcoordonate);
  2. permit colocarea elegantă a subiectelor/obiectelor în index, deci o baleiere sistematică;
  3. dau căutătorului o idee asupra subiectelor resursei pe care o indexează (mult mai bună decât cea dată de o simplă succesiune de cuvinte-cheie izolate).

Mi se par motive temeinice să-i păstrăm. Desigur, nu pot fi impuşi, ci doar recomandaţi şi elaborarea lor facilitată. Dar aş fi furibund împotriva unor softuri care să-i interzică !

Aşadar, separată pe două planuri, propunerea mea este:

A. La momentul indexării:

Indexatorul să fie liber (aproape total) în construirea descriptorului, cu alte cuvinte să fie (aproape total) liber în alegerea  elementelor pe care să le precoordoneze.

[paranteză]

Aş fi foarte mulţumit dacă s-ar admite prefixarea fiecărui element (ezit să folosesc „termen”; o să explic mai jos de ce) cu un rol, aşa cum se făcea în defuncta (dar geniala) schema de indexare a lui Derek Austin, numită PRECIS [Preserved Context Indexing System].

[referinţă]

Lucrarea originară (ediţia a II-a):

Austin, Derek William; Dykstra, Mary. PRECIS: A manual of concept analysis and subject indexing. — London : British Library Bibliographic Services Division, 1984

Maximum ce-am găsit online:

www.musiclibraryassoc.org/BCC/BCC-Historical/BCC95/95WGFAM2.html

http://dlist.sir.arizona.edu/1764/01/SIG-CR2004Kwasnik.pdf

[/referinţă]

De altfel, cam aşa imaginasem — grupul în care lucram — în anii ‘80, aşa zisele „fraze de indexare FOCUS”. Din păcate „frazele de indexare” au rămas doar pe hârtie. Păcatele tinereţii…

[/paranteză]

 

B. În prealabil:

Să construim un „sistem de organizare a cunoştinţelor” [SOC] complex (mai complex decât RAMEAU !), de fapt o ontologie, în care să comasăm toate fişierele de autoritate (existente sau doar râvnite), şi care să furnizeze indexatorului „prefabricatele” convenabile pentru construirea descriptorilor precoordonaţi.

 

4. Fabulaţiune despre cum să fie „sistemul de organizare a cunoştinţelor” (adică ontologia)

[paranteză]

Definiţia clasică a sistemelor de organizare a cunoştinţelor, după Gail Hodge: 

The term knowledge organization systems is intended to encompass all types of schemes for organizing information and promoting knowledge management. Knowledge organization systems include classification and categorization schemes that organize materials at a general level, subject headings that provide more detailed access, and authority files that control variant versions of key information such as geographic names and personal names. Knowledge organization systems also include highly structured vocabularies, such as thesauri, and less traditional schemes, such as semantic networks and ontologies. Because knowledge organization systems are mechanisms for organizing information, they are at the heart of every library, museum, and archive.

 

Termenul „sisteme de organizare a cunoştinţelor” este menit să acopere toate tipurile de scheme pentru organizarea informaţiei şi promovarea managementului cunoştinţelor. Sistemele de organizare a cunoştinţelor includ schemele de clasificare şi de categorizare (?) care organizează materialele la nivel general, vedetele de subiect care oferă un acces mai fin şi fişierele de autoritate care gestionează diferitele versiuni informaţiilor-cheie, cum ar fi numele geografice şi numele personale. Sistemele de organizare a cunoştinţelor includ şi vocabularele înalt structurate, cum ar fi tezaurele, ca şi scheme mai puţin tradiţionale, precum reţelele semantice şi ontologiile. Deoarece sistemele de organizare a cunoştinţelor sunt mecanisme pentru organizarea informaţiei, ele se află în nucleul fiecărei biblioteci, fiecărui muzeu şi fiecărei arhive.

 

Hodge, G. (2000). Systems of Knowledge Organization for Digital libraries. Beyond traditional authority files. Washington, DC: the Council on Library and Information Resources.

 

Şi definiţia ontologiei după Tom Gruber:

 

Cea clasică (1992) – http://www-ksl.stanford.edu/kst/what-is-an-ontology.html

 

An ontology is a specification of a conceptualization.

 

O ontologie este o specificare a unei conceptualizări.

 

Ediţia recentă (2007) – http://tomgruber.org/writing/ontology-definition-2007.htm 

In the context of computer and information sciences, an ontology defines a set of representational primitives with which to model a domain of knowledge or discourse.  The representational primitives are typically classes (or sets), attributes (or properties), and relationships (or relations among class members).  The definitions of the representational primitives include information about their meaning and constraints on their logically consistent application.  In the context of database systems, ontology can be viewed as a level of abstraction of data models, analogous to hierarchical and relational models, but intended for modeling knowledge about individuals, their attributes, and their relationships to other individuals.  Ontologies are typically specified in languages that allow abstraction away from data structures and implementation strategies; in practice, the languages of ontologies are closer in expressive power to first-order logic than languages used to model databases.  For this reason, ontologies are said to be at the “semantic” level, whereas database schema are models of data at the “logical” or “physical” level.  Due to their independence from lower level data models, ontologies are used for integrating heterogeneous databases, enabling interoperability among disparate systems, and specifying interfaces to independent, knowledge-based services.  In the technology stack of the Semantic Web standards, ontologies are called out as an explicit layer.  There are now standard languages and a variety of commercial and open source tools for creating and working with ontologies. 

În contextul informaticii şi a ştiinţei informaţiei (aşa se zice pe româneşte ?), o ontologie defineşte un set de primitive reprezentaţionale, cu care să se modeleze un domeniul al cunoaşterii sau al discursului. Primitivele reprezentaţionale tipice sunt clasele (sau seturile), atributele (sau proprietăţile) şi relaţionările (sau relaţiile între membrii claselor)… 

(iertare: mi-e lene să traduc mai departe; e tehnic şi nu-mi foloseşte aici)

[/paranteză]

 

Aşadar, entităţile ontologiei ar trebui să fie: 

  •  concepte
  • clase
  • persoane
  • colectivităţi
  • locuri geografice
  • entităţii temporale
  • situaţii (asocieri de mai multe entităţi):
  • entităţi geo-politice
  • evenimente
  • identităţi bibliografice
  • situaţii cu nume (e.g. „cearta universaliilor”)
  • situaţii (fără nume), e.g. subiecte, clase
  • lucrări
  • expresii 

Din entităţile grupului 1 FRBR, n-aş băga în ontologie (convenţional): 

  • manifestările
  • exemplarele 

care — să zicem — să rămână „obiectele bibliografice”. Deşi, atât manifestările cât şi exemplarele pot fi foarte bine subiecte de lucrări. 

Ca să-mi ilustrez propunerea, o să folosesc un exemplu. Să zicem că am de catalogat/indexat: 

Varşovia : Insurecţia din 1944 / Norman Davies ; Traducere din limba engleză de Diana Elena Puşcaşu. — Bucureşti : RAO International Publishing Company, 2008. — ISBN 978-973-103-493-5 

Văd că-i o traducere; găsesc repede la OCLC, în WorldCat zece manifestări (i.e. ediţii; văd că există două expresii, ambele de limbă engleză: text şi audioînregistrare) şi o aleg pe cea care-mi pare a fi prima (presupun că titlul ei e şi al lucrării): 

Rising ‘44 : the Battle for Warsaw / Norman Davies. — London : Macmillan, 2003. — ISBN 0333905687 9780333905685 

Există deja cel puţin două expresii ale lucrării, aşa că merită să fac o înregistrare de lucrare, două de expresie şi înregistrarea manifestării al cărei reprezentant îl am în mână. Să zicem: 

„Rising '44”

fig. 1

[lucrare]

id w-1
titlu [en] Rising ‘44 : the Battle for Warsaw
titlu [ro] Insurecţia ‘44 : bătălia pentru Varşovia
autor p-1 (i.e. “Norman Davies”)
tip text
gen non-ficţiune

 

[expresie]

id e-1
realizează w-1 (i.e. „Rising ‘44 : the Battle for Warsaw”)
limba en

 

[expresie]

id e-2
realizează w-1 (i.e. „Rising ‘44 : the Battle for Warsaw”)
limba română
traducător p-2 (i.e. “Diana Elena Puşcaşu”)

 

[manifestare]

id m-1
încorporează e-2
titlu şi m.r. Varşovia : Insurecţia din 1944 / Norman Davies ; Traducere din limba engleză de Diana Elena Puşcaşu

  

[persoană]

id p-1
signatură Norman Davies (istoric englez) (1938 – )

 

[persoană]

id p-2
signatură Diana Elena Puşcaşu (traducătoare)

  

Acum mai trebuie să asignez lucrării (nu manifestării ! — conform filozofiei FRBR) subiectele. Să presupunem că în ontologia pe care o am la dispoziţie, am:

 

fragment de ontologie

fig. 2 

[entitate geopolitică]

id egp-1
apelaţiune [ro] România
apelaţiune [en] Romania

  

[entitate geopolitică]

id egp-2
apelaţiune [ro] Polonia
apelaţiune [en] Poland

 

[clasă]

id c-1
termen >> [ro] istorie
termen >> [en] history

 

[clasă]

id c-2
termen >> [ro] războaie
termen >> [en] wars
subclasă a c-1 (i.e. “istorie”)

 

[situaţie]

id s-1
componentă egp-1 (i.e. “România”)
componentă c-1 (i.e. “istorie”)

 

[situaţie]

id s-2
componentă egp-2 (i.e. “Polonia”)
componentă c-1 (i.e. “istorie”)

 

[eveniment]

id ev-1
apelaţiune [ro] Al Doilea Război Mondial (1939-1945)
apelaţiune [en] WW II (1939-1945)
membru a c-2 (i.e. “războaie”)

 

[situaţie]

id s-3
componentă ev-1 (i.e. “Al Doilea Război Mondial”)
componentă s-1 (i.e. “România <> istorie”)

 

[situaţie]

id s-4
componentă ev-1 (i.e. “Al Doilea Război Mondial”)
componentă s-2 (i.e. “Polonia <> istorie”)

 

[eveniment]

id ev-2
apelaţiune [ro] Lovitura de stat de la 23 august 1944
apelaţiune [en] The August 23 Coup d’état
apelaţiune [en] King Michael Coup (August 23, 1944)
parte a s-3 (i.e. “România <> Al Doilea Război Mondial”)

 

[eveniment]

id ev-3
apelaţiune [ro] Insurecţia varşoviană (august – octombrie 1944)
apelaţiune [en] Warsaw Uprising (August – October 1944)
parte a s-4 (i.e. “Polonia <> Al Doilea Război Mondial”)

 

Note: 

  1. În cazul claselor (e.g. “istorie”, “războaie”) situaţia e mai complicată. Termenii (substantive comune) prin care sunt designate sunt entităţi distincte (o să revin mai jos); de asta i-am prefixat în diagramă cu “>>”.
  2. Fiindcă în cazul unor situaţii ordinea componentelor nu e fixă, am vrut să sugerez asta prin conectorul “<>” (în loc de “–”).
  3. Ca să scot în evidenţă faptul că „neutralitatea faţă de limbă” (i.e. multilingvismul) e important în acest context, am consemnat apelaţiuni în două limbi pentru entităţile primare.
  4. Notez că la evenimentul „23 august” i-am consemnat două apelaţiuni sinonime în englezeşte, ca să semnalez că îmi doresc şi această (foarte posibilă) facilitate.
  5. Entitatea „istorie” am considerat-o aici o clasă (în sensul de „mulţimea evenimentelor istorice”). De fapt are o natură dublă, i.e. e şi un concept. 

Aşadar, mă folosesc de evenimentul ev-3, gata predefinit, pe care-l asignez ca subiect lucrării mele: 

Norman Davies. Insurecţia ‘44 : bătălia pentru Varşovia

Insurecţia varşoviană (august – octombrie 1944) [despre] 

Acum, apelaţiunea lui poate apărea în prezentarea tuturor manifestărilor lucrării cu pricina, subiectul fiind „moştenit” de toate expresiile şi manifestările unei lucrări: 

Varşovia : Insurecţia din 1944 / Norman Davies ; Traducere din limba engleză de Diana Elena Puşcaşu. — Bucureşti : RAO International Publishing Company, 2008. — ISBN 978-973-103-493-5.

Insurecţia varşoviană (august – octombrie 1944) [despre] 

 

Rising ‘44 : the Battle for Warsaw / Norman Davies. — London : Macmillan, 2003. — ISBN 0333905687 9780333905685

Insurecţia varşoviană (august – octombrie 1944) [despre] 

Notez en passant că, dacă nu aveam predefinit evenimentul, ar fi trebuit să pot să-l definesc şi să-l introduc în ontologie (vreau să zic că indexatorul trebuie să aibă posibilitatea să propună extensii ale ontologiei, chiar dacă, în practică, decizia lui poate fi schimbată de indexatorii „seniori” care — se presupune —supervizează ontologia). 

 

5. Fabulaţiune despre cum să se prezinte indexul de descriptori 

Spuneam mai sus, că unul dintre atuurile majore ale descriptorilor precoordonaţi este — după mine — posibilitatea de baleiere elegantă a indexului, pe care o oferă. Acum, mergând pe exemplul dat, să vedem cum ar putea un soft deştept să prezinte indexul, pe baza informaţiilor pe care le are din ontologie. Astfel, folosind doar signaturile în româneşte şi permutând componentele, un index „clasic” ar fi:  

 

Al Doilea Război Mondial (1939 – 1945)

Al Doilea Război Mondial — Polonia

Al Doilea Război Mondial — Polonia — Insurecţia varşoviană

Al Doilea Război Mondial — România

Al Doilea Război Mondial — România — Lovitura de stat de la 23 august 1944

Insurecţia varşoviană (august – octombrie 1944)

istorie

istorie — războaie

istorie — războaie — Al Doilea Război Mondial

istorie — războaie — Al Doilea Război Mondial — Polonia

istorie — războaie — Al Doilea Război Mondial — Polonia — Insurecţia varşoviană

istorie — războaie — Al Doilea Război Mondial — România

istorie — războaie — Al Doilea Război Mondial — România — Lovitura de stat de la 23 august 1944

istorie — Polonia

istorie — Polonia — războaie

istorie — Polonia — războaie — Al Doilea Război Mondial

istorie — Polonia — războaie — Al Doilea Război Mondial — Insurecţia varşoviană

istorie — România

istorie — România — războaie

istorie — România — războaie — Al Doilea Război Mondial

istorie — România — războaie — Al Doilea Război Mondial — Lovitura de stat de la 23 august 1944

Lovitura de stat de la 23 august 1944

Polonia

Polonia — istorie

Polonia — istorie — războaie

Polonia — istorie — războaie — Al Doilea Război Mondial

Polonia — istorie — războaie — Al Doilea Război Mondial — Insurecţia varşoviană

războaie

războaie — Al Doilea Război Mondial

războaie — Al Doilea Război Mondial — Polonia

războaie — Al Doilea Război Mondial — Polonia — Insurecţia varşoviană

războaie — Al Doilea Război Mondial — România

războaie — Al Doilea Război Mondial — România — Lovitura de stat de la 23 august 1944

România

România — istorie

România — istorie — războaie

România — istorie — războaie — Al Doilea Război Mondial

România — istorie — războaie — Al Doilea Război Mondial — Lovitura de stat de la 23 august 1944

 

Iar o prezentare mai bună ar fi: 

 

Al Doilea Război Mondial (1939 – 1945) [n1 resurse]

                Polonia [n1-1 resurse]

                                Insurecţia varşoviană  [n1-1-1 resurse]

                România [n1-2 resurse]

                                Lovitura de stat de la 23 august 1944 [n1-2-1 resurse]

Insurecţia varşoviană (august – octombrie 1944) [n2 resurse]

istorie [n3 resurse]

                războaie [n3-1 resurse]

                                Al Doilea Război Mondial [n3-1-1 resurse]

                                                Polonia [n3-1-1-1 resurse]

                                                                Insurecţia varşoviană [n3-1-1-1-1 resurse]

                                                România [n3-1-1-2 resurse]

                                                                Lovitura de stat de la 23 august 1944 [n3-1-1-2-1 resurse]

                Polonia [n3-2 resurse]

                                războaie [n3-2-1 resurse]

                                                Al Doilea Război Mondial [n3-2-1-1 resurse]

                                                                Insurecţia varşoviană [n3-2-1-1-1 resurse]

                România [n3-3 resurse]

                                războaie [n3-3-1 resurse]

                                                Al Doilea Război Mondial [n3-3-1-1 resurse]

                                                                Lovitura de stat de la 23 august 1944 [n3-3-1-1-1 resurse]

Lovitura de stat de la 23 august 1944 [n4 resurse]

Polonia [n5 resurse]

                istorie [n5-1 resurse]

                                războaie [n5-1-1 resurse]

                                                Al Doilea Război Mondial [n5-1-1-1 resurse]

                                                                Insurecţia varşoviană [n5-1-1-1-1 resurse]

războaie [n6 resurse]

                Al Doilea Război Mondial [n6-1 resurse]

                                Polonia [n6-1-1 resurse]

                                                Insurecţia varşoviană [n6-1-1-1 resurse]

                                România [n6-1-2 resurse]

                                                Lovitura de stat de la 23 august 1944 [n6-1-2-1 resurse]

România [n7 resurse]

                istorie [n7-1 resurse]

                                războaie [n7-1-1 resurse]

                                                Al Doilea Război Mondial [n7-1-1-1 resurse]

                                                                Lovitura de stat de la 23 august 1944 [n7-1-1-1-1 resurse] 

(Din pricina simetriei exemplului meu) lucrarea lui Davies apare sub jumătate dintre aceste intrări. Se observă că descriptorii formaţi din mai multe componente apar ca intrări sub fiecare componentă (componentele sunt permutate) şi astfel, cu o singură asignare, am pus lucrarea lui Davies sub 22 de intrări de index ! 

[paranteză]

Numărul ăsta poate să crească în timp, dacă cineva rafinează ontologia şi introduce locul geografic „Europa” şi situaţia „războaie <> Europa” şi reconfigurează corespunzător relaţiile existente.

[/paranteză] 

Şi asta, în timp ce în Worldcat, la OCLC, găsesc doar 3 subiecte asignate manifestării englezeşti: 

 

World War, 1939-1945 — Poland — Warsaw.

Warsaw (Poland) — History — Uprising, 1944.

Poland — History — Occupation, 1939-1945. 

 

Întrebarea e: să se genereze toate intrările posibile ? Cred că nu e cazul, şi anume, intrări precum:  

Al Doilea Război Mondial — istorie

Insurecţia varşoviană — Polonia

Lovitura de stat de la 23 august 1944 — România

Polonia — Al Doilea Război Mondial — istorie

România — Al Doilea Război Mondial — istorie 

 

adică intrări în care o componentă cu sens mai larg apare mai la dreapta uneia cu un sens mai restrâns, nu folosesc, din logica prezentării ierarhice (arborescente), unde progresia spre dreapta semnifică restrângere de sens. 

 

6. Despre libertatea indexatorului 

Să reluăm: în acest scenariu, indexatorul are la dispoziţie o ontologie din care îşi ia componentele pentru a construi descriptorii de care are nevoie. Aşadar, el ar trebui să fie (relativ) liber să facă asocierile pe care le consideră necesare pentru a construi descriptorii cei mai specifici pentru caracterizarea resursei (fie aceasta asignarea unui subiect sau încadrarea într-o clasă — NB. nu clasă în sens CZU). 

Mai mult: dacă nu găseşte în ontologie componentele de care are nevoie (sau descriptorii gata construiţi), el trebuie să poată să-şi extindă corespunzător ontologia. 

De pildă, să presupunem că am de indexat lucrarea: 

Ion Petrică. Confluenţe culturale româno-polone : a doua jumătate a sec. al XIX-lea 

încorporată în manifestarea: 

Confluenţe culturale româno-polone : (a doua jumătate a sec. al XIX-lea) / Ion Petrică. — Bucureşti : Minerva, 1976 

şi vreau să-i asignez descriptorul: “Polonia <> România <> relaţii culturale — a doua jumătate a sec. XIX”. 

Atunci, având deja „România” şi „Polonia” mai trebuie să adaug în ontologie doar conceptul „relaţii culturale” şi situaţia „Polonia <> România <> relaţii culturale”. Apoi asignez această situaţie — prin relaţia „subiect” — lucrării mele. Astfel, ea va apărea în indexul de subiecte sub intrările:  

Polonia

                România

                                relaţii culturale

România

                Polonia

                                relaţii culturale

relaţii culturale

                România

                                Polonia

                Polonia

                                România 

Mai e un aspect de discutat aici: subdiviziunile. După părerea mea, din raţiuni practice, subdiviziunile trebuie să fie doar caracterizări fine ale relaţiei „subiect” dintre o lucrare şi un descriptor. Cu alte cuvinte, să aibă statut de proprietăţi ale relaţiei şi nu să nu facă parte din ontologie. În exemplul ăsta, „a doua jumătate a sec. XIX” este o astfel de subdiviziune, şi ea trebuie să fie expusă la prezentarea lucrării, dar nu şi în indexul de subiecte. 

Ion Petrică. Confluenţe culturale româno-polone : a doua jumătate a sec. al XIX-lea

                Polonia — România — relaţii culturale — a doua jumătate a sec. XIX [despre] 

[paranteză]

Similar, astfel de proprietăţi se pot atribui şi altor relaţii între diverse entităţi. De pildă relaţiei „afiliere” dintre o „persoană” şi o „colectivitate” i se poate ataşa legitim o perioadă.

[/paranteză] 

 

7. Conceptele, clasele şi termenii 

La discuţia care a provocat acest text, dna. Denis Rotaru a ridicat — la un moment dat — o problemă ce mi se pare importantă: distincţia dintre „poezie” ca subiect şi „poezii” ca „subdiviziune de formă” (în jargonul RAMEAU). Mie, soluţia radicală pentru acest tip de probleme (precis foarte frecvente) este introducerea în ontologie atât a conceptului „poezie/poetry”, cât şi a clasei „poezii/poems”. Şi aplicarea soluţiei terminologice standard: introducerea termenilor în ontologie ca entităţi distincte şi designarea acestei perechi concept-clasă cu un acelaşi termen în româneşte (dar cu termeni diferiţi în englezeşte, de pildă). 

 

designări

fig. 3 

Aşadar, conceptul „poezie” (cf. DEX: modalitate a literaturii care exprimă mesajul artistic cu ajutorul imaginilor expresive, al unui limbaj concentrat, al afectivităţii, al rimei, al ritmului etc.) este asociat — prin relaţia „designat de” cu termenul „poezie, poezii”, iar signatura lui este „poezie” (putem conveni că relaţia de designare între un concept şi un termen expune singularul termenului). Pe de altă parte, clasa „poezii” (cf. DEX: (concr.) creaţie literară în versuri) este asociată (în româneşte) cu acelaşi termen, iar signatura ei este „poezii” (putem conveni că relaţia de designare între o clasă şi un termen expune pluralul termenului). 

Lasă că, pe de altă parte, termenul englezesc „poem, poems” designează atât clasa „poezii” cât şi subclasa sa „poeme” (sau nu ? există un termen englezesc ?). 

Tot atunci, dna. Nina Botez a ridicat şi o altă problemă care mi se pare importantă: clasele complexe. Acestea — de dragul generării intrărilor de index permutabile — ar trebui să fie reprezentate în propunerea mea ca situaţii (unele chiar cu nume propriu). Exemplul este: „scriitori de limbă maghiară din România”. Las pe altă dată discuţia fină despre ce înseamnă „din România”: născuţi pe teritoriul actual al României ? cetăţeni români ? care au trăit minimum 10 ani în România ? etc. 

 

scriitori maghiari din România

fig. 4 

Aşadar, am „construit” clasa „scriitori de limbă maghiară din România”, ca o situaţie: „scriitori <> limba maghiară <> România”.  

[clasă]

id c-3
termen >> [ro] scriitori

 

[concept]

id co-1
termen >> [ro] limba maghiară

 

[situaţie]

id s-5
componentă egp-1 (i.e. “România”)
subclasă a c-3 (i.e. “scriitori”)
componentă co-1 (i.e. “limba maghiară”)
apelaţiune [ro] scriitori de limbă maghiară din România

 

Deci, intrările de index (generabile automat) ar fi:  

limba maghiară

                scriitori

                                România

                România

                                scriitori

România

                limba maghiară

                                scriitori

                scriitori

                                limba maghiară

scriitori

                limba maghiară

                                România

                România

                                limba maghiară 

dar, în afara indexului, s-ar putea folosi direct apelaţiunea (mai naturală) “scriitori de limbă maghiară din România”. 

Sigur, o să-mi spuneţi că în indexuri, în loc de “limba maghiară” ar trebui să se folosească “maghiară, limba”, ca să intre la “M”. Cred că cel mai bine e să intre atât la “L”, cât şi la “M” (n-avem de ce să facem economie de intrări). După mintea mea, oricare entitate poate genera multiple intrări de index (chiar dacă unele „ascunse”). În cazul astă, mi s-ar părea OK să avem şi „apelaţiunea fantomă” “maghiară, limba”. 

 

8. Epilog 

Vestea proastă e că multe detalii ale unei asemenea scheme mai trebuie gândite bine. Şi sunt destule probleme nerezolvate. Spun una de care sunt (de mult) conştient: cum să reprezinţi dinamica în timp a unei entităţi geopolitice ? Ce e aia „România” ? Statul cu acest nume având teritoriul din 2008 ? Din 1941 ? Din 1920 ? Din 1914 ? 

Apoi, cum să pui în indexuri unităţile administrativ-teritoriale ? Exemplu: 

România

                jud. Maramureş

                                com. Şomcuta Mare

                                                Vălenii Şomcutei 

sau chiar signatura: 

Vălenii Şomcutei (com. Şomcuta Mare, jud. Maramureş, România). 

Eu le-aş pune pe ambele. Bine o fi ? 

Dar, pe lângă dificultăţi, cred că ceea ce vă propun aici e în ton cu dezvoltările tehnologice contemporane, chiar dacă google-izarea webului pare a zice că trendul e spre simplu şi amatoristic.

Written by poliptic

15 iunie 2008 at 12:08 am