Chestiuni documentaristice (inclusiv bibliologice)

Dan Matei (care își dă și el cu părerea).

Posts Tagged ‘indexare

O metodologie de indexare (pentru următorii 10 ani ?)

with one comment

Iertare: urmează un post lung cât o zi de post (dar cu poze !).

 

1. Context

 Zilele astea (5 – 6 iunie) s-a discutat la Biblioteca Naţională „Ghidul de indexare LIVES-Ro”  (adaptarea românească a „Guide d’indexation RAMEAU”, redactat de Biblioteca Naţională a Franţei).

 Am participat doar la discuţiile despre subdiviziunile de formă (continuare a discuţiilor de la sesiunea secţiei de indexare a ABR de la Iaşi) şi la prezentarea de către Monica Achiri a schemei de indexare FAST: Faceted Application of Subject Terminology.

 Au fost suficiente „subdiviziunile de formă” pentru a se ajunge la problema fundamentală: care să fie maniera de indexare în bibliotecile româneşti, în viitor ? Şi, premiza mea — sugerată în titlul postul — este că ceea ce alegem acum, alegem pentru cel puţin 10 ani. Aşadar, trebuie să fim atenţi şi să alegem ce e mai avansat, nu ce e deja demodat, dar supravieţuieşte prin inerţie.

 

2. Teza (de la bun început)

 Cred că:

ar trebui să deconstruim complet ghidul de indexare RAMEAU şi să (re)construim unul complet nou, bazat pe tehnologiile contemporane.

Şi asta fără să ţinem seama (i.e. să fim inhibaţi) de capabilităţile softurilor prezente acum pe piaţă. Şi fără să fim marcaţi de „paradigma MARC”. Mai mult:

 simultan, ar trebui să elaborăm şi cerinţele minimale pentru softurile care:

 1. permit maniera de indexare care ar rezulta şi
 2. pun în valoare acea indexare în OPAC.

Tot de la bun început, mă declar un ferm susţinător al tradiţionalilor descriptori precoordonaţi („vedete de subiect”, cum — restrictiv — li se mai spune) şi îmi exprim opoziţia fermă faţă de „relaxarea” lor propusă de schema FAST (care, propune o degradare a indexării, prin parţiala „coborâre” la simpla asignare de cuvinte-cheie, într-o — vană, după mine — speranţă că prin coborârea standardelor va creşte calitatea şi productivitatea).

[paranteză]

Ironic: şi la noi unii bibliotecari sunt îngrijoraţi de costul ridicat al catalogării/indexării profesionale. În acelaşi timp, nu aud bibliotecari dornici să economisească prin catalogare partajată !

[/paranteză]

[paranteză]

Folosesc prilejul pentru a declara că — (cel puţin) în materie de biblioteconomie — sunt un „conservator progresist” (am furat expresia „progressive conservative” din numele unui fost partid canadian).

[/paranteză]

 

3. Cum şi cu ce să indexăm ?

Să rememorăm: de ce sunt buni descriptorii precoordonaţi (i.e. lanţuri de descriptori simpli) ? Păi pentru că:

 1.  împiedică falsa coordonare (fenomen frecvent în cazul căutării postcoordonate);
 2. permit colocarea elegantă a subiectelor/obiectelor în index, deci o baleiere sistematică;
 3. dau căutătorului o idee asupra subiectelor resursei pe care o indexează (mult mai bună decât cea dată de o simplă succesiune de cuvinte-cheie izolate).

Mi se par motive temeinice să-i păstrăm. Desigur, nu pot fi impuşi, ci doar recomandaţi şi elaborarea lor facilitată. Dar aş fi furibund împotriva unor softuri care să-i interzică !

Aşadar, separată pe două planuri, propunerea mea este:

A. La momentul indexării:

Indexatorul să fie liber (aproape total) în construirea descriptorului, cu alte cuvinte să fie (aproape total) liber în alegerea  elementelor pe care să le precoordoneze.

[paranteză]

Aş fi foarte mulţumit dacă s-ar admite prefixarea fiecărui element (ezit să folosesc „termen”; o să explic mai jos de ce) cu un rol, aşa cum se făcea în defuncta (dar geniala) schema de indexare a lui Derek Austin, numită PRECIS [Preserved Context Indexing System].

[referinţă]

Lucrarea originară (ediţia a II-a):

Austin, Derek William; Dykstra, Mary. PRECIS: A manual of concept analysis and subject indexing. — London : British Library Bibliographic Services Division, 1984

Maximum ce-am găsit online:

www.musiclibraryassoc.org/BCC/BCC-Historical/BCC95/95WGFAM2.html

http://dlist.sir.arizona.edu/1764/01/SIG-CR2004Kwasnik.pdf

[/referinţă]

De altfel, cam aşa imaginasem — grupul în care lucram — în anii ’80, aşa zisele „fraze de indexare FOCUS”. Din păcate „frazele de indexare” au rămas doar pe hârtie. Păcatele tinereţii…

[/paranteză]

 

B. În prealabil:

Să construim un „sistem de organizare a cunoştinţelor” [SOC] complex (mai complex decât RAMEAU !), de fapt o ontologie, în care să comasăm toate fişierele de autoritate (existente sau doar râvnite), şi care să furnizeze indexatorului „prefabricatele” convenabile pentru construirea descriptorilor precoordonaţi.

 

4. Fabulaţiune despre cum să fie „sistemul de organizare a cunoştinţelor” (adică ontologia)

[paranteză]

Definiţia clasică a sistemelor de organizare a cunoştinţelor, după Gail Hodge: 

The term knowledge organization systems is intended to encompass all types of schemes for organizing information and promoting knowledge management. Knowledge organization systems include classification and categorization schemes that organize materials at a general level, subject headings that provide more detailed access, and authority files that control variant versions of key information such as geographic names and personal names. Knowledge organization systems also include highly structured vocabularies, such as thesauri, and less traditional schemes, such as semantic networks and ontologies. Because knowledge organization systems are mechanisms for organizing information, they are at the heart of every library, museum, and archive.

 

Termenul „sisteme de organizare a cunoştinţelor” este menit să acopere toate tipurile de scheme pentru organizarea informaţiei şi promovarea managementului cunoştinţelor. Sistemele de organizare a cunoştinţelor includ schemele de clasificare şi de categorizare (?) care organizează materialele la nivel general, vedetele de subiect care oferă un acces mai fin şi fişierele de autoritate care gestionează diferitele versiuni informaţiilor-cheie, cum ar fi numele geografice şi numele personale. Sistemele de organizare a cunoştinţelor includ şi vocabularele înalt structurate, cum ar fi tezaurele, ca şi scheme mai puţin tradiţionale, precum reţelele semantice şi ontologiile. Deoarece sistemele de organizare a cunoştinţelor sunt mecanisme pentru organizarea informaţiei, ele se află în nucleul fiecărei biblioteci, fiecărui muzeu şi fiecărei arhive.

 

Hodge, G. (2000). Systems of Knowledge Organization for Digital libraries. Beyond traditional authority files. Washington, DC: the Council on Library and Information Resources.

 

Şi definiţia ontologiei după Tom Gruber:

 

Cea clasică (1992) – http://www-ksl.stanford.edu/kst/what-is-an-ontology.html

 

An ontology is a specification of a conceptualization.

 

O ontologie este o specificare a unei conceptualizări.

 

Ediţia recentă (2007) – http://tomgruber.org/writing/ontology-definition-2007.htm 

In the context of computer and information sciences, an ontology defines a set of representational primitives with which to model a domain of knowledge or discourse.  The representational primitives are typically classes (or sets), attributes (or properties), and relationships (or relations among class members).  The definitions of the representational primitives include information about their meaning and constraints on their logically consistent application.  In the context of database systems, ontology can be viewed as a level of abstraction of data models, analogous to hierarchical and relational models, but intended for modeling knowledge about individuals, their attributes, and their relationships to other individuals.  Ontologies are typically specified in languages that allow abstraction away from data structures and implementation strategies; in practice, the languages of ontologies are closer in expressive power to first-order logic than languages used to model databases.  For this reason, ontologies are said to be at the „semantic” level, whereas database schema are models of data at the „logical” or „physical” level.  Due to their independence from lower level data models, ontologies are used for integrating heterogeneous databases, enabling interoperability among disparate systems, and specifying interfaces to independent, knowledge-based services.  In the technology stack of the Semantic Web standards, ontologies are called out as an explicit layer.  There are now standard languages and a variety of commercial and open source tools for creating and working with ontologies. 

În contextul informaticii şi a ştiinţei informaţiei (aşa se zice pe româneşte ?), o ontologie defineşte un set de primitive reprezentaţionale, cu care să se modeleze un domeniul al cunoaşterii sau al discursului. Primitivele reprezentaţionale tipice sunt clasele (sau seturile), atributele (sau proprietăţile) şi relaţionările (sau relaţiile între membrii claselor)… 

(iertare: mi-e lene să traduc mai departe; e tehnic şi nu-mi foloseşte aici)

[/paranteză]

 

Aşadar, entităţile ontologiei ar trebui să fie: 

 •  concepte
 • clase
 • persoane
 • colectivităţi
 • locuri geografice
 • entităţii temporale
 • situaţii (asocieri de mai multe entităţi):
 • entităţi geo-politice
 • evenimente
 • identităţi bibliografice
 • situaţii cu nume (e.g. „cearta universaliilor”)
 • situaţii (fără nume), e.g. subiecte, clase
 • lucrări
 • expresii 

Din entităţile grupului 1 FRBR, n-aş băga în ontologie (convenţional): 

 • manifestările
 • exemplarele 

care — să zicem — să rămână „obiectele bibliografice”. Deşi, atât manifestările cât şi exemplarele pot fi foarte bine subiecte de lucrări. 

Ca să-mi ilustrez propunerea, o să folosesc un exemplu. Să zicem că am de catalogat/indexat: 

Varşovia : Insurecţia din 1944 / Norman Davies ; Traducere din limba engleză de Diana Elena Puşcaşu. — Bucureşti : RAO International Publishing Company, 2008. — ISBN 978-973-103-493-5 

Văd că-i o traducere; găsesc repede la OCLC, în WorldCat zece manifestări (i.e. ediţii; văd că există două expresii, ambele de limbă engleză: text şi audioînregistrare) şi o aleg pe cea care-mi pare a fi prima (presupun că titlul ei e şi al lucrării): 

Rising ’44 : the Battle for Warsaw / Norman Davies. — London : Macmillan, 2003. — ISBN 0333905687 9780333905685 

Există deja cel puţin două expresii ale lucrării, aşa că merită să fac o înregistrare de lucrare, două de expresie şi înregistrarea manifestării al cărei reprezentant îl am în mână. Să zicem: 

„Rising '44”

fig. 1

[lucrare]

id w-1
titlu [en] Rising ’44 : the Battle for Warsaw
titlu [ro] Insurecţia ’44 : bătălia pentru Varşovia
autor p-1 (i.e. „Norman Davies”)
tip text
gen non-ficţiune

 

[expresie]

id e-1
realizează w-1 (i.e. „Rising ’44 : the Battle for Warsaw”)
limba en

 

[expresie]

id e-2
realizează w-1 (i.e. „Rising ’44 : the Battle for Warsaw”)
limba română
traducător p-2 (i.e. „Diana Elena Puşcaşu”)

 

[manifestare]

id m-1
încorporează e-2
titlu şi m.r. Varşovia : Insurecţia din 1944 / Norman Davies ; Traducere din limba engleză de Diana Elena Puşcaşu

  

[persoană]

id p-1
signatură Norman Davies (istoric englez) (1938 – )

 

[persoană]

id p-2
signatură Diana Elena Puşcaşu (traducătoare)

  

Acum mai trebuie să asignez lucrării (nu manifestării ! — conform filozofiei FRBR) subiectele. Să presupunem că în ontologia pe care o am la dispoziţie, am:

 

fragment de ontologie

fig. 2 

[entitate geopolitică]

id egp-1
apelaţiune [ro] România
apelaţiune [en] Romania

  

[entitate geopolitică]

id egp-2
apelaţiune [ro] Polonia
apelaţiune [en] Poland

 

[clasă]

id c-1
termen >> [ro] istorie
termen >> [en] history

 

[clasă]

id c-2
termen >> [ro] războaie
termen >> [en] wars
subclasă a c-1 (i.e. „istorie”)

 

[situaţie]

id s-1
componentă egp-1 (i.e. „România”)
componentă c-1 (i.e. „istorie”)

 

[situaţie]

id s-2
componentă egp-2 (i.e. „Polonia”)
componentă c-1 (i.e. „istorie”)

 

[eveniment]

id ev-1
apelaţiune [ro] Al Doilea Război Mondial (1939-1945)
apelaţiune [en] WW II (1939-1945)
membru a c-2 (i.e. „războaie”)

 

[situaţie]

id s-3
componentă ev-1 (i.e. „Al Doilea Război Mondial”)
componentă s-1 (i.e. „România <> istorie”)

 

[situaţie]

id s-4
componentă ev-1 (i.e. „Al Doilea Război Mondial”)
componentă s-2 (i.e. „Polonia <> istorie”)

 

[eveniment]

id ev-2
apelaţiune [ro] Lovitura de stat de la 23 august 1944
apelaţiune [en] The August 23 Coup d’état
apelaţiune [en] King Michael Coup (August 23, 1944)
parte a s-3 (i.e. „România <> Al Doilea Război Mondial”)

 

[eveniment]

id ev-3
apelaţiune [ro] Insurecţia varşoviană (august – octombrie 1944)
apelaţiune [en] Warsaw Uprising (August – October 1944)
parte a s-4 (i.e. „Polonia <> Al Doilea Război Mondial”)

 

Note: 

 1. În cazul claselor (e.g. „istorie”, „războaie”) situaţia e mai complicată. Termenii (substantive comune) prin care sunt designate sunt entităţi distincte (o să revin mai jos); de asta i-am prefixat în diagramă cu „>>”.
 2. Fiindcă în cazul unor situaţii ordinea componentelor nu e fixă, am vrut să sugerez asta prin conectorul „<>” (în loc de „–„).
 3. Ca să scot în evidenţă faptul că „neutralitatea faţă de limbă” (i.e. multilingvismul) e important în acest context, am consemnat apelaţiuni în două limbi pentru entităţile primare.
 4. Notez că la evenimentul „23 august” i-am consemnat două apelaţiuni sinonime în englezeşte, ca să semnalez că îmi doresc şi această (foarte posibilă) facilitate.
 5. Entitatea „istorie” am considerat-o aici o clasă (în sensul de „mulţimea evenimentelor istorice”). De fapt are o natură dublă, i.e. e şi un concept. 

Aşadar, mă folosesc de evenimentul ev-3, gata predefinit, pe care-l asignez ca subiect lucrării mele: 

Norman Davies. Insurecţia ’44 : bătălia pentru Varşovia

Insurecţia varşoviană (august – octombrie 1944) [despre] 

Acum, apelaţiunea lui poate apărea în prezentarea tuturor manifestărilor lucrării cu pricina, subiectul fiind „moştenit” de toate expresiile şi manifestările unei lucrări: 

Varşovia : Insurecţia din 1944 / Norman Davies ; Traducere din limba engleză de Diana Elena Puşcaşu. — Bucureşti : RAO International Publishing Company, 2008. — ISBN 978-973-103-493-5.

Insurecţia varşoviană (august – octombrie 1944) [despre] 

 

Rising ’44 : the Battle for Warsaw / Norman Davies. — London : Macmillan, 2003. — ISBN 0333905687 9780333905685

Insurecţia varşoviană (august – octombrie 1944) [despre] 

Notez en passant că, dacă nu aveam predefinit evenimentul, ar fi trebuit să pot să-l definesc şi să-l introduc în ontologie (vreau să zic că indexatorul trebuie să aibă posibilitatea să propună extensii ale ontologiei, chiar dacă, în practică, decizia lui poate fi schimbată de indexatorii „seniori” care — se presupune —supervizează ontologia). 

 

5. Fabulaţiune despre cum să se prezinte indexul de descriptori 

Spuneam mai sus, că unul dintre atuurile majore ale descriptorilor precoordonaţi este — după mine — posibilitatea de baleiere elegantă a indexului, pe care o oferă. Acum, mergând pe exemplul dat, să vedem cum ar putea un soft deştept să prezinte indexul, pe baza informaţiilor pe care le are din ontologie. Astfel, folosind doar signaturile în româneşte şi permutând componentele, un index „clasic” ar fi:  

 

Al Doilea Război Mondial (1939 – 1945)

Al Doilea Război Mondial – Polonia

Al Doilea Război Mondial – Polonia – Insurecţia varşoviană

Al Doilea Război Mondial – România

Al Doilea Război Mondial – România – Lovitura de stat de la 23 august 1944

Insurecţia varşoviană (august – octombrie 1944)

istorie

istorie – războaie

istorie – războaie – Al Doilea Război Mondial

istorie – războaie – Al Doilea Război Mondial – Polonia

istorie – războaie – Al Doilea Război Mondial – Polonia – Insurecţia varşoviană

istorie – războaie – Al Doilea Război Mondial – România

istorie – războaie – Al Doilea Război Mondial – România – Lovitura de stat de la 23 august 1944

istorie – Polonia

istorie – Polonia – războaie

istorie – Polonia – războaie – Al Doilea Război Mondial

istorie – Polonia – războaie – Al Doilea Război Mondial – Insurecţia varşoviană

istorie – România

istorie – România – războaie

istorie – România – războaie – Al Doilea Război Mondial

istorie – România – războaie – Al Doilea Război Mondial – Lovitura de stat de la 23 august 1944

Lovitura de stat de la 23 august 1944

Polonia

Polonia – istorie

Polonia – istorie – războaie

Polonia – istorie – războaie – Al Doilea Război Mondial

Polonia – istorie – războaie – Al Doilea Război Mondial – Insurecţia varşoviană

războaie

războaie – Al Doilea Război Mondial

războaie – Al Doilea Război Mondial – Polonia

războaie – Al Doilea Război Mondial – Polonia – Insurecţia varşoviană

războaie – Al Doilea Război Mondial – România

războaie – Al Doilea Război Mondial – România – Lovitura de stat de la 23 august 1944

România

România – istorie

România – istorie – războaie

România – istorie – războaie – Al Doilea Război Mondial

România – istorie – războaie – Al Doilea Război Mondial – Lovitura de stat de la 23 august 1944

 

Iar o prezentare mai bună ar fi: 

 

Al Doilea Război Mondial (1939 – 1945) [n1 resurse]

                Polonia [n1-1 resurse]

                                Insurecţia varşoviană  [n1-1-1 resurse]

                România [n1-2 resurse]

                                Lovitura de stat de la 23 august 1944 [n1-2-1 resurse]

Insurecţia varşoviană (august – octombrie 1944) [n2 resurse]

istorie [n3 resurse]

                războaie [n3-1 resurse]

                                Al Doilea Război Mondial [n3-1-1 resurse]

                                                Polonia [n3-1-1-1 resurse]

                                                                Insurecţia varşoviană [n3-1-1-1-1 resurse]

                                                România [n3-1-1-2 resurse]

                                                                Lovitura de stat de la 23 august 1944 [n3-1-1-2-1 resurse]

                Polonia [n3-2 resurse]

                                războaie [n3-2-1 resurse]

                                                Al Doilea Război Mondial [n3-2-1-1 resurse]

                                                                Insurecţia varşoviană [n3-2-1-1-1 resurse]

                România [n3-3 resurse]

                                războaie [n3-3-1 resurse]

                                                Al Doilea Război Mondial [n3-3-1-1 resurse]

                                                                Lovitura de stat de la 23 august 1944 [n3-3-1-1-1 resurse]

Lovitura de stat de la 23 august 1944 [n4 resurse]

Polonia [n5 resurse]

                istorie [n5-1 resurse]

                                războaie [n5-1-1 resurse]

                                                Al Doilea Război Mondial [n5-1-1-1 resurse]

                                                                Insurecţia varşoviană [n5-1-1-1-1 resurse]

războaie [n6 resurse]

                Al Doilea Război Mondial [n6-1 resurse]

                                Polonia [n6-1-1 resurse]

                                                Insurecţia varşoviană [n6-1-1-1 resurse]

                                România [n6-1-2 resurse]

                                                Lovitura de stat de la 23 august 1944 [n6-1-2-1 resurse]

România [n7 resurse]

                istorie [n7-1 resurse]

                                războaie [n7-1-1 resurse]

                                                Al Doilea Război Mondial [n7-1-1-1 resurse]

                                                                Lovitura de stat de la 23 august 1944 [n7-1-1-1-1 resurse] 

(Din pricina simetriei exemplului meu) lucrarea lui Davies apare sub jumătate dintre aceste intrări. Se observă că descriptorii formaţi din mai multe componente apar ca intrări sub fiecare componentă (componentele sunt permutate) şi astfel, cu o singură asignare, am pus lucrarea lui Davies sub 22 de intrări de index ! 

[paranteză]

Numărul ăsta poate să crească în timp, dacă cineva rafinează ontologia şi introduce locul geografic „Europa” şi situaţia „războaie <> Europa” şi reconfigurează corespunzător relaţiile existente.

[/paranteză] 

Şi asta, în timp ce în Worldcat, la OCLC, găsesc doar 3 subiecte asignate manifestării englezeşti: 

 

World War, 1939-1945 – Poland – Warsaw.

Warsaw (Poland) – History – Uprising, 1944.

Poland – History – Occupation, 1939-1945. 

 

Întrebarea e: să se genereze toate intrările posibile ? Cred că nu e cazul, şi anume, intrări precum:  

Al Doilea Război Mondial – istorie

Insurecţia varşoviană – Polonia

Lovitura de stat de la 23 august 1944 – România

Polonia – Al Doilea Război Mondial – istorie

România – Al Doilea Război Mondial – istorie 

 

adică intrări în care o componentă cu sens mai larg apare mai la dreapta uneia cu un sens mai restrâns, nu folosesc, din logica prezentării ierarhice (arborescente), unde progresia spre dreapta semnifică restrângere de sens. 

 

6. Despre libertatea indexatorului 

Să reluăm: în acest scenariu, indexatorul are la dispoziţie o ontologie din care îşi ia componentele pentru a construi descriptorii de care are nevoie. Aşadar, el ar trebui să fie (relativ) liber să facă asocierile pe care le consideră necesare pentru a construi descriptorii cei mai specifici pentru caracterizarea resursei (fie aceasta asignarea unui subiect sau încadrarea într-o clasă — NB. nu clasă în sens CZU). 

Mai mult: dacă nu găseşte în ontologie componentele de care are nevoie (sau descriptorii gata construiţi), el trebuie să poată să-şi extindă corespunzător ontologia. 

De pildă, să presupunem că am de indexat lucrarea: 

Ion Petrică. Confluenţe culturale româno-polone : a doua jumătate a sec. al XIX-lea 

încorporată în manifestarea: 

Confluenţe culturale româno-polone : (a doua jumătate a sec. al XIX-lea) / Ion Petrică. — Bucureşti : Minerva, 1976 

şi vreau să-i asignez descriptorul: „Polonia <> România <> relaţii culturale – a doua jumătate a sec. XIX”. 

Atunci, având deja „România” şi „Polonia” mai trebuie să adaug în ontologie doar conceptul „relaţii culturale” şi situaţia „Polonia <> România <> relaţii culturale”. Apoi asignez această situaţie — prin relaţia „subiect” — lucrării mele. Astfel, ea va apărea în indexul de subiecte sub intrările:  

Polonia

                România

                                relaţii culturale

România

                Polonia

                                relaţii culturale

relaţii culturale

                România

                                Polonia

                Polonia

                                România 

Mai e un aspect de discutat aici: subdiviziunile. După părerea mea, din raţiuni practice, subdiviziunile trebuie să fie doar caracterizări fine ale relaţiei „subiect” dintre o lucrare şi un descriptor. Cu alte cuvinte, să aibă statut de proprietăţi ale relaţiei şi nu să nu facă parte din ontologie. În exemplul ăsta, „a doua jumătate a sec. XIX” este o astfel de subdiviziune, şi ea trebuie să fie expusă la prezentarea lucrării, dar nu şi în indexul de subiecte. 

Ion Petrică. Confluenţe culturale româno-polone : a doua jumătate a sec. al XIX-lea

                Polonia – România – relaţii culturale – a doua jumătate a sec. XIX [despre] 

[paranteză]

Similar, astfel de proprietăţi se pot atribui şi altor relaţii între diverse entităţi. De pildă relaţiei „afiliere” dintre o „persoană” şi o „colectivitate” i se poate ataşa legitim o perioadă.

[/paranteză] 

 

7. Conceptele, clasele şi termenii 

La discuţia care a provocat acest text, dna. Denis Rotaru a ridicat — la un moment dat — o problemă ce mi se pare importantă: distincţia dintre „poezie” ca subiect şi „poezii” ca „subdiviziune de formă” (în jargonul RAMEAU). Mie, soluţia radicală pentru acest tip de probleme (precis foarte frecvente) este introducerea în ontologie atât a conceptului „poezie/poetry”, cât şi a clasei „poezii/poems”. Şi aplicarea soluţiei terminologice standard: introducerea termenilor în ontologie ca entităţi distincte şi designarea acestei perechi concept-clasă cu un acelaşi termen în româneşte (dar cu termeni diferiţi în englezeşte, de pildă). 

 

designări

fig. 3 

Aşadar, conceptul „poezie” (cf. DEX: modalitate a literaturii care exprimă mesajul artistic cu ajutorul imaginilor expresive, al unui limbaj concentrat, al afectivităţii, al rimei, al ritmului etc.) este asociat — prin relaţia „designat de” cu termenul „poezie, poezii”, iar signatura lui este „poezie” (putem conveni că relaţia de designare între un concept şi un termen expune singularul termenului). Pe de altă parte, clasa „poezii” (cf. DEX: (concr.) creaţie literară în versuri) este asociată (în româneşte) cu acelaşi termen, iar signatura ei este „poezii” (putem conveni că relaţia de designare între o clasă şi un termen expune pluralul termenului). 

Lasă că, pe de altă parte, termenul englezesc „poem, poems” designează atât clasa „poezii” cât şi subclasa sa „poeme” (sau nu ? există un termen englezesc ?). 

Tot atunci, dna. Nina Botez a ridicat şi o altă problemă care mi se pare importantă: clasele complexe. Acestea — de dragul generării intrărilor de index permutabile — ar trebui să fie reprezentate în propunerea mea ca situaţii (unele chiar cu nume propriu). Exemplul este: „scriitori de limbă maghiară din România”. Las pe altă dată discuţia fină despre ce înseamnă „din România”: născuţi pe teritoriul actual al României ? cetăţeni români ? care au trăit minimum 10 ani în România ? etc. 

 

scriitori maghiari din România

fig. 4 

Aşadar, am „construit” clasa „scriitori de limbă maghiară din România”, ca o situaţie: „scriitori <> limba maghiară <> România”.  

[clasă]

id c-3
termen >> [ro] scriitori

 

[concept]

id co-1
termen >> [ro] limba maghiară

 

[situaţie]

id s-5
componentă egp-1 (i.e. „România”)
subclasă a c-3 (i.e. „scriitori”)
componentă co-1 (i.e. „limba maghiară”)
apelaţiune [ro] scriitori de limbă maghiară din România

 

Deci, intrările de index (generabile automat) ar fi:  

limba maghiară

                scriitori

                                România

                România

                                scriitori

România

                limba maghiară

                                scriitori

                scriitori

                                limba maghiară

scriitori

                limba maghiară

                                România

                România

                                limba maghiară 

dar, în afara indexului, s-ar putea folosi direct apelaţiunea (mai naturală) „scriitori de limbă maghiară din România”. 

Sigur, o să-mi spuneţi că în indexuri, în loc de „limba maghiară” ar trebui să se folosească „maghiară, limba”, ca să intre la „M”. Cred că cel mai bine e să intre atât la „L”, cât şi la „M” (n-avem de ce să facem economie de intrări). După mintea mea, oricare entitate poate genera multiple intrări de index (chiar dacă unele „ascunse”). În cazul astă, mi s-ar părea OK să avem şi „apelaţiunea fantomă” „maghiară, limba”. 

 

8. Epilog 

Vestea proastă e că multe detalii ale unei asemenea scheme mai trebuie gândite bine. Şi sunt destule probleme nerezolvate. Spun una de care sunt (de mult) conştient: cum să reprezinţi dinamica în timp a unei entităţi geopolitice ? Ce e aia „România” ? Statul cu acest nume având teritoriul din 2008 ? Din 1941 ? Din 1920 ? Din 1914 ? 

Apoi, cum să pui în indexuri unităţile administrativ-teritoriale ? Exemplu: 

România

                jud. Maramureş

                                com. Şomcuta Mare

                                                Vălenii Şomcutei 

sau chiar signatura: 

Vălenii Şomcutei (com. Şomcuta Mare, jud. Maramureş, România). 

Eu le-aş pune pe ambele. Bine o fi ? 

Dar, pe lângă dificultăţi, cred că ceea ce vă propun aici e în ton cu dezvoltările tehnologice contemporane, chiar dacă google-izarea webului pare a zice că trendul e spre simplu şi amatoristic.

Reclame

Written by poliptic

15 iunie 2008 at 12:08 am