8. Indexen, uitgebreide indexen en zoekbomen

Auteur Marc Jeurissen
Aanmaak 20 jan 2003
Oud BVV nr 2043

8.1. Abstract

Bedoeling van deze tekst is de problematiek en techniek van de uitgebreide indexen, en de relatie index - zoekboom te verduidelijken.

8.2. Problematiek

  • Uitgebreide indexen zijn enkel van toepassing op onderwerpscodes, en worden in de OPAC gebruikt in zoekbomen en in de schermen met extra informatie van een authority code. De bedoeling is dat niet alleen de werken over de authority code in kwestie kunnen opgevraagd worden, maar ook de werken over de meer gedetailleerde termen van deze code.
  • Een zoekboom is altijd gelinkt aan een bepaalde index. Dit houdt in dat alle authority codes met types die in de zoekboom toegelaten zijn, ook in die index moeten terug te vinden zijn!

8.3. Techniek

8.3.1. Authority types

In de meta-informatie van een authority type kunnen de indexsuffixen ingevuld worden, gescheiden door ;. Dit mechanisme berust op de volgende afspraken:

  • een catalografische indexnaam bestaat altijd uit 3 delen, gescheiden door ..

    • Het eerste deel is altijd “cat”,
    • het tweede deel is regelwerk of OPAC gericht (bijvoorbeeld lvd, anet),
    • het derde deel wordt, voor onderwerpsindexen, bepaald door deze suffixen.
  • het suffix ow verwijst naar een index deel1.deel2.ow en deel1.deel2.owbt. Alle andere suffixen verwijzen naar deel1.deel2.ow geconcateneerd met het suffix, en deel1.deel2.ow, geconcateneerd met het suffix en bt.

    Voorbeeld:

    cat.anet.ow
    cat.anet.owp
    cat.anet.owpbt

8.3.2. Indexroutine

Wanneer een catalografische beschrijving geïndexeerd wordt met een authority code als onderwerpscode, dan wordt de macro m4_getAuthIndexSuffix aangesproken. Deze geeft een array terug met in de eerste subscripts de suffix van de te gebruiken index, in de tweede subscripts de te indexeren authority codes.

Werkwijze:

  • De indexsuffixen van het type van de authority code worden opgehaald.
  • De code zelf wordt onder elk suffix in de array geschreven.
  • De bredere termen worden recursief overlopen, dus niet alleen de bredere termen van de code zelf, maar ook diens bredere termen enz...
  • Van elke bredere term worden de indexsuffixen opgehaald. Voor elke suffix die ook voorkomt in de suffixen van de oorspronkelijke authority code, wordt de eerste hoofdvorm van die bredere term, voor die index, in de array weggeschreven.

Voorbeeld:

a::920.7 = Marnix Gijsen = authority type P = indexsuffixen p;ow
BT: a::839.3.92 = Nederlandse letterkunde: auteurs = authority type P = indexsuffixen p;ow
BT: a::839.3 = Nederlandse letterkunde = authority type U = indexsuffixen u;ow
BT: a::82.8 = Germaanse letterkunde = authority type U = indexsuffixen u;ow
...
Met de bredere termen van type U is enkel suffix ow gemeenschappelijk. Dit geeft dus volgende array:
ZArray(“ow”,”a::920.7”)
ZArray(“owbt”,”a::920.7”)
ZArray(“owp”,”a::920.7”)
ZArray(“owpbt”,”a::920.7”)
ZArray(“owbt”,”a::839.3.92:1”)
ZArray(“owbt”,”a::839.3:1”)
ZArray(“owbt”,”a::82.8:1”)
en de filing gebeurt in de overeenkomstige indexen, indien deze bestaan.

8.3.3. OPAC

Zoekboom - Opbouw

  • De opbouw van een zoekboom vertrekt van een startcode en overloopt recursief alle meer gedetailleerde termen.

  • Een gevonden code moet voldoen aan de restrictievoorwaarden wat betreft authority type en lidmaatschap.

  • Indien de aan de zoekboom gelinkte index geen uitgebreide versie heeft dan wordt de code aan de zoekboom toegevoegd.

  • Indien de aan de zoekboom gelinkte index wel een uitgebreide versie heeft (suffix bt) en de term heeft gelockte beschrijvingen in die index, dan wordt de code toegevoegd.

  • Indien de aan de zoekboom gelinkte index een uitgebreide versie heeft en de code heeft geen gelockte beschrijvingen in die index, dan wordt gekeken naar de meta-informatie Toon codes die geen gelockte beschrijvingen hebben.

  • De meer uitgebreide en gerelateerde termen van de code worden aan de meta-restricties onderworpen en als relatie van de code opgenomen indien ze voldoen.

  • Na verzameling van alle in aanmerking komende termen worden nog 3 operaties uitgevoerd:

    • Indien de aan de zoekboom gelinkte index geen uitgebreide versie heeft wordt de zoekboom overlopen en alle codes alsnog geschrapt die geen gelockte beschrijvingen én geen meer gedetailleerde termen hebben.
    • De relaties van alle codes worden overlopen en alsnog geschrapt indien ze zelf geen deel blijken uit te maken van de zoekboom, bijvoorbeeld omdat ze geen gelockte beschrijvingen hadden.
    • De zoekboom wordt gesorteerd in de 3 talen N, E, F.

Zoekboom - Consultatie

  • Bij consultatie van een zoekboom in de OPAC wordt een gekozen code uiteengetrokken in zijn hoofdvormen.
  • Van zo’n hoofdvorm worden de indexen overlopen waarvoor er gelockte beschrijvingen zijn.
  • Behoort zo’n index niet tot de reeks indexen van de OPAC in kwestie, dan wordt er geen rekening mee gehouden (voor uitgebreide indexen wordt gekeken naar de niet uitgebreide vorm).
  • Indien het een uitgebreide index is, wordt er enkel rekening mee gehouden bij de eerste hoofdvorm.
  • De inhoudscode van de index wordt opgehaald.
  • Gaat het niet om een onderwerpsindex, dan wordt de hoofdvorm met de verwoording van de inhoudscode getoond (Bijvoorbeeld Werken van ...).
  • Gaat het wel om een onderwerpsindex én de index is gelijk aan de zoekboomindex, dan wordt de hoofdvorm met de verwoording van de inhoudscode getoond.

Scherm met extra informatie

  • Bij opvraging van een scherm met extra informatie wordt een gekozen code uiteengetrokken in zijn hoofdvormen.
  • Van zo’n hoofdvorm worden de indexen overlopen waarvoor er gelockte beschrijvingen zijn.
  • Behoort zo’n index niet tot de reeks indexen van de OPAC in kwestie, dan wordt er geen rekening mee gehouden (voor uitgebreide indexen wordt gekeken naar de niet uitgebreide vorm).
  • Indien het een uitgebreide index is, wordt er enkel rekening mee gehouden bij de eerste hoofdvorm.
  • De inhoudscode van de index wordt opgehaald.
  • De hoofdvorm met de verwoording van de inhoudscode wordt getoond (bijvoorbeeld Werken van ...).
  • Zijn er meerdere onderwerpsindexen, dan wordt toch maar éénmaal de hoofdvorm met de verwoording van de inhoudscode getoond (Werken met betrekking tot ...), namelijk voor die index wiens suffix als eerste vermeld staat in de meta-informatie van het authority type.

8.4. Problemen en oplossingen

8.4.1. Zoekboom

Probleem

Neem bijvoorbeeld een zoekboom op onderwerp die werkt op index cat.anet.owu, maar codes toelaat van het type U en P, en de codes Poolse letterkunde van type U, met een narrower term Poolse letterkunde: auteurs van type P:

  • Voor de suffixen van type U is u;ow ingevuld, voor de suffixen van type P p;ow.
  • Een beschrijving met Poolse letterkunde: auteurs als onderwerp wordt gefiled in de indexen cat.anet.owp, cat.anet.owpbt, cat.anet.ow en cat.anet.owbt onder Poolse letterkunde: auteurs, en in de indexen cat.anet.ow en cat.anet.owbt onder Poolse letterkunde (zie Indexroutine).
  • Wanneer we in de zoekboom uitkomen bij Poolse letterkunde, zien we in het beste geval (zie Opbouw van een zoekboom) de code Poolse letterkunde: auteurs wel staan, maar we vinden er geen beschrijvingen over want die staan in index cat.anet.owp en niet in index cat.anet.owu!
  • Bovendien vinden we onder Poolse letterkunde en meer gedetailleerde onderwerpen zeker niet de ganse set, want een deel staat al zeker in index cat.anet.owbt en niet in index cat.anet.owubt!

Oplossing

  • Bij de suffixen van alle authority types die in een bepaalde zoekboom zijn toegelaten, moet minstens het suffix van de aan de zoekboom gelinkte index geplaatst worden. Met andere woorden in het voorbeeld hierboven moet bij de suffixen van type P p;u;ow ingevuld worden.

    Het naderhand bijvoegen van een suffix bij een authority type heeft wel ernstige indexgevolgen. Het backgroundproces overloopt de volledige databank en herindexeert alle beschrijvingen met een onderwerpscode van het gewijzigde type.

  • De zoekbomen allemaal linken aan de overkoepelende onderwerpsindex cat.all.ow.

8.4.2. Scherm met extra informatie

Probleem

Nemen we hetzelfde voorbeeld als hierboven bij de zoekboom, dan zullen we in het scherm met extra informatie van Poolse letterkunde, de narrower term Poolse letterkunde: auteurs zien staan. Doorklikken hierop geeft het correcte resultaat omdat de software nu niet gebonden is aan de zoekboomomgeving en gewoon in de index van het eerste onderwerpssuffix gaat kijken, met name cat.anet.owp.

De link Poolse letterkunde en meer gedetailleerde onderwerpen geeft echter om dezelfde reden als bij de zoekboom, een onvolledige set als resultaat. Een deel van de set staat namelijk in index cat.anet.owbt en niet in index cat.anet.owubt!

Oplossing

Vermits de software hier niet gebonden is aan de beperkende omgeving van een zoekboom, met andere wooorden geen vaste index heeft waarin moet gezocht worden, en vermits een authority code in principe andere authority codes van eender welk type als narrower term kan hebben, kan een juist resultaat alleen maar bekomen worden door altijd in een overkoepelende index te zoeken. Volgens afspraak is dit cat.anet.owbt.

Dit betekent

  • ofwel dat in de meta-informatie van alle authority types waarvan de codes als onderwerpscode mogen gebruikt worden, het suffix ow moet ingevuld worden;
  • ofwel dat de macro m4_getAuthIndexSuffix ( Indexroutine) de reeks suffixen default aanvult met ow.

Notitie

Overzicht (mail Cipal 21/3/2003)

Onze oorspronkelijke opzet was inderdaad dat elke zoekboom in principe zijn eigen index heeft. Onlangs hebben we echter ontdekt dat dit enkel werkt als je bij de indexsuffixen van authority types die zijn toegelaten in een bepaalde zoekboom, ook die index invult. Zo is het bijvoorbeeld niet voldoende om een zoekboom te hebben met index cat.all.owp waarin codes van het type P en U zijn toegelaten, terwijl bij de suffixen van code U enkel ‘u’ (verwijzend naar cat.all.owu) is ingevuld. De resultaten van die zoekboom gaan altijd in 1 of ander opzicht onvolledig zijn. Het onderhoud van zo’n systeem, dat sowieso al voor een belangrijk deel op afspraken is gebaseerd, is te delicaat.

Daarom hebben we geopteerd voor de oplossing dat alle zoekbomen (behalve eventueel zeer gespecialiseerde) best verwijzen naar de overkoepelende onderwerpsindex (bijvoorbeeld cat.all.ow). Hierbij zijn ook 2 zaken in ‘t oog te houden:

  • Het indexsuffix ow moet in principe in de meta-informatie van alle authority codes vermeld staan, alhoewel we er zouden kunnen aan denken om bij de indexering er automatisch van uit te gaan dat dit suffix er staat.
  • In de meta-informatie van een OPAC staat bij de Indexafhankelijke layout een optie Doorklikken op een verwijzing naar indexen van deze set, vanuit het scherm met extra informatie of een zoekboom, brengt de gebruiker naar: indextermen of korte beschrijvingen. Bij ons staat dit altijd op korte beschrijvingen en dan is er geen probleem. Zet je dit echter op indextermen dan kan je bij het doorklikken vanuit een zoekboom terecht komen bij indextermen die absoluut niets met die zoekboom te maken hebben, vermits je in de overkoepelende index aan het werken bent! We denken er dan ook aan om deze optie gewoon weg te laten en de gebruiker altijd rechtstreeks naar de korte beschrijvingen te sturen.

Een en ander betekent niet dat de deel-onderwerpsindexen (owp, owg, ...) nu maar moeten afgeschaft worden. Zij zijn wel degelijk nog nuttig bij het klikken op een onderwerp vanuit een volledige beschrijving. Als dat onderwerp bijvoorbeeld van het type P is en bij de indexsuffixen van P staat ‘p’ ingevuld, dan kom je (en dit keer terecht) in de owp index en niet in de overkoepelende ow index.

8.5. Welke indexen in welke situatie?

  Beschrijvingen van de term Beschrijvingen van de term en meer gedetailleerde beschrijvingen
Zoekboom Index gelinkt aan de zoekboom. Best de algemene ow index (zie boven). Zoekboomindex.bt
Extra info scherm Eerste suffix van het authority type owbt indien ow in suffixlijst, anders eerste suffix.bt
Doorklikken in volledige beschrijving
authority code: eerste suffix van het authority type
geen authority code: index gelinkt met de inhoudscode
niet van toepassing