4. MARC21 export: OCLC profiel

Aangepast door:Jef Tegenbos
Aangepast op:12/10/2015; 11:50

4.1. Toelichting

Deze nota documenteert de wijze waarop de MARC21 export wordt geparametriseerd met behulp van exportprofielen, in functie van de opname van Anet Brocade records in Worldcat/OCLC.

De finale export wordt echter nog beïnvloed door:

  • parameters die in de software werden vastgelegd (bv. voor het impressumveld) en/of die kunnen aangeroepen worden via extra routines (bv. voor het bepalen van de GMD, en voor het uitsluiten van de auteur e.a.)
  • exportgeneratoren (bv. voor het bepalen of pk’s moeten worden geëxporteerd, voor het bepalen van de default taal van authority records, enz.)

4.2. Tag filter

4.2.1. Lijst van op te nemen tags

  • 001: control number: cloi
  • 003: Control Number Identifier: code voor Anet, gerelateerd aan 001.
  • 005: Date and Time of Latest Transaction
  • 008: Fixed-Length Data Elements (niet alle posities worden gebruikt)
  • 010: Library of Congress Control Number
  • 017: Copyright or Legal Deposit Number: komt overeen met Anet bibliografisch nummer type dep. Moet in nabehandeling ook resulteren in 017$bKoninklijke Bibliotheek van België.
  • 020: International Standard Book Number
  • 022: International Standard Serial Number
  • 024: Other Standard Identifier (bv. voor ISMN)
  • 026: Fingerprint Identifier
  • 028: Publisher Number: komt overeen met Anet bibliografisch nummer type ugpl
  • 035: System Control Number: voor opname van het OCLC nummer
  • 040: Cataloging Source
  • 041: Language Code
  • 100: Main Entry - Personal Name
  • 110: Main Entry - Corporate Name (in Anet: ook voor manifestaties als corporatieve auteur)
  • 130: Main Entry - Uniform Title
  • 210: Abbreviated Title: voor Anet citeertitels
  • 240: Uniform Title: bv. voor Anet muzieksorteertitel
  • 245: Title Statement
  • 246: Varying Form of Title: bv. voor Anet titel type v (secundaire titel)
  • 250: Edition Statement
  • 260: Publication, Distribution, etc. (Imprint)
  • 300: Physical Description
  • 340: Physical Medium
  • 383: Numeric Designation of Musical Work: voor Anet titel type nr (opustitel)
  • 384: Key: voor Anet toonsoort
  • 490: Series Statement
  • 500: General Note
  • 501: With Note (Anet relatie wi; annotatie wi)
  • 502: Dissertation Note
  • 505: Formatted Contents Note: voor Anet inhoudstafel
  • 510: Citation/References Note: voor Anet noottype br
  • 520: Summary, Etc.: voor Anet abstract
  • 521: Target Audience Note: voor Anet noottype doel
  • 525: Supplement Note
  • 534: Original Version Note: voor Anet noottypes rep en fac
  • 600: Subject Added Entry - Personal Name
  • 610: Subject Added Entry - Corporate Name
  • 630: Subject Added Entry - Uniform Title
  • 648: Subject Added Entry - Chronological Term
  • 650: Subject Added Entry - Topical Term
  • 651: Subject Added Entry - Geographic Name
  • 655: Index Term-Genre/Form: voor Anet publicatietype
  • 700: Added Entry - Personal Name
  • 710: Added Entry - Corporate Name (in Anet: ook voor manifestaties als corporatieve auteur)
  • 760: Main Series Entry
  • 770: Supplement/Special Issue Entry
  • 772: Supplement Parent Entry
  • 773: Host Item Entry
  • 775: Other Edition Entry
  • 776: Additional Physical Form Entry
  • 777: Issued With Entry
  • 780: Preceding Entry
  • 785: Succeeding Entry
  • 787: Other Relationship Entry
  • 856: Electronic Location and Access
  • 919: Lokaal gedefinieerd. Dient het acroniem van de holding te bevatten
  • 920: Lokaal gedefinieerd. Resource type zoals bepaald voor Unicat

4.2.2. Opmerkingen:

  • 084: Other Classification Number: zou kunnen gebruikt worden voor de Anet UDC, als de code voor Anet is toegekend (te registreren in $q, via nabehandeling). Voorlopig niet opgenomen.
  • 111: Main Entry - Meeting Name: zit mee onder 110. Niet te voorzien.
  • 264: Production, Publication, Distribution, Manufacture, and Copyright Notice: in Anet wordt geen onderscheid gemaakt tussen drukker, uitgever, producent. Niet te voorzien.
  • 382: Medium of Performance: hierin wordt de bezetting van een muziekstuk genoteerd. Zou theoretisch kunnen gebruikt worden voor het opnemen van de standaardbezetting van Anet. Maar de gecodeerde vorm waarin Anet dat noteert, komt niet overeen met de MARC21 notatie. Deze tag wordt voorlopig niet voorzien.
  • 711: Added Entry - Meeting Name: zit mee onder 710. Niet te voorzien.
  • indicator undefined dient voor OCLC niet vertaald te worden als # maar als * * (spatie).

4.3. Voorbereiding

4.3.1. Indicator recordtype

Wordt geëxporteerd naar de Leader, positie 06.

  • Bij de parametrisatie werd geen rekening gehouden met type p (“Used when there are significant materials in two or more forms that are usually related by virtue of their having been accumulated by or about a person or body”). Bij catalografische beschrijvingen behoren de sets tot een uitgave; ze zijn niet “toevallig” door iemand verzameld.
  • Bij de parametrisatie werd geen rekening gehouden met type o (“Used for a mixture of various components issued as a unit and intended primarily for instructional purposes where no one item is the predominant component of the kit”). Dergelijke sets zijn moeilijk te onderscheiden in Brocade, omdat dergelijke aanduiding alleen maar zou kunnen blijken uit de collatie (tekst) of uit het voorkomen van meer dan 1 drager (en dat is niet parametriseerbaar).

4.3.2. Indicator bibliographic level

3 types werden voor parametrisatie in aanmerking genomen:

  • tijdschriften (s), op basis van lidmaatschap.
  • onderdeelbeschrijvingen (a), op basis van het relatietype.
  • monografieën (m): alle andere records.

Volgende types werden niet toegekend:

  • b (serial component part, voor bv. een regelmatig verschijnende column in een tijdschrift): in Anet worden dergelijke records niet catalografisch beschreven.
  • c (collection, voor verzamelingen van items die niet door publicatie samen horen): in Anet worden dergelijke records niet catalografisch beschreven.
  • d (subunit, voor onderdelen van collecties): in Anet worden dergelijke records niet catalografisch beschreven.
  • i (integrating resource, voor bv. losbladigen): dergelijke records kunnen in Anet niet gecodeerd of via meta-informatie worden onderscheiden, alleen op basis van het voorkomen van bepaalde karakters (<LOS>) in welbepaalde velden (annotatie of collatie).

4.3.3. Indicator descriptive cataloguing form

Deze parameter moet op c staan, d.w.z.: “ISBD punctuation omitted”. Anet records zijn immers wel volgens ISBD beschreven, maar de records bevatten geen ISBD-interpunctie op het einde van een (sub)veld.

4.3.4. Vertaling Brocade coderingen

De vertalingen van Brocade codes die moeten gebeuren voor de eigenlijke omvorming van de data naar een MARC21 structuur, worden opgenomen in schema oclcprep.

Dat schema bevat de vertaaltabel voor de meeste auteursfuncties die niet behoren tot de MARC21 relator codes. Het gaat dan om de auteursfuncties voor de uitvoerende muziek, die alle dienen omgevormd naar relator code mus. Dat heeft als consequentie dat mus nooit kan omgezet worden naar tag 100/110, omdat anders alle uitvoerende muzikanten (bv. zbb - bas-bariton) als main entry in aanmerking zouden komen, en dat is niet geoorloofd. De keuze om deze vertaling in de voorbereidende fase te doen heeft als voordeel, dat er alleen een vertaaltabel dient aangemaakt, en dat deze codes niet individueel dienen geparametriseerd te worden.

Auteursfunctie zxx (gebruikt voor auteurs waarvan de auteursfunctie niet is gekend, bv. omdat ze niet werd aangegeven bij geïmporteerde records uit externe bestanden) kan niet vooraf vertaald worden; de functie mag in de export niet verwoord worden. De functie moet effectief geparametriseerd worden om ervoor te zorgen dat de auteurs wel worden opgenomen bij export. Verwerking (weglaten van de auteursfunctie) gebeurt daarom in de nabehandeling.

4.3.5. Externe bronnen

In MARC21 moeten gegevens die uit externe bronnen komen, tussen rechte haken worden geplaatst. In Anet wordt die bronvermelding aangegeven met type ext.

4.4. Dragers

Parametrisering gebeurt hier; vertaling van de codes: zie nabehandeling.

4.5. Taal van de inhoud

4.6. Lidmaatschappen

niet te converteren in MARC21.

4.7. Titels

Niet te parametriseren:

  • taal van de titel (er is geen vastgesteld MARC21 veld of subtag hiervoor).
  • extensie bij titel (is in Anet/regelwerk lvd verboden bij alle titeltypes, behalve bij de sorteertitel)
  • sorteertitel (is een eigen geconstrueerde titel die alleen gebruikt wordt bij ordonnanties, en waarvan de betekenis in Worldcat waarschijnlijk niet duidelijk is).
  • originele titel: kan niet naar tag 246, maar ook niet naar een algemeen annotatieveld (500), want bij de parametrisering van een titel naar een annotatieveld, kan dat veld niet worden ingeleid door een verklarende intro.
  • woorden titel: is eigenlijk onderwerpsontsluiting, en geen titel.

Onderscheid hoofdtitel - ondertitel:

  • gebeurt op basis van het voorkomen van ” : ”. Het titelgedeelte voor het eerste voorkomen wordt geconverteerd naar 245$a; alle titelgedeeltes na het eerste voorkomen worden geconverteerd naar 245$b.
  • bij titels van oude records, waarin meestal ”: ” als scheiding voorkomt (op basis van oudere catalografische regels; voor 2011) kan geen scheiding tussen $a en $b gebeuren. Die titels worden in zijn geheel naar 245$a gemapt.
  • schaalaanduidingen (1:100.000) leveren bij export dus geen problemen op.

Citeertitels:

  • tweede indicator altijd 0, omdat het niet gaat om een key title (ISSN).
  • volledige titel moet in 210$a terechtkomen, omdat tag 210 geen onderscheid maakt tussen hoofdtitel en ondertitel.
  • titeltype zou normaal in $2 moeten geregistreerd worden, maar dat kan in de meeste gevallen niet worden meegegeven, omdat $2 een vooraf gedefinieerde MARC21 code veronderstelt. En dat is enkel voorhanden voor type ci (Index Medicus). Dus alleen die kan als dusdanig worden opgegeven, in een vertaaltabel in nabewerking.

Opus titel:

  • MARC21 voorziet in tag 383 aparte subvelden voor serial number (bv. nr. 14) in $a, opus number (bv. op. 4, nr. 7) in $b en thematic index number (bv. BWV 211) in $c. Daar maakt dit titeltype geen onderscheid tussen.
  • te converteren naar $b.

Paralleltitel:

  • zou ook naar 245 $b moeten, maar dan wordt de interpunctie problematisch, en komen we in conflict met andere elementen uit de hoofdtitel die naar $b moeten. Alleen in 246 op te nemen.

Secundaire titel:

  • in Anet krijgen diverse andere titels het type v: de vorige titel, de titel op de kaft, de titel op de rug, enz. In MARC21 worden die onderscheiden via subtags in tag 246. Conclusie: tweede indicator wordt # aangezien het type niet kan gespecificeerd worden.

Meervoudige titel:

  • moet in MARC21 worden toegevoegd in 245$b. Maar dat is niet mogelijk, aangezien de parametrisering zou leiden tot de (verboden) verdubbeling van 245. Daarom naar 246, “other title” - al klopt dat niet (in Anet meer dan 12.000 records).

Uniforme titel:

  • wordt gemapt op tag 130.
  • als er echter al een tag 100 of 110 is toegekend op basis van andere parameters, komt deze titel terecht in 240 (op basis van parameters vastgelegd in de software).

4.8. Bibliografische nummers

Enkele nummertypes dienen niet omgezet, omdat het geen standaardnummers zijn, maar verwijzingen naar bibliografische repertoria:

  • lugt
  • rism

ISSN:

  • voorziet aparte subtags voor incorrect ($y) of canceled ($z). In Brocade wordt dat onderscheid niet gemaakt. Om te zetten naar “incorrect”.

ICS:

  • niet helemaal duidelijk. Hoogstwaarschijnlijk toegekend door ISO, dus op die manier geparametriseerd. Te vertalen in nabewerking

mm:

  • niet helemaal duidelijk. In de praktijk wijst het meestal naar een videorecording, dus op die manier geparametriseerd.

fp:

  • type naar 026$2, en te vertalen in nabewerking.

dep:

  • type naar 017$b, en te vertalen in nabewerking.

4.9. Relaties

Gezien het grote aantal relaties worden die gedefinieerd in een apart profiel.

Wel op te nemen in de tabel:

  • relaties gedefinieerd in Brocade, maar niet in regelwerk lvd toegelaten (grotendeels overgenomen uit de generieke tabel).
  • inbegrepen de relaties alleen in gebruik voor STCV.

Niet te exporteren relaties voor OCLC:

  • relaties naar ander regelwerk (bv. lstcv; irta)
  • verzamelrelaties: rnv, oth, pa, tn, na, ta, gno enz. omdat ze bij export een onoverzienbaar aantal relaties kunnen produceren.
  • an, nt: is hardcoded opgelost in export generator d %OCLC^zmosgmd. Bevat een c-loi een relatie an, dan gaat deze software de gerelateerde c-loi ophalen en vandaar verder via relatie nt naar de c-loi van het tijdschrift. Alle data om in de subvelden $t, $w en $g te plaatsen worden verzameld en vervolgens aan het export profiel OCLC doorgegeven voor verwerking zoals relatie at. Er wordt op dit ogenblik enkel 1 relatie an verwerkt. M.a.w. als een c-loi twee an-relaties zou hebben, wordt er maar 1 verwerkt. Als de relaties an en nt toch zouden worden opgenomen in de tabel relationsoclc, dan zouden ze twee keer in de export worden opgenomen (als tag 773 vanuit a*n met enkel relatie naar nummer, en als tag *773 vanuit at met relatie naar tijdschrift. Nu wordt enkel 773 vanuit at weerhouden). Mochten er nog constructies zijn zoals an/nt, dan moet deze code dus uitgebreid worden met extra instructies.

Andere kwesties:

  • tho: te converteren als 490 - de verzameltitel voor de thesissen van een bepaalde richting wordt als een reekstitel beschouwd (zelf geconstrueerd).
  • vnr: heeft geen $w waarin de cloi wordt weggeschreven. Die link kan dus niet in 490 worden meegegeven.
  • Voorvoegsel voor record in $w: toe te voegen in nabehandeling, vertaaltabel voor relatiecodes.

4.10. Personele auteurs

  • mus: deze auteursfunctie werd dikwijls verkeerd gebruikt in het verleden, nl. voor componisten. Dat komt vooral voor bij EHC, die liedteksten ontsluit, dwz. met het publicatietype van tekstuitgave. En dan komt mus wel in aanmerking voor tag 100. Maar aangezien we alle z-functies voor uitvoerende muziek ook als mus omzetten, zou je voor die functies een foutieve omzetting krijgen. Dus: mus niet als 100 te exporteren.

4.11. Corporatieve auteurs

opgelet: manifestaties als corporatieve auteur zouden ofwel naar 110 ofwel naar 111 moeten, afhankelijk van de constructie van de naam. Dat is echter zo goed als onmogelijk te parametriseren, dus alles naar 110. Bovendien is de structuur van 111 anders dan die van 110 (subordinate unit moet ofwel in $e ofwel in $b).

4.12. Annotaties

Gezien het grote aantal annotaties worden die gedefinieerd in een apart profiel.

Annotaties waarvoor overeenkomstige relaties bestaan dienen bij voorkeur te worden gemapt naar identieke tags in MARC. Bv. cui naar 787/1/8/.

Annotatietype sf kan niet goed in tag 787 worden opgenomen, omdat sf twee zaken regelt: zowel succeeding als preceding entry.

4.13. Collatie

Het afmetingenveld in Anet bevat in de meeste gevallen gegevens over de bijlage. Te mappen naar tag 300$e. Dat zal in een klein aantal gevallen fouten opleveren, in records die toch afmetingen zouden bevatten.

4.14. Onderwerpscodes

UDC:

  • UDC zou naar tag 084 kunnen, maar dat lijkt me niet verstandig, omdat die classificatie weinig betekenis heeft voor de buitenwereld. Daarom nemen we de termen zelf op in tag 650, het authority record in $0 en in $0 te verwijzen naar de bron (via naverwerking).

AAT - officiële termen:

  • AAT termen die tot de officiële AAT thesaurus behoren; ze hebben alle lidmaatschap AAT
  • dienen omgezet naar 650/ /7/
  • vertaaltabel voor 650$2: AAT=aat

AAT - niet officiële termen:

  • AAT termen die niet tot de officiële AAT thesaurus behoren, omdat het nog om kandidaat termen gaat, of eigen Anet termen. Hebben geen lidmaatschap AAT. Ze mogen niet als echte AAT termen worden geëxporteerd, en dienen behandeld te worden als alle andere eigen Anet onderwerpstermen.
  • dienen omgezet naar 650/ /4/
  • geen verwoording van het type in subveld 2, dus ook geen vertaaltabel.
  • wordt opgelost via de exportgenerator, en daarin de extra executable zmosgmd. Die zet alle AAT-termen zonder lidmaatschap AAT om naar een (niet bestaand) authority type ZAAT. Dat type ZAAT wordt dan in het exportprofieel gedefinieerd, zoals eigen Anet onderwerpstermen.

Niet om te zetten: de a-lois van kunstwerken. De toegevoegde waarde als onderwerpsterm is miniem.

  • ART
  • MID
  • RUB

Niet om te zetten de types die data-elementen bevatten waarbij moeilijk de context kan geschetst worden.

  • AUC
  • COL
  • TT

4.15. Inhoud

Toegangscode:

  • moet naar $z.
  • toegangscode bij abstract en inhoudstafel kan niet worden omgezet, omdat beide types naar annotatie moeten.

Types op te nemen:

  • full: alle url types

Niet op te nemen, omdat ze geen wezenlijke informatie opleveren:

  • illustraties
  • abstract: online abstracts
  • inhoud: online inhoudstafels
  • link

Niet op te nemen, omdat de inhoud van het veld technische problemen oplevert bij import door OCLC (html-codering; te uitgebreide data):

  • inhoud
  • abstract

Vertaaltabel:

  • voor de toegangscodes (856z) bij full text, zodat de codes worden vertaald als “toegang via...”

4.16. Nabehandeling

4.16.1. Vaste inhoud MARC velden

  • 003 : code voor oorsprong van het control number in tag 001 (Anet)

  • 040 $a : voor de code van de verantwoordelijke catalografische instelling (Anet)

  • 040 $b : taal van catalogiseren (Nederlands)

  • 245 $h : voor de omzetting van de General Material Designation (GMD). De GMD-verwoordingen zijn gebaseerd op de tabel van OCLC, en beperkt tot volgende waarden:

    • spel
    • elektronisch
    • kit
    • microfilm/microfiche
    • video opname
    • geluidsopname
    • realia
    • dia
    • muziekopname

Beslissingstabel voor de GMD:

  1. pt = a::pt.39

    GMD = spel

  2. aantal dragers = 0

    geen GMD

    Dd. oktober 2014 komen er in de databank 1.200 clois voor met lm zebra én pk, maar zonder drager. Optie is zeker om die default de drager paper mee te geven; maar het is niet uit te sluiten dat dit in de toekomst nog voorkomt.

  3. aantal dragers = 1

    3.1 drager = paper

    geen GMD

    3.2 drager = daf or cdrom or disk or dvd-rom or url

    GMD = elektronisch

    3.3 drager = mm

    GMD = kit

    3.4 drager = micro

    GMD = microfilm/microfiche

    3.5 drager = video or dvd-video or dvd or bd

    GMD = video-opname

    In een aantal gevallen zal dat een foute GMD opleveren, omdat er vroeger maar één dvd-drager bestond, waaronder alle varianten werden geregistreerd, dus mogelijk ook muziekopnamen.

    3.6 drager = mb or cd or dvd-audio or gp

    GMD = geluidsopname

    3.7 drager = realia

    GMD = realia

    3.8 drager = dia

    GMD = dia

    3.9 drager = “else”

    geen GMD

  4. aantal dragers > 1

    4.1 drager = daf and (gp or mb or cd or dvd-audio)

    GMD = muziekopname

    Er wordt voorrang gegeven aan GMD muziekopname, omdat de combinatie van dragers er op wijst dat het om (door de instelling) gedigitaliseerde opnamen gaat van andere dragers)

    4.2 drager = paper and url

    geen GMD

    In dit geval gaat het vooral om papieren publicaties waarvoor de elektronische versie in hetzelfde record wordt beschreven. Voorrang dus aan papier.

    4.3 drager = “else”

    GMD = kit

4.16.2. Schema voor te vertalen inhoud

Via schema oclcafter:

  • 210$2: Titeltypes
  • 650$2: Bron van onderwerpsterm (AAT)
  • 700$4: om auteursfunctie zxx niet als code te laten verwoorden
  • 017$b: vertaling van depotnummer (KBR)
  • 024$2: vertaling van andere standaard nummertypes (ICS)
  • 026$2: vertaling van nummertype fingerprint
  • 041$a: vertaling van taalcodes die niet in MARC zijn gedefinieerd
  • 340$a: vertaling van drager codes
  • 775$i: vertaling van andere editie (voor reproducties: relatie repof)
  • 776$i: vertaling van relatietype voor andere fysieke vorm
  • 787$i: vertaling van andere relatietypes
  • 856$z: vertaling van toegangscodes

4.16.3. Voorvoegsels

  • Nodig voor alle velden waarin authority codes werden opgenomen, voor de bron (prefix in subtag $0) van die codes (Anet).
  • Nodig voor alle velden waarin verwijzingen naar catalografische records werden opgenomen, voor de bron (prefix in subtag $w) van die codes (Anet).
  • Nodig voor de bron van het OCLC nummer. Opgelet: tag 035 is herhaalbaar. Indien er, naast het OCLC nummer, nog een ander systeemnummer dient opgenomen te worden, moeten we het mechanisme voor toevoegen van voorvoegsels herbekijken.