7. Centaur

Auteur Jan corthouts
Aanmaak 17 sep 2004
Aangepast door Luc Bastiaenssen
Aangepast op 22 sept 2005

7.1. Abstract

Dit document bevat de documentatie over Centaur, een toolcat-toepassing waarmee op basis van diverse bibliografische nummers, zoals ISBN, ISSN, Vlacc, LCCN,.. bibliografische records in andere systemen (Amazon, Z39.50 servers, andere Brocade systemen) kunnen worden geïdentificeerd om vervolgens te worden gedownload en geïmporteerd in de lokale Brocade catalogus. Centaur maakt deel uit van Brocade release 3.10.

7.2. Algemene aspecten

Met Centaur kan een catalograaf aan de hand van een ISBN-nummer,.. een record opzoeken in een externe databank. Centaur werkt met

  • Amazon
  • Z39.50 databanken
  • Brocade catalogi (OAI compliant)
  • Cddb databanken
  • isbndb.org
  • Web Of Science Article Match Retrieval Service

Centaur is geen interactieve toepassing. Het is een toepassing die - net zoals andere toolcat-toepassingen - op de achtergrond werkt: Centaur haalt informatie op uit externe systemen en brengt vervolgens de geoogste informatie over naar een catalografieformulier.

7.3. Meta-informatie

Opdat Centaur goed zou werken, moet Brocade gevoed worden met diverse parameters:

  1. Omschrijf via Brocade ‣ Catalografie ‣ Catalografie - Beheersfuncties ‣ Centaur identifiers [link] de Centaur bronnen die je vanuit de catalografie wenst te benaderen. Voor elke bron geef je:
Identificatie
geef een identifier voor de Centaur bron
Benaming
geef een benaming voor de Centaur bron
Scope
Geef achtergrond informatie over doel, context van de bron (indien nodig)
Benaming (N E F D U)
geef een benaming van de Centaur bron zoals die moet worden in Brocade
Type.

Te kiezen uit

  • Amazon
  • Z3950
  • Z3950 XML via YAZ
  • Brocade
  • FreeDB
  • Generic Url

Bij elke bron horen ook diverse parameters die met een Centaur sessie worden meegegeven.

Amazon

Parameter 1:
geef de identificatiecode op, waaronder U bent geregistreerd bij Amazon. Dit wordt de Access Key ID genoemd. Meer informatie vind je onder http://aws.amazon.com/ .
Parameter 2:
de oorsprong van de Amazon sites. Bestaat uit één of meer codes uit de,fr,uk,us, gescheiden door een komma. Deze staan hier in volgorde, waarin ze worden geraadpleegd. Is bij ontstentenis us,uk,de,fr.
Parameter 3:
geef het precieze bronbestand op. De naam van het bronbestand moet gekend zijn bij Amazon(SearchIndex). Is Books bij ontstentenis. Voorbeelden : Books,
Parameter 4:
geeft de Amazon AssociateTag op (vereist sinds 2011). Een AssociateTag kan bekomen worden via https://affiliate-program.amazon.com/ - Klik op Join now for FREE!
Parameter 6:
lslb ofte largeSetLowerBound : vul een getal in of laat dit leeg. Indien er meer dan lslb hits voldoen aan de zoekactie, dan worden geen records teruggeven. (De zoekactie wordt dan als te algemeen beschouwd)
Parameter 7:
mspn ofte mediumSetPresentNumber : vul een getal in of laat dit leeg. Bevat het maximum aantal hits, dat mag worden teruggeven. Uiteraard moet mspn < lslb
Wachtwoord:
geef de Secret Access Key in, corresponderend met de Access Key ID
Guess procedure:
guessalwaysisbn
Retrieve query placeholders:
isbn:<nr>
Haal ook de records op, gerelateerd via relatietype:
leeg laten
Analyse procedure:
analyseamazon
Bij dubbels : welke records mogen automatisch worden aangemaakt ? :
leeg laten
Bij dubbels : welke records moeten tijdelijk worden bewaard ? :
leeg laten
Import parameters:
deze regelen de manier waarop de opgehaalde data wordt verwerkt in de Brocade databank ; plaats één parameter per lijn. Alle gangbare parameters van de toolcat applicatie catcv zijn hier geldig. Voorbeeld : keepalone=HSECTION

Z3950

Parameter 1:
geef het adres van de Z3950 server, bijv. z3950.loc.gov
Parameter 2:
geef de poort waarop de Z3950 server bereikbaar is, bijv. 7090
Parameter 3:
geef de identifier van de databank die je wenst te ondervragen, bijv. VOYAGER
Parameter 4:

geef de karakterset waarin de gevonden records geleverd worden aan Centaur. Dit moet uiteraard afgestemd worden op de mogelijkheden van de Z3950 server. Mogelijke waarden zijn :

  • ‘marc8’
  • ‘utf8’
  • ‘record’ : de karakterset wordt bepaald door positie 9 in het leaderveld, zoals beschreven in de Marc standards.
Parameter 5:
trace mode : als hier iets staat ingevuld, dan worden de tussentijdse marc* bestanden niet gewist na verwerking.
Parameter 6:
lslb ofte largeSetLowerBound : vul een getal in of laat dit leeg. Indien er meer dan lslb hits voldoen aan de zoekactie, dan worden geen records teruggeven. (De zoekactie wordt dan als te algemeen beschouwd)
Parameter 7:
mspn ofte mediumSetPresentNumber : vul een getal in of laat dit leeg. Bevat het maximum aantal hits, dat mag worden teruggeven. Uiteraard moet mspn < lslb
Gebruikersidentificatie:
indien vereist door de bron, geef de gebruikersidentificatie, nodig om de externe databank te benaderen. Laat leeg indien niet van toepassing.
Wachtwoord:
indien vereist door de bron, geef het wachtwoord, nodig om de externe databank te benaderen. Laat leeg indien niet van toepassing.
Guess procedure:

naam van een interne procedure, waar de aard van een gegeven zoekstring wordt bepaald. Voorbeelden:

  • guessdefault bruikbaar in vele omgevingen. Herkent de gebruikelijke types isbn, isbn13, issn, cloi, lccn (indien beginnend met lc.), ocm (indien beginnend met ocm. Kent het type any toe in alle andere gevallen.
  • guessforloc voor een bron , gelijkend op Library Of Congres
  • guessforvlacc voor de Vlacc bron (herkent ook nummers van type ‘vlnr’, ..)
Retrieve query placeholders:

bepaalt het frame van de PQF zoekstring. deze moeten worden ingevuld, corresponderend met de mogelijkheden van de externe databank. Plaats telkens aard van de zoeksleutel:gebruikt frame. Voorbeelden :

  • Library Of Congres :
    • isbn:f @attr 1=7 @attr 5=1 <nr>
    • isbn13:f @attr 1=7 @attr 5=1 <nr>
    • lccn:f @attr 1=9 @attr 5=1 <nr>
  • Vlacc:
    • ean13:f @attr 1=5000 @attr 5=1 <nr>
    • isbn:f @attr 1=5000 @attr 5=1 <nr>
    • isbn13:f @attr 1=5000 @attr 5=1 <nr>
    • vlnr:f @attr 1=12 @attr 5=1 <nr>
Haal ook de records op, gerelateerd via relatietype:

hier heb je de mogelijkheid, om in één ruk een record op te halen, samen met de records, die ermee zijn gerelateerd via de hier opgegeven relatietypes. Voorbeeld:

  • cnt (voor Vlacc bronnen met CD collecties) zorgt ervoor, dat ook de tracks van muziek cd’s worden overgehaald.
Analyse procedure:

naam van een interne procedure, die de binnenkomende data interpreteert. Voorbeelden:

  • analysemarc verwacht Marc21 data, ingebed in Z39.50 en interpreteert de Marc tags op een standaard wijze.
  • analysemarcfromvlacc idem, maar interpreteert de Marc tags volgende de regelgeving van Vlacc
Bij dubbels : welke records mogen automatisch worden aangemaakt ? :
Laat dit leeg (of vul 1 in), indien U geen multiple records wil ophalen. Zie ook Voetnoot Andere voorbeelden : 1,2=Eerste en tweede record, 1-5=Eerste t.e.m. vijfde record. De records, die U hier specifieert, zullen direct in de databank worden aangemaakt. U zal doorverwezen worden naar het eerste record in de rij, die is aangemaakt ; de overige staan in je history box.
Bij dubbels : welke records moeten tijdelijk worden bewaard ?
U hebt hier de mogelijkheid, om multiple resultaten eerst in een zoeklijstje aan te bieden, om toe te laten te kiezen, welke dient te worden aangemaakt. Voorbeelden : 2=Tweede record 2,3=Tweede en derde record, 2-5=Tweede t.e.m. vijfde record. Waarde is leeg bij ontstentenis. Zie ook Voetnoot
Import parameters:
deze regelen de manier waarop de opgehaalde data wordt verwerkt in de Brocade databank ; plaats één parameter per lijn. Alle gangbare parameters van de toolcat applicatie catcv zijn hier geldig. Voorbeeld : keepalone=HSECTION

Z3950 XML via YAZ

Deze methode onderstelt dezelfde parameters als Z3950. Het verkregen ‘object’ na download is evenwel reeds in een MARC XML structuur geconverteerd met behulp van de onderliggende YAZ toolkit. Kies een hiervoor aangepaste analyseprocedure.

Brocade

Parameter 1:
geef het eerste deel van het frame voor de OAI-URL waarmee de Brocade server wordt benaderd, bijv. http://server_name/oai/catgeneric/server.phtml?verb=GetRecord&metadataPrefix=catxml Dit betreft het deel van de OAI-URL, die onafhankelijk is van de aard van de zoeksleutel. —–&identifier=c:lvd:isbn<isbn> Vervang server_name door de DNS-naam van de Brocade server. Indien U multiple hits wenst, kies dan een aangepaste OAI-URL : Voorbeeld : http://server_name/oai/catgenericset/server.phtml?verb=ListRecords&metadataPrefix=catxml
Guess procedure:
naam van een interne procedure, waar de aard van een gegeven zoekstring wordt bepaald. Voorbeeld : guessdefault
Retrieve query placeholders:

bepaalt het tweede deel van het frame voor de OAI-URL, waarmee de Brocade server wordt benaderd, en is afhankelijk van de aard van de zoekstring. Voorbeelden:

  • cloi:&identifier=<nr>
  • isbn:&identifier=c:ob:isbn<nr>
  • isbn13:&identifier=c:ob:isbn<nr>
Haal ook de records op, gerelateerd via relatietype:
zelfde bemerking als bij Z3950
Analyse procedure:

naam van een interne procedure, die de binnenkomende data interpreteert. Aangewezen waarde :

  • analysecatxmlfromoai verwacht CATXML data, ingebed in een OAI request
Bij dubbels : welke records mogen automatisch worden aangemaakt ? :
Zie ook Voetnoot. Laat dit leeg (of vul 1 in), indien U geen multiple records wil ophalen. Andere voorbeelden : 1,2=Eerste en tweede record, 1-5=Eerste t.e.m. vijfde record. De records, die U hier specifieert, zullen direct in de databank worden aangemaakt. U zal doorverwezen worden naar het eerste record in de rij, die is aangemaakt ; de overige staan in je history box. Vergeet niet een aangepaste OAI url te kiezen, die multiple records toelaat.
Bij dubbels : welke records moeten tijdelijk worden bewaard ?
Zie ook Voetnoot. U hebt hier de mogelijkheid, om multiple resultaten eerst in een zoeklijstje aan te bieden, om toe te laten te kiezen, welke dient te worden aangemaakt. Voorbeelden : 2=Tweede record 2,3=Tweede en derde record, 2-5=Tweede t.e.m. vijfde record. Waarde is leeg bij ontstentenis.
Import parameters:
deze regelen de manier waarop de opgehaalde data wordt verwerkt in de Brocade databank ; plaats één parameter per lijn. Alle gangbare parameters van de toolcat applicatie catcv zijn hier geldig. Voorbeeld : keepalone=HSECTION

Generic Url

Dit is een generieke methode om data op te halen via een generiek opgebouwde url.
Parameter 1:
geef het eerste deel van het frame voor de URL waarmee de remote server wordt benaderd, bijv. http://isbndb.com/api/books.xml?access_key=TTCKMH29
Parameter 2:
indien deze string voorkomt in het antwoord, dan wordt dit als een niet succesvolle operatie aanzien. Voorbeeld : total_results="0" .
Guess procedure:
in te vullen naar vermogen van de remote server. Voorbeeld : guessalwaysisbn
Retrieve query placeholders:
geef het deel van de url, dat afhankelijk is van het type zoekstring. Voorbeeld : isbn:&index1=isbn&value1=<nr>
Haal ook de records op, gerelateerd via relatietype:
leeg laten
Analyse procedure:
in te vullen naargelang de remote server. Voorbeeld : analyseamaz
Import parameters:
analoog aan id Brocade. Voorbeeld : profile=myprofile
Bij dubbels : welke records mogen automatisch worden aangemaakt ? :
analoog aan Z3950, en afhankelijk van de mogelijkheden van de externe server, uiteraard.
Bij dubbels : welke records moeten tijdelijk worden bewaard ? :
analoog aan Z3950

Isbndb

Deze methode is geënt op de communicatie met isbndb.org en analoge websites.
Parameter 1:
geef het eerste deel van het frame voor de URL waarmee de remote server wordt benaderd, bijv. http://isbndb.com/api
Parameter 2:
indien ‘yes’, dan worden de details van de uitgever eveneens opgehaald. Opmerking : onderhuids wordt hier een extra url request gezonden.
Parameter 3:
indien ‘short’, dan wordt beperkte informatie opgevraagd. Alle andere waarden leveren uitgebreide informatie op (inclusief annotaties, auteurvermeldingen, editie, impressum,..)
Parameter 5:
trace mode, indien gelijk aan ‘1’.
Wachtwoord:
is vereist, en wordt bekomen na registratie op de website isbndb.org .
Guess procedure:
in te vullen naar vermogen van de remote server. Aanbevolen : guessdefault
Retrieve query placeholders:

geef het deel van de url, dat afhankelijk is van het type zoekstring. Aanbevolen :

  • isbn:&index1=isbn&value1=<nr>
  • isbn13:&index1=isbn&value1=<nr>
Haal ook de records op, gerelateerd via relatietype:
leeg laten
Analyse procedure:
in te vullen naargelang de remote server. Voorbeeld : analyseamazon
Bij dubbels : welke records mogen automatisch worden aangemaakt ? :
analoog aan Z3950, en afhankelijk van de mogelijkheden van de externe server, uiteraard.
Bij dubbels : welke records moeten tijdelijk worden bewaard ? :
analoog aan Z3950
Import parameters:
analoog aan id Brocade. Voorbeeld : profile=myprofile

Web Of Science Article Match Retrieval Service

Deze methode is geënt op de communicatie met een API, aangeboden door Thompson Reuters, tegen betaling.
Parameter 1:
geef de URL waarmee de remote server wordt benaderd, bijv. https://ws.isiknowledge.com/cps/xrpc
Parameter 2:
tcp poort. Voorbeeld : ‘80’
Guess procedure:
vul in : guessalwaysany
Retrieve query placeholders.
Aanbevolen : any:<nr>
Haal ook de records op, gerelateerd via relatietype:
leeg laten
Analyse procedure:
vul in : analysewosarm
Bij dubbels : welke records mogen automatisch worden aangemaakt ? :
heeft hier geen belang. Leeg laten.
Bij dubbels : welke records moeten tijdelijk worden bewaard ? :
leeg laten.
Import parameters:
analoog aan id Brocade. Voorbeeld : profile=myprofile

Opmerking : je kan als zoekstring gebruiken :

  • Een isi nummer, (ook wel UT number genoemd), in te geven zonder prefix. Voorbeeld : 000391162700004 .
  • Een doi nummer, in te geven, voorafgegaan door de prefix doi:. Voorbeeld : doi:10.1016/J.KINT.2016.09.050
  1. Via Brocade ‣ Catalografie - Beheersfuncties ‣ Regelwerken [link] kan bepaald worden welke bronnen je wenst te benaderen. De gewenste bronnen kan je ingeven ter hoogte van het veld Centaur identifiers. De volgorde waarin je de identifiers opneemt is belangrijk. Centaur gaat met het opgegeven ISBN-nummer één voor één de bronnen af. Van zodra één van de bronnen het record kan leveren, stopt Centaur met zoeken. Het eerst gevonden record wordt meteen aan het catalografieformulier overhandigd.
Als je de bron-informatie wijzigt, zijn de wijzigingen pas actief nadat de server opnieuw geboot heeft. Wil je toch onmiddellijk testen met de gewijzigde informatie, voer dan de instructie upython uit vanop de Unix prompt.
  1. Indien U gebruik wenst te maken van de images, die mee via centaur worden gedownload (zoals Amazon), dan moet een URL type centaur aangemaakt worden via de toepassing Brocade ‣ Catalografie - Beheersfuncties ‣ Url types [link]. Belangrijk hierbij zijn volgende parameters:
  • URL-frame http://<server_name>/docman/docman.phtml?file=<value>. Vervang <server_name> door de naam van de server.
  • DOCMAN-dienst: vul in centaur
  1. Bij gebruik van Centaur maakt Brocade connectie naar andere servers. Bij Z39.50 geschiedt die connectie vaak via specifieke niet-standaard poorten. Controleer de lokale firewall settings om na te gaan of connectie via die niet-standaardpoorten mogelijk is.

7.4. Voetnoot : al of niet automatisch aanmaken van catalografische records.

De twee parameters, die hier een rol spelen, vind je in het meta formulier van de centaur id:

  • Bij dubbels : welke records mogen automatisch worden aangemaakt ? A
  • Bij dubbels : welke records moeten tijdelijk worden bewaard ? T

Laat ons deze A en T noemen.

Voorbeeld 1:

A=1 T=leeg

Indien de centaur actie 1 record oplevert, wordt dit automatisch aangemaakt.
Indien de centaur actie meer dan 1 record oplevert, wordt het eerste in de
rij automatisch aangemaakt.

Voorbeeld 2 :

=1 T=2-5

Indien de centaur actie 1 record oplevert, wordt dit automatisch aangemaakt.
Indien de centaur actie meer dan 1 record oplevert, wordt het eerste in
de rij automatisch aangemaakt, en de volgende 4 verschijnen in een keuzelijst.

Voorbeeld 3 : (en nu wordt het interessant)

A=1 T=1-5

Indien de centaur actie 1 record oplevert, wordt dit automatisch aangemaakt.
Indien de centaur actie meer dan 1 record oplevert, wordt geen enkel record
automatisch aangemaakt, en verschijnen de eerste 5 records in een keuzelijst.

Voorbeeld 4 : (voor de puristen)

A=1,2 T=1-5

Indien de centaur actie 1 record oplevert, wordt dit automatisch aangemaakt.
Indien de centaur actie precies 2 records oplevert, worden deze automatisch
aangemaakt. Indien de centaur actie meer dan 2 records oplevert, wordt geen
enkel record automatisch aangemaakt, en verschijnen
de eerste 5 records in een keuzelijst.

7.5. Praktische werking

Als de parameters correct werden ingevuld, kan je Centaur in de catalografie gaan gebruiken. Ga als volgt te werk:

  • Ga naar het startscherm van de catalografie
  • In het veld Bewerk een record geef je een opzoekbaar bibliografisch nummer op (ISBN, met of zonder streepjes, ISSN, EAN, Vlacc nr,..). Het hangt uiteraard af van de externe databank, welke nummers gebruikt kunnen worden.
  • Kies in de selectbox in welke centaur bron je wenst te zoeken. Kies eventueel ‘alle’.
  • Vink de optie Nieuw record aan
  • Klik op Registreer.
  • Brocade loopt met het opgegeven nummer de gekozen Centaur-bron(s) (één voor één) af. Van zodra één van de bronnen het record kan leveren, stopt Centaur met zoeken. Het gevonden record wordt on-the-fly geconverteerd naar een Brocade catalografieformulier. De catalograaf kan nu het record desgewenst vervolledigen en corrigeren. In het veld Informatie voor titelbeschrijvers wordt een annotatie geplaatst, die datum en bron van download vermeld, bijv. Download from 'oxford' (2004-09-13T09:37:41.307793).