Archive for the ‘WorldCat’ Tag

TWIT #13

TWIT

What’s in a Number?

WereldKat

Enkele dagen geleden was het zo ver: OCLC registreerde in WorldCat de 2 miljardste holding omdat de University of Alberta Libraries in Edmonton (Canada) een e-book aan haar collectie toevoegde. Het bereiken van deze mijlpaal ging, zoals in de Anglo-Amerikaanse wereld niet geheel ongebruikelijk, met de nodige pompeuze uitspraken gepaard. Zo verklaarde de directeur van de University of Alberta Libraries: “University of Alberta is very proud of its longstanding association with WorldCat‚Äôs global community, so its library team is naturally thrilled to be lucky enough to share in OCLC’s astonishing achievement.” Ja, ja.

Maar wat moeten we nu van zo’n geval vinden? ’t Is maar hoe je er naar kijkt. Twee miljard holdings, dat is net geen holding per drie wereldburgers. Big deal! En wat is zo’n holding precies in het digitale tijdperk? Als een bibliotheek in het kader van een PDA-programma een groot aantal titels van e-books in haar catalogus laadt, zijn dat dan ‘holdings’ die door WorldCat geregistreerd worden? Die bibliotheek bezit die boeken (nog) niet, biedt er in eerste instantie alleen maar toegang toe, maar is dat nu een ‘holding’? Wie het weet, mag het zeggen.

Nog een andere invalshoek, uitgaande van de door Google berekende totale omvang van het (gedrukte) boekenuniversum van 129 miljoen titels. Twee miljard holdings vertalen zich dan in gemiddeld een kleine 16 exemplaren van elke titel. Maar dat gemiddelde is uiteraard gebaseerd op alle variaties tussen echt unieke of slechts enkele exemplaren van een bepaalde titel en het boek dat wereldwijd de breedste verspreiding in bibliotheken kent. Welk boek dat is? De bijbel natuurlijk! Althans, dat was in 2005 volgens OCLC zo. Maar toen omvatte WorldCat ‘slechts’ 1 miljard holdings en het is dus zeer de vraag (of juist niet?) dat met de verdubbeling van het aantal holdings sindsdien dat nog steeds zo is. Hoog tijd dus voor OCLC om eens een update te geven van die Top 1000 lijst.

WatchWorldCatGrow

Ondertussen groeit WorldCat (hard) door. Vier dag na het bereiken van de mijlpaal van 2 miljard zijn we al weer een miljoen holdings verder.

In het Nederlandse GGC gaat dat allemaal een stuk langzamer. Maar als de techniek mee wil werken kun je ook het GGC live zien groeien:

WatchGGCGrow

Google kan tellen!

Bovenstaande tabel komt uit het laatste rapport van OCLC Research over de mogelijkheden het bewaarbeleid voor boeken in Noord-Amerika op een regionale schaal te organiseren. Mij gaat het om het getal 128.1 (miljoen) in deze tabel. Dat is namelijk het getal waarmee OCLC-onderzoekers op dit moment werken als het aantal unieke gedrukte boeken in de wereldwijde collectie, op basis van de grootste beschikbare catalogus, WorldCat. Zij houden uiteraard, als goede onderzoekers, daarbij een aantal slagen om de arm, zoals:

An important caveat to note in regard to table 1, as well as other results presented in this report, is that they reflect institutional collections as they are cataloged and represented in WorldCat. The accuracy of holdings data in WorldCat may be lessened by the presence of duplicate records, cataloging errors, incomplete registration of collections, and other sources of inconsistency.

Maar toch. Die 128.1 miljoen ligt nog geen 2 miljoen van de 129.8 miljoen waarmee Google twee jaar geleden naar buiten kwam. Dat is dus blijkbaar toch de orde van grootte waar we aan moeten denken voor de omvang van het gedrukte boeken-universum.

Vervolgens leidt bovenstaande tabel tot nog wat andere sommetjes. Van die 128 miljoen verschillende boeken zijn er gemiddeld per titel wereldwijd 10 exemplaren in bibliotheken beschikbaar; gemiddeld, want dat kan natuurlijk vari√ęren van √©√©n uniek exemplaar tot (tien)duizenden exemplaren. En van die 128 miljoen verschillende boeken (lees: titels) zijn er ‘slechts’ 41 miljoen beschikbaar in Amerikaanse bibliotheken, zeg een/derde. Qua holdings ligt dat heel anders. Dan nemen die Amerikaanse bibliotheken met 840 miljoen exemplaren van de 1.238 miljoen geregistreerde opeens twee/derde van het wereldwijde boekenbezit voor hun rekening. Stel nu dat Google inderdaad inmiddels zo’n 20 miljoen titels, voornamelijk van die Amerikaanse bibliotheken, heeft gedigitaliseerd, dan is dat (opnieuw ‘slechts’) een/zesde van de opdracht waarvoor ze zich stelden toen ze besloten alle gedrukte informatie te digitaliseren. Het moment dat “alles” gedigitaliseerd is en dat alle gedrukte informatie in digitale vorm te raadplegen is ligt dus echt nog wel even een flink aantal jaren voor ons. David Bell verwacht, in een heel lezenswaardig artikel, dat The Bookless Library over zo’n twintig jaar een realiteit zal zijn. Om dat doel te realiseren zal Google echter nog flink aan moeten poten en moeten in ieder geval de huidige juridische problemen rond het digitaliseren van auteursrechtelijk beschermde werken overwonnen worden.

Weekoogst #36

Kleine broer
Ten opzichte van grote broer WorldCat is het Nederlandse GGC natuurlijk maar een kleintje. Maar toch. In 2010 is de grens van 16 miljoen titels in het GGC gepasseerd waarvan gemiddeld bijna 2,5  exemplaren per titel aanwezig zijn bij de GGC-bibliotheken (ruwweg de UBs, speciale wetenschappelijke bibliotheken, de hogeschoolbibliotheken en de Plusbibliotheken). Het merendeel van deze publicaties is in het Engels (bijna eenderde), met Nederlandstalige titels als goede tweede met een kwart van het totaal. Het GGC zien groeien? (zelfs op Tweede Kerstdag!) Klik hier. Het aantal exemplaren staat op het moment van schrijven op 38.553.980.

Leuk speeltje
De eigenaar van WorldCat, OCLC, heeft een onderzoeksafdeling die met enige regelmaat experimentele applicaties aflevert, die de ene keer wel en de andere keer niet tot een volwaardige dienst leiden. MapFAST is weer een nieuw voorbeeld van een leuke, maar ook nuttige, toepassing van Google Maps data enerzijds en geografische descriptoren uit WorldCat anderzijds. Zoek een bepaalde geografische locatie op, die wordt onmiddellijk op Google Maps geprojecteerd inclusief de omliggende geografische descriptoren en de mogelijkheid meteen een zoekactie in WorldCat of Google Books uit te voeren. 

Hijgerig
ScienceGuide, het nieuwsplatform voor de kennissector, presenteerde vlak voor Kerst de resultaten van onderzoek naar het gebruik van sociale media door hogeronderwijs-instellingen. Nederland lijkt daarin geen beste beurt te maken. Ondanks dat we inmiddels op Twitter ons mannetje blijken te staan (een derde plaats in Europa wat betreft het aantal volgers), blijken we op Facebook de boot geheel te missen terwijl aanwezigheid daar “juist om wereldwijd jong talent te trekken en te binden¬†(…) een actieve en hoogwaardige presentie daar inmiddels essentieel” is. Volgens wie dat laatste overigens zo is, wordt nergens aangegeven.

Het hele artikel heeft een nogal hijgerige en ongenuanceerde toon. Instellingen die de euvele moed hebben nog geen Facebook-account te hebben en/of te Twitteren worden simpel weggezet als dinosauri√ęrs, terwijl instellingen die puur op de omvang van hun aantal volgers of vrienden boven komen drijven boven elke twijfel verheven zijn. Hoe de sociale media worden ingezet lijkt er niet toe te doen, als je het maar doet. Soms zou ik ook over een dergelijk simpel wereldbeeld willen beschikken.

Weekoogst #32

Van die dingen
Afgelopen week organiseerde de afdeling Hogeschool Bibliotheken van de NVB een idee√ęnmarkt onder de titel Na 23 dingen. Elke zichzelf respecterende bibliotheek heeft in de afgelopen jaren wel op een of andere manier met het eigen personeel deze onderdompeling in web 2.0-toepassingen ondergaan, maar wat beklijft daar nu van? Welke ‘dingen’ worden toepassingen die in de dienstverlening en de ondersteuning van onderwijs en onderzoek daadwerkelijk en effectief worden ge√Įntegreerd? Lees hier het verslag van HB-bestuurslid Raymond Snijders.

Is er toekomst voor de UP?
Universitaire uitgeverijen, we kennen er niet zo veel in Nederland (meer). De AUP natuurlijk, en de LUP, ¬†maar in vergelijking met andere landen is dat toch uitermate bescheiden. De toekomst van die universitaire uitgeverijen is ook nog eens uiterst onzeker, want hun traditionele afnemers (de UBs) hebben geen geld meer om prijzige monografie√ęn te kopen en hun moederinstellingen, de universiteiten zelf, zien vaak geen brood meer in dit ‘speeltje’. Over die onzekere toekomst is het gehele laatste nummer van het Journal of Electronic Publishing volgeschreven, en niet door de minste auteurs. Paul Courant, Clyfford Lynch en Joe Esposito leveren bijvoorbeeld een bijdrage. In die van Lynch kun je zonder grote problemen de contouren van OAPEN terugvinden.

Spectaculair
Je hoort en leest wel steeds over de zoveelste inleesoperatie in WorldCat en de groei die daarmee gegenereerd wordt. Onderstaand diagram uit het nieuwe jaarverslag van OCLC maakt het allemaal nog eens inzichtelijk: de groei is echt spectaculair.

Weekoogst #7

Wat wil de wetenschapper?
Twee rapporten trokken deze week op veel plekken de aandacht. In de eerste plaats het vierde rapport in deze eeuw van de Amerikaanse onderzoeksorganisatie Ithaka S+R¬†naar de mening van Amerikaanse wetenschappers over de wetenschappelijke informatievoorziening, de rol van bibliotheken en zaken als institutionele repositories en open access. Door de verschuivingen die over het afgelopen decennium nu te signaleren vallen een meer dan interessant rapport. Het andere rapport betreft een samenvatting door mensen van OCLC van een twaalftal gebruikersonderzoeken uit de afgelopen vijf jaar. Een flink aantal daarvan is de afgelopen twee jaar hier de revue gepasseerd, maar deze overzichtsstudie biedt meerwaarde omdat zowel overeenkomsten in de eindresultaten worden benoemd als verschillen. “This report is not intended to be the definitive work on user behaviour studies, but rather to provide a synthesized document to make it easier for information professionals to better understand the information-seeking behaviours of the libraries‚Äô intended users and to review the issues associated with the development of information services and systems that will best meet these users‚Äô needs.”

In Google We Trust
Ik heb er even over lopen twijfelen: is het nu een 1 aprilgrap of is Google dit keer wel serieus? Ik houd het maar op het laatste. En dus is het mooi dat Google beurzen beschikbaar gaat stellen voor onderzoek op basis van alle data in de Google Book Search database. Geen vrije competitie, maar alleen voor medewerkers van de bij GBS betrokken instellingen. Blijkbaar, want officieel schijnen er nog geen mededelingen over gedaan te zijn. Transparantie, het is nog steeds niet het sterkste punt van Google.

Week van de iPad
Het begon afgelopen weekend met de eerste offici√ęle verkoopcijfers: vari√ęrend van 300.000 tot 600.000 in de eerste twee dagen. Maar de concurrentie ligt op de loer: van de WePad (mooi gevonden!) tot Microsofts Courier. De hype rond de iPad heeft ook weer tot veel speculatie geleid over de toekomst van de e-reader. We worden geadviseerd nu in te stappen in aandelen want in 2020 zullen er wel 440 miljoen readers over de toonbank gaan. Gelukkig zijn er ook nog steeds vanuit de industrie zelf wat realistischer geluiden: een e-reader op basis van e-ink met kleurengebruik zal mogelijk in 2020 tot de realiteit behoren. Mogelijk.

WorldCat
Ik heb het hier wel vaker over WorldCat gehad, de catalogus die steeds beter de pretentie van een wereldcatalogus aan het waarmaken is. De snelheid waarmee dat gebeurt valt goed af te lezen uit de Watch WorldCat Grow-website. Kijk er maar eens een minuutje naar en de kans is groot dat het aantal geregistreerde holdings in die periode met een paar honderd gestegen is. Inmiddels zitten we al ruim boven de anderhalf miljard geregistreerde publicaties. En heeft OCLC nu ook besloten MARC-records van digitale boeken uit Google Book Search en van de HathiTrust in WorldCat te gaan opnemen.

WorldCat, steeds leuker

WorldCat is zich niet alleen in een sneltreinvaart aan ’t ontwikkelen naar een echte wereldcatalogus, WorldCat biedt ook steeds meer extra functionaliteit die tot voor kort slechts voorbehouden was aan lokale catalogi. Nu is er weer een nieuwigheidje waar, zo is althans de Amsterdamse ervaring onder de geesteswetenschappers, altijd veel interesse voor is: actuele aanwinstenlijsten. Wil je weten welke publicaties er in de afgelopen maand aan de collectie van een bepaalde bibliotheek zijn toegevoegd, dan ga je in WorldCat naar de profielpagina van die bibliotheek toe en krijg je onmiddellijk een lijst gepresenteerd van titels die door deze bibliotheek in de afgelopen maand in de collectie zijn opgenomen. Uiteraard kun je je via rss verzekeren van maandelijkse attendering.

Natuurlijk laat een dergelijke dienst nog een aantal zaken te wensen over. Zo zijn de meeste gebruikers niet ge√Įnteresseerd in een overzicht van alle aanwinsten, maar willen ze vooral de aanwinsten voor hun eigen vakgebied zien. Dat kan nu nog niet, maar gaat ongetwijfeld binnenkort volgen. Verder is het overzicht nu nog beperkt tot 500 titels. Als je op vakgebied kunt selecteren, is dat voldoende maar een gemiddelde universiteitsbibliotheek voegt maandelijks veel meer titels aan haar collectie toe dus voor een totaaloverzicht voldoet dat maximum niet. En dus het verzoek aan WorldCat om enerzijds dat maximum op te hogen (voor de veellezers) en anderzijds een sorteringsmogelijkheid op LCC- of DDC-code te maken (voor de vakspecialisten). Zou niet veel moeite moeten kosten.

En OCLC ook! (?)

Nog zo’n kwestie die de afgelopen dagen veel de aandacht trok, en terecht: het nieuwe beleid van OCLC ten aanzien van het (her)gebruik van data uit WorldCat. Dat nieuwe beleid zal er al heel lang aan te komen, al was het alleen maar omdat de vigerende voorwaarden dateerden uit 1987, toen er van WorldCat alleen nog maar gedroomd kon worden. Met het publiceren van de nieuwe voorwaarden ging het een en ander op het allerlaatste moment mis, maar de nieuwe Policy for Use and Transfer of WorldCat Records is nu beschikbaar en zal vanaf februari volgend jaar van kracht worden.

Essentieel in de nieuwe Policy lijkt de herbevestiging van OCLCs eigendom van alle catalogusrecords in WorldCat en een half-open benadering t.a.v. hergebruikvan deze records door derden. In de FAQ wordt dat laatste alsvolgt geformuleerd:

Are all WorldCat records available freely to anyone wanting to use them?
OCLC member libraries have spent nearly 40 years supporting and contributing to WorldCat and the OCLC cooperative. With over 100 million records and over one billion holdings, WorldCat is the backbone of the cooperative and the services used by the membership. It is not economically feasible to maintain and expand WorldCat, its surrounding services and the cooperative on a completely open model. The Policy was updated to bridge the gap between open and closed models by permitting Use and Transfer of WorldCat records by OCLC Members and Non-Members for Non-Commercial, Reasonable Use. See the Policy for definitions of these terms (Section B).

Ook OCLC voelt de hete adem van de Googles en LibraryThings van deze wereld in de nek. En ook hier is de vraag: wat zijn de consequenties precies voor bibliotheken en hun gebruikers? In Nederland speelt deze discussie al enige tijd t.a.v. het eigendom van de records in de NCC, eerst met Pica en nu met OCLC. Alle NCC-records en -holdings zijn twee jaar geleden in WorldCat ingelezen. Wat zijn nu precies de consequenties van het nieuwe beleid van OCLC voor de NCC? Ik vrees dat ik daar nu even geen antwoord op weet te geven…

Driekwart World – Cat

Drie jaar geleden bleek dat uit een steekproef van 508 titels uit de National Union Catalog Pre-1956 Imprints 28% van deze titels niet in OCLCs WorldCat aanwezig waren. De National Union Catalog (of NUC of Mansell) werd tussen 1968 en 1981 samengesteld op basis van de kaartcatalogi van ruim 1.100 bibliotheken in de VS en Canada, waaronder de Library of Congress. De gedrukte NUC bestaat uit maar liefst 754 delen, zeg maar 40 meter boekenplank. Legers bibliografen en catalografen hebben de NUC jarenlang geraadpleegd voor bibliografische verificatie, maar met de opkomst van digitale instrumenten als WorldCat is het gebruik drastisch verminderd. Niet geheel terecht dus, althans in 2005, want toen zat er dus nog een flink gat voor pre-1956 imprints tussen NUC en WorldCat.

Twee jaar geleden nam OCLC de Research Libraries Group over, eigenaar van de andere grote online bibliografische database RLIN, en begon men al snel met de integratie van RLIN-records in WorldCat. Heeft dat er nu toe geleid dat de dekking van WorldCat ten opzichte van de NUC is verbeterd? Nee, constateert Christine DeZelar in een artikel in het september-nummer van College & Research Libraries. Door de integratie van RLIN is het ‘gat’ wel iets kleiner geworden, maar ook van haar steekproef van 502 titels uit de NUC¬†bleek ruim 25% (nog) niet terug te vinden in WorldCat. DeZelar bevestigt daarmee niet alleen de resultaten van het onderzoek uit 2005, zij herbevestigt (althans in haar eigen woorden) de cruciale rol van “old fashioned” book catalogs voor de originele catalogisering van minder gangbaar materiaal.

En ze voegt daar nog de wijze raad aan toe: “A library with a large uncataloged backlog of rare, special collections or gift materials may want to think twice before deaccessioning Mansell, as tempting as the freeing up of shelf space might be.”

WorldCat Identities

Lorcan Dempsey heeft vorige week op zijn weblog de WorldCat Identities van de vier (vice-) presidenti√ęle kandidaten van de VS opgenomen. Duidelijk wordt dat Sarah Palin inderdaad echt nog een groentje is (5 publicaties met 6 holdings) vergeleken met de andere drie. Barack Obama scoort ondanks zijn jeugdige leeftijd qua aantallen het hoogst met 87 publicaties met wereldwijd, althans volgens de gegevens in WorldCat, bijna 33.000 holdings. Deze cijfers vallen overigens weer in het niet¬†bij die van illustere voorgangers als Bill Clinton¬†en Richard Nixon.

Meteen maar even mijn eigen WorldCat Identity opgezocht; ik blijk nummer lccn-n86-95291 te zijn. Volgens WorldCat staan er 6 publicaties in twee talen (Nederlands en Engels) op mijn naam¬†die gezamenlijk goed zijn voor 85 holdings. Palin versla ik dus in ieder geval. Alhoewel, als ik de gepresenteerde gegevens wat nauwkeuriger bekijk blijkt er √©√©n boek vermeld te worden “about Bert Zeeman” terwijl ik daarvan alleen maar de bewerker ben; wordt er √©√©n publicatie tweemaal¬†apart opgevoerd en wordt er √©√©n publicatie als boek gepresenteerd terwijl het toch echt alleen maar een tijdschriftartikel was. Geen wonder dat deze publicatie in geen enkele bibliotheek ter wereld aanwezig blijkt te zijn (althans, als zelfstandige publicatie; wel uiteraard in de gebonden jaargang, we hebben het hier over 1990!, van het tijdschrift). Gelukkig biedt de gelinkte Library of Congress Authority File wel correcte informatie over mijn geboortedatum en huidige werkkring: specialist in hist. and politics, Univ.-bibliotheek, Univ. van Amsterdam. Leuk speeltje, maar¬†nog niet 100% betrouwbaar. Er is dus nog hoop voor Palin.