Archive for the ‘metadata’ Tag
TWIT #36
Filed under: beleid, Digitale Bibliotheek, geesteswetenschappen, het vak | Tags: bewaarbeleid, bibliotheken, British Museum, catalogiseren, digital humanities, digitale hulpmiddelen, Google, LIS, metadata, monografieën, muziek, Open Access, plagiaat, Science in Transition, website, Wikipedia, Wilma van Wezenbeek

Is Google's #knowledgegraph killing Wikipedia's readership? @AndrewOrlowski @TheRegister http://t.co/mL401Vnx1j
— CILIP (@CILIPinfo) January 13, 2014
New Blog Post: Is it time for a PLoLIS?: What exactly is a PLoLIS? With apologies to PLoS, the Public Library … http://t.co/mnzm85QqPn
— taiga-forum (@taiga4um) January 13, 2014
Leaderboard – website response times of the Uni Libraries of the Big Ten http://t.co/5CTu7UUnqI via @codyh
— lorcan dempsey (@lorcanD) January 13, 2014
#THATCampDH Terwijl zaal nog napraat, staat verslag al online. Blog over workshop Digitale Tools: http://t.co/zCyxUQGS73
— Historici.nl (@HistoriciNL) January 14, 2014
😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉
“Anyone who doesn’t love libraries is a complete and utter twit.” (via @NatLibrariesDay) http://t.co/7KvWHggtc5
— CILIP (@CILIPinfo) January 14, 2014
😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉 😉
Happy birthday, @britishmuseum! Love the Google doodle of the Great Court: http://t.co/ARaZddsUny
— Andrew Prescott (@Ajprescott) January 15, 2014
https://twitter.com/EricHennekam/status/423359911938912256
Choices are our common ground, check my blogpost on #openaccess @tudelftlibrary http://t.co/XAkW0xodhJ #yam #in
— Wilma van Wezenbeek (@wvanwezenbeek) January 15, 2014
Magazine Folia van UvA en HvA wijdt serie artikelen aan Science in Transition-debat http://t.co/0I06yqfEIl
— ScienceInTransition (@SciTransit) January 15, 2014
Cataloging and metadata are also what make discovery even remotely possible. Believe me, you'd hate it if all we did was do basic indexing.
— Sean Hannan (@MrDys) January 16, 2014
Open Access Theses and Dissertations Increasingly Used as a Source for Plagiarized Articles http://t.co/ElPm6kuaac via @jeffrey_beall #OA
— Jeffrey Beall (@Jeffrey_Beall) January 16, 2014
Shared Print Monographs: The Question of Scale [blog post] http://t.co/u6PY2NiHkm
— Rick Lugg (@ricklugg) January 16, 2014
https://twitter.com/EricHennekam/status/424104343361830912
TWIT #14
Filed under: beleid, bloggen, Digitale Bibliotheek, het vak | Tags: bloggen, Book Citation Index, datamanagement, discovery tool, e-learning, Google, metadata, Open Access, Summon, Wilfred Rubens, Zenodo

6 month anniversary of final launch of Summon here. No. of search per session is falling per mth.Users finding what they looking for faster?
— Aaron Tay (@aarontay) May 12, 2013
After I finish a blog post I'm not good at being strategic and waiting till a good time of day to publish. Let the hits fall where they may.
— Heather Piwowar (@researchremix) May 12, 2013
Bestel nu met korting mijn boek E-learning. Trends en ontwikkelingen http://t.co/Ela1ZVa7fn
— Wilfred Rubens (@wrubens) May 13, 2013
.@rtennant (and others): everyone who cares about orphan works should support the Embedded Metadata Manifesto http://t.co/SzqBpkGZQL
— Chris Rusbridge (@carusb) May 14, 2013
Good review of the WoS Book citation index from Gorraiz et al. http://t.co/oMjBB6HnxW relevant for the negotiations with Thomson
— WoW!ter (@Wowter) May 14, 2013
Oh wow: Zenodo, open access research data repository, w/ dropbox integration, set up by CERN and OpenAire! http://t.co/R6XMt9HBfI
— Driek Heesakkers (@driekh) May 15, 2013
Google makes search gems, then hides them deep inside, then sees limited usages, then kills its own babies
— Jeroen Bosman (@jeroenbosman) May 16, 2013
Are ‘predatory’ publishers an American export? http://t.co/yeQLIgViQm #openaccess
— Richard Poynder (@RickyPo) May 17, 2013
https://twitter.com/blogpartyned/status/335364414704349184
TWIT #3
Filed under: beleid, Digitale Bibliotheek, het vak | Tags: Aaron Swartz, digitale archivering, metadata, onderzoekers, onderzoeksondersteuning, Open Data, preservering, samenwerking, sociale media, TWIT, twitter

Hoera, ik heb met een tweet 't blog van @UBAbert gehaald! Wedden dat dat 'n nieuwe sport in bibliotheekland wordt? 😉 http://t.co/8i126gyP
— Mariette van Selm (@mvanselm) February 15, 2013
New Article: “Information Handling In Collaborative Research” http://t.co/q5O1mYcx @researchinfonet
— LJ's infoDOCKET (@infodocket) February 15, 2013
Analysis of funder open access policies around the world http://t.co/4lzgOGtl
— Jeroen Bosman (@jeroenbosman) February 16, 2013
Open Research Data Handbook: introduction to process, tools + other areas to make your research data openly available, http://t.co/niTHtpLT
— 3TU.Datacentrum (@3TUDatacentrum) February 18, 2013
Scholarly Communication 101: Improving data literacy @ http://t.co/fAWVq6u7
— Force11.org (@force11rescomm) February 18, 2013
Aaron Swartz and Too-Comfortable Research Libraries | ACRL Tech Connect http://t.co/XF5gA11J
— ALA_TechSource (@ALA_TechSource) February 18, 2013
Bookmarked: Digital Tools for Research – Course Outline: http://t.co/pu1XHK2z
— Jenny Delasalle (@JennyDelasalle) February 19, 2013
Just out: Unlike Us Reader: Social Media Monopolies and Their Alternatives (386 pp) http://t.co/7lBi6n2gDs #research
— Johan Oomen (@johanoomen) February 21, 2013
We expect to have a digital amanuensis for our work – a vision of Clippy that actaully works for a researcher. @CameronNeylon #disc13
— Roger C. Schonfeld (@rschon) February 21, 2013
New Report: ARL and Ithaka S+R Release Findings on #Sustainability of Digitized Special Collections http://t.co/GE00oKUelb #digitization
— LJ's infoDOCKET (@infodocket) February 21, 2013
'higher levels of metadata correlate with higher average sales' Nielson white paper (Jan 2012) on book metadata http://t.co/vM9rtn3T0T
— Constance Malpas (@ConstanceM) February 22, 2013
Weekendvitaminen #1
Filed under: adjunct, beleid, het vak | Tags: big deals, Cambridge, dienstverlening, digitalisering, e-books, JISC, metadata, toekomstverwachtingen, universiteitsbibliotheken

Op het nachtkastje
- VERPLICHTE LEESVOER, schreef Utrechtse collega Jan de Boer afgelopen maandag (in kapitalen), en hij heeft gelijk. Bekijk deze presentatie die is samengesteld voor rectoren van Amerikaanse universiteiten en probeer te bedenken welke slides uit deze versie van de presentatie zijn verwijderd: Redefining the Academic Library: Managing the Migration to Digital Information Services
- Welke rol spelen metadata bij het vinden, selecteren en kopen van e-books, in het bijzonder bij Patron Driven Acquisition? De Britse JISC doet daar momenteel onderzoek naar en heeft nu een tussentijds rapport beschikbaar gesteld. Onderzoeker Ken Chad presenteert de voorlopige onderzoeksresultaten.
- Verschillende UBs in Nederland zijn bezig diensten te ontwikkelen voor digitalisering op verzoek (Digitisation on Demand). Leiden en Amsterdam hebben concrete plannen, Groningen heeft al enige tijd een werkende dienst maar deze lijkt, afgaande op het materiaal in de bijbehorende repository, nog weinig gebruikt te worden. Cambridge University Library gaf deze week een rapport vrij waar geïnteresseerde instellingen hun voordeel mee kunnen doen. Bezint eer ge begint, want de initiële kosten zijn hoog.
- De Big Deal wordt momenteel druk bediscussieerd in allerlei fora, waarbij de discussie zich niet altijd alleen beperkt tot die Big Deals maar zich uitbreidt tot het onderliggende abonnementsmodel. De afgelopen weken leidde dat tot heftige discussies op Liblicense over de levensvatbaarheid van dat abonnementsmodel die Joe Esposito tot een blogpost verleidde over de onverwoestbaarheid van dat model.
Beeld van de week
Ondertussen worstelen alle bibliotheken met hun Big Deals, twijfelen ze of ze die voort moeten zetten, en doen allerlei statistisch onderzoek naar het gebruik van hun pakketten en de individuele tijdschriften binnen die pakketten. Bovenstaand diagram biedt een interessant beeld van de relatieve waarde van de psychologie-tijdschriften die onderdeel uitmaken van grote tijdschriftpakketten. Elsevier komt daar, nogmaals: wat betreft de psychologie-tijdschriften, goed af (lees: is eigenlijk onmisbaar); Taylor & Francis, met veel tijdschriften in de lagere regionen, lijkt het kind van de rekening te worden als er geannuleerd moet worden. Dit soort diagrammen zou ik graag voor meer disciplines willen hebben, met dank aan de California Digital Library en Ivy Anderson. Uitleg over de onderliggende methode is in haar presentatie terug te vinden.
Weekoogst … eehhhhh … #61
Filed under: beleid, Digitale Bibliotheek, het vak | Tags: big deals, ICOLC, kwaliteit, metadata, OCLC, PDA, prijsstijging, Rick Anderson

De laatste aflevering van Weekoogst dateert al weer van precies twee maanden geleden. Kun je dan nog met goed fatsoen een nieuwe Weekoogst presenteren? Natuurlijk! De draad weer opgepakt en op naar aflevering #100.
Focus op big deals
Deze week komen Europese bibliothecarissen in het kader van de Europese tak van de International Coalition of Library Consortia (ICOLC) in Istanbul bijeen. De big deal zal er ongetwijfeld hoog op de agenda staan. De Britse bibliotheken volharden nog steeds in hun harde opstelling tegenover Elsevier en Wiley-Blackwell (geen nieuwe big deal tenzij er prijsdalingen worden doorgevoerd) en ook de Nederlandse universiteitsbibliotheken blijven onverkort vasthouden aan 0% prijsstijging in hun onderhandelingen met Wiley, Springer en Sage.
Richard Poynders The Big Deal: Not Price But Cost biedt een goed overzicht over geschiedenis en achtergrond van de big deal. En de berichten over de te verwachte prijsstijgingen van tijdschriftabonnementen (individuele titels) in 2012 met 4 à 6% (EBSCO) danwel 7 à 9% (LM Information Delivery) geven aan dat alternatieven ook niet al te aantrekkelijk zijn.
Kwaliteit van metadata
In drie jaar tijd is de omvang van OCLC”s WorldCat verdubbeld: van 86 miljoen records in 2007 naar 170 miljoen records in 2010. Dat is vooral gebeurd door het en masse inlezen van metadata records van grote niet-Amerikaanse consortia, zoals de Nederlandse NCC, en nationale bibliotheken. Dat die geweldige groei een aanslag heeft betekend op de kwaliteit van de WorldCat-database wordt duidelijk uit het nieuwe rapport WorldCat Quality. En wil WorldCat ook in de toekomst haar waarde behouden, nadrukkelijk zowel als catalogiseerinstrument als als zoekinstrument voor eindgebruikers), dan moet daar met voorrang iets aan gebeuren. De eindconclusie die OCLC formuleert vind ik opvallend en met het oog op de toekomst ook onvermijdelijk:
It will be neccessary to reinvent OCLC’s long-standing and successful, but English-language-centric approaches to metadata creation and data quality management for the realities of the increasingly multilingual, multinational OCLC cooperative.
Focus op PDA
In het hierboven al aangehaalde EBSCO-rapport wordt ten aanzien van Patron Driven Acquisition opgemerkt dat initiatieven op dit terrein nog steeds relatief beperkt zijn in verhouding tot de beschikbare collectievormingsbudgetten, maar dat de huidige budgetcrisis kan leiden tot een aanzienlijke versnelling van de acceptatie van PDA.
Ook de aandacht in Nederland is groeiende. Jo Han Khouw vat de kernelementen van klantgestuurde aanschaf in een blogpost samen. Jan de Boer vraagt zich af of PDA ons geld gaat besparen (lijkt mee te vallen, of tegen natuurlijk; ’t is maar hoe je er tegenaan kijkt). En dan komt a.s. donderdag een van de grote PDA-propagandisten naar Nederland: op uitnodiging van de NVB-afdelingen HB en WB verzorgt Rick Anderson van de J. Willard Marriott Library van de University of Utah een Meet-the-Expert bijeenkomst die deels aan PDA is gewijd. Hashtag: #rickatnvb
Het spoor bijster…
Filed under: Digitale Bibliotheek, het vak | Tags: betrouwbaarheid, Google Book Search, metadata, Ngram viewer

Het gebeurt me niet zo vaak, maar nu ben ik even het spoor bijster. Google is bezig me geheel op het verkeerde been te zetten. Hoe? Laat ik bij het begin beginnen.
In ons universiteitsblad Folia van deze week poneert KNAW-president (en UvA-hoogleraar) Robbert Dijkgraaf in zijn tweewekelijkse column dat H.G. Wells in 1914 als eerste, en ver voor de eerste kernexplosie in 1945, het begrip ‘atomic bomb’ gebruikte in zijn roman The World Set Free. Of hij dat uit de Oxford English Dictionary heeft gehaald of uit Wikipedia, beide geven dezelfde oorsprong voor het begrip, doet er niet toe; blijkbaar is dit gegeven niet omstreden.
Enter de Ngram viewer, het nieuwste speeltje dat Google op basis van het Google Books project heeft gebouwd en dat op dit moment de mogelijkheid biedt woordgebruik door de eeuwen heen op basis van vijf miljoen gescande boeken te analyseren. Die 5 miljoen is pas een eerste stap; uiteraard zullen in de komende maanden/jaren ook al die andere gescande boeken opgenomen worden in de Ngram viewer.
Snel dus even ‘atomic bomb’ ingevoerd in de viewer (met smoothing op 0 zodat je alleen de echte hits krijgt te zien), ingeperkt tot de publicatiejaren 1900-2000. Dat levert het volgende resultaat op:
Een verwachte piek vlak na 1945, een klein piekje rond 1914 (de publicatie van Wells’ boek), maar hè, ook een piek in de periode 1900-1910. Even de Ngram viewer laten inzoomen op deze periode, met het volgende resultaat:
In 1905 een spike die veel hoger komt dan Wells’ 1914. Eureka: ik heb een nieuwe ontdekking gedaan! Maar dan moet ik natuurlijk wel weten welke auteur en welk boek uit 1905 het betreft. Dus even overgestapt naar de bron voor de viewer, Google Books. Zoeken op “atomic bomb” ingeperkt tot de publicatiejaren 1900-1910. Dat levert 79 zoekresultaten op. Maar, en hier raak ik het spoor al een beetje bijster, het betreft meestentijds titels van tijdschriften of seriewerken waarvan de eerste editie misschien wel tussen 1900 en 1910 is verschenen, maar waar “atomic bomb” pas veel later, in ieder geval na 1945, in is verschenen. Erger, er worden ook titels gepresenteerd die niets met de atoombom te maken hebben (The book of town and wndow gardening uit 1903, Google’s misspelling) maar waarvan de metadata blijkbaar gekoppeld zijn aan een tekst over de atoombom die overduidelijk van na de Tweede Wereldoorlog stamt. Is dit een voorbeeld, of slechts een incident, van de metadata-mess waar Google al eerder van beschuldigd is, maar die (blijkbaar/schijnbaar) onvermijdelijk is bij een project van deze omvang?
Toch nog even verder gezocht, en daar werd ik niet vrolijker van. Eerst ‘atomic bomb’ in de Ngram viewer voor de periode 1800-1900 (met een hoop hits; dit wordt echt revolutionair) en vervolgens in Google Books dezelfde zoekactie, met 303 zoekresultaten. Weer veel tijdschriften en seriewerken met een eerste publicatiejaar vòòr 1900, maar ook opnieuw de koppeling van (Engelstalige) full text waarin ‘atomic bomb’ voorkomt, duidelijk geschreven na de Tweede Wereldoorlog, gekoppeld aan een Franstalige titel À travers la Tunesie uit 1887…
Ik kom tot de volgende twee conclusies:
- de Ngram viewer is (nog) niet betrouwbaar genoeg voor wetenschappelijk onderzoek naar woordgebruik door de eeuwen heen, omdat
- de onderliggende Google Books-database (nog) niet de noodzakelijke kwaliteit heeft op het gebied van OCR en metadatering
Maar misschien ben ik inmiddels wel zodanig het spoor bijster dat deze conclusies ook niet door de feiten ondersteund worden.
Een acroniem teveel
Filed under: Digitale Bibliotheek, het vak | Tags: auteurs, metadata, standaarden

We kennen allemaal (nou ja, bijna allemaal) de DAI. De DAI? Ja, de DAI. De Digital Author Identifier of in goed Nederlands de Digitale Auteur Identifier. Enkele jaren geleden in het kader van het landelijke DARE-project door SURF, OCLC-Pica en de Nederlandse universiteiten opgezet om iedere Nederlandse auteur (onderzoeker) een uniek nummer te geven waardoor enerzijds verschillende schrijfwijzen van een en dezelfde auteursnaam bijelkaar gebracht worden en anderzijds auteurs met dezelfde naam van elkaar onderscheiden kunnen worden. Er zijn slechtere ideeën bedacht.
Maar als je een DAI hebt, waarom is het dan ook nog nodig dat er een ISNI-, VIAF- en ORCID-nummer komt? ISNI, VIAF en ORCID?
- ISNI: International Standard Name Identifier
- VIAF: Virtual International Authority File
- ORCID: Open Researcher and Contributor ID
Meer van hetzelfde? Nee, niet helemaal, maar ik kan me bij dit soort initiatieven toch ook niet helemaal aan de indruk onttrekken dat er misschien niet dubbel werk wordt gedaan, maar dat er toch ook wel op verschillende plekken aan de oplossing van ongeveer hetzelfde probleem wordt gewerkt. Uiteindelijk kunnen de resultaten meestal dan wel weer in de digitale wereld, vaak met enige moeite, aan elkaar geknoopt worden maar je houdt toch het gevoel: met wat meer samenwerking zou er met minder inspanning een beter resultaat geboekt kunnen worden.
Maar goed, misschien zou ik me hier helemaal niet over uit moeten laten. Ik ben tenslotte geen metadata-expert en heb geen enkele achtergrond op het terrein van ontsluitingsmethodieken. Had ik dat wel, dan had ik ongetwijfeld deze poster levensgroot boven m’n bed hangen. Om van te smullen. 😉