Archive for the ‘statistieken’ Tag

TWIT #13

TWIT

Advertenties

TWIT #12

TWIT

TWIT #11

TWIT

Weekendvitaminen #52

Op het nachtkastje

Beeld van de week

Samenwerkenpost

Meer dan een jaar geleden publiceerde ik de post Ook bewaren is samenwerken, over landelijk overleg over gemeenschappelijk bewaarbeleid van de universiteitsbibliotheken in Nederland. Het aantal raadplegingen van deze specifieke post volgde een vertrouwd patroon: in de eerste paar dagen een flink aantal raadplegingen en daarna af en toe nog eens een kleine oprisping. Met deze post ging het echter anders, bemerkte ik afgelopen week. Deze maand is hij al 3x zo vaak geraadpleegd als in de dagen kort na publicatie en ik heb echt geen flauw benul waarom. Geen extra aandacht voor gevraagd, geen link naar geplaatst, maar opeens deze belangstelling. Raar zoals dat soms toch gaat.

Fact checking (2): Google Books

Google BooksGoogle Books viert deze maand haar achtste verjaardag, en de wereld was nooit meer dezelfde. Lees het laatste rapport van Ithaka SR over de actuele onderzoekspraktijk van historici: Google Books Rules. Maar hoe vér is Google nu met het realiseren van haar ambitie om alle gedrukte informatie ooit geproduceerd te digitaliseren? Het laatste WTR-rapport De bakens verzetten is daar, in navolging van het in het afgelopen jaar veel bediscussieerde Redefining the Academic Library, heel duidelijk over:

“Om maar één voorbeeld te noemen: de Universiteit van Michigan schatte duizend (!) jaar nodig te hebben om zijn collectie van zeven miljoen boeken te digitaliseren. Google kreeg dit voor elkaar in slechts zes jaar.”

Maar is Google in Michigan inderdaad al helemaal klaar met digitaliseren? Het antwoord is luid en duidelijk: nee! De bron daarvoor: Michigans eigen John Paul Wilkin die in een gesprek met Dan Cohen liet weten dat op dit moment (december 2012) ruim 70% van Michigans collectie gedigitaliseerd is (en zo’n 80% van de boeken die in het publieke domein vallen). Dat komt aardig overeen met de aantallen publicaties van Michigan in de HathiTrust. Dat zijn er volgens de laatste statistieken al ruim 4.6 miljoen. Ruim drie jaar geleden passeerde Michigan het half-way mark van 3 miljoen, dus uitgaande van het huidige tempo zal het toch zeker nog een jaar of 4 à 5 duren voordat Google écht klaar is in Michigan. Goed, ik moet toegeven dat de totale digitaliseringsperiode van zo’n 12 jaar natuurlijk nog steeds een geweldige prestatie is ten opzichte van die geschatte 1000 jaar, maar zes jaar en al klaar zijn is dus wel heel erg kort door de bocht geformuleerd.

Andere recente berichten over Google Books sluiten daar naadloos bij aan: het is al weer een aantal jaren geleden dat Google meldde overeenkomsten met twee Italiaanse bibliotheken afgesloten te hebben om hun collecties (voor zover in het publieke domein) te digitaliseren. Deze maand is men eindelijk daadwerkelijk begonnen in Rome en volgende maand in Florence. Dat gebeurt waarschijnlijk in dezelfde scanfaciliteit in Italië waar ook de boeken van onze eigen Koninklijke Bibliotheek gedigitaliseerd worden. Ook in de VS komen nu pas bibliotheken aan de beurt waar al lang geleden overeenkomsten mee zijn afgesloten, zoals nu die van Ohio State University. Google kan inmiddels selectiever zijn: men digitaliseert niet meer volledige collecties (met alle dupliceringen van dien) maar presenteert de deelnemende bibliotheken met een lijst van te digitaliseren werken. Overigens verwacht men ook in Ohio pas over een paar jaar klaar te zijn. Er is nog even te gaan… 😉

Utopia

How to Lie with Statistics

Ik ben jammergenoeg geen statisticus, en al helemaal niet iemand die goed thuis is in statistische onderzoeksmethoden, en dus al snel geïmponeerd door fraaie tabellen, grafieken en daarop gebaseerde ferme conclusies. En dus ‘geloof’ ik waarschijnlijk meer dan gerechtvaardigd is.

Bijvoorbeeld het onderzoek naar Twitter waaruit blijkt dat 0.05% van de twitterati verantwoordelijk is voor 50% van het Twitter-verkeer. En dat bloggers een belangrijke rol spelen in het retweeten en in die zin belangrijke filters zijn voor hun volgers. En dat Twitter eigenlijk helemaal geen sociaal netwerk is, maar gewoon een middel om informatie te delen. Dat laatste is echter niet wetenschappelijk bewezen (maar komt wel overeen met mijn eigen observaties).

Tevens ben ik bereid Phil Davis te geloven dat Open Access-publicaties weliswaar leiden tot meer downloads maar niet per sé tot meer citaties. De verklaring? In mijn woorden samengevat: de citerende gemeente heeft toch al toegang tot de benodigde artikelen. Open Access helpt dus de wetenschap zelf niet vooruit, maar verbreedt alleen de toegang tot wetenschappelijke informatie (wat op zich natuurlijk een nastrevenswaardig doel is). Davis’ onderzoek is (uiteraard) niet onomstreden en hij heeft alle OACA-aanhangers, inclusief Stevan Harnad, al over zich heen gekregen. En op dat moment betreur ik dus dat ik geen statisticus ben, want Davis’ cijfers en onderzoeksmethode zijn toch echt heel overtuigend.

Wow! (?)

The stats helper monkeys at WordPress.com mulled over how this blog did in 2010, and here’s a high level summary of its overall blog health:

Healthy blog!

The Blog-Health-o-Meterâ„¢ reads: Wow.

Crunchy numbers

Featured image

A Boeing 747-400 passenger jet can hold 416 passengers. This blog was viewed about 10,000 times in 2010. That’s about 24 full 747s.

In 2010, there were 166 new posts, growing the total archive of this blog to 425 posts. There were 70 pictures uploaded, taking up a total of 11mb. That’s about 1 pictures per week.

The busiest day of the year was April 19th with 114 views. The most popular post that day was Laatste uren in Madrid.

Where did they come from?

The top referring sites in 2010 were diensten.uba.uva.nl, netvibes.com, google.nl, google.com, and Google Reader.

Some visitors came searching, mostly for ranking, een beetje adjunct, één, zeemanspraat, and een.

Attractions in 2010

These are the posts and pages that got the most views in 2010.

1

Laatste uren in Madrid April 2010
2 comments

2

Ranking chaos September 2010
1 comment

3

Over April 2008

4

Weekoogst #13 May 2010
6 comments

5

Van de leg February 2010
4 comments

© WordPress

Weekoogst #22

Meten is weten
Dat in de Verenigde Staten bibliotheken onder grote financiële druk staan mag genoegzaam bekend zijn. De noodzaak om elke toegewezen dollar te verantwoorden is daardoor groter dan ooit en de Amerikaanse bibliotheekorganisaties maken er dan ook veel werk van hun aangesloten leden instrumenten in handen te geven om die verantwoording naar behoren te doen. Afgelopen week publiceerde de ACRL een lijvig rapport onder de titel The Value of Academic Libraries. A Comprehensive Research Review and Report. Dezelfde dag kwamen de collega’s van de ARL met een nieuwe SPEC Kit over Impact Measures in Research Libraries.

Bookless library
Met enige regelmaat staat het bericht met een grote kop in de krant (of op het scherm): de eerste echte bookless library is nu geopend. Deze week was het ook weer raak. Het gaat volgens het bericht op Inside Higher Ed om de Applied Engineering and Technology Library van de University of Texas in San Antonio. Er staat geen enkel boek in de bibliotheek en de studenten hebben via het draadloos netwerk toegang, althans volgens het bericht, tot 425.000 e-books en 18.000 elektronische tijdschriftartikelen (dat laatste zal wel tijdschriften moeten zijn). Blijkbaar is dat iets nastrevenswaardigs of modern, bookless. Ik moet er voorlopig nog niet aan denken.

Mobiele diensten
Afgelopen week eindelijk weer eens een teken van blogleven van collega Driek. Hij doet verslag van een studiedag in Engeland over mobiele bibliotheekdiensten en sluit die af met de verwijzing naar een blogpost waarin de nodige twijfels over nut en noodzaak van die mobiele diensten worden belicht. In die post ook een verwijzing naar een staafdiagram over de meest gebruikte mobiele diensten waar ook mijn oog deze week al op gevallen was. Waar de mobiele bibliotheekdiensten in passen is nog lang niet duidelijk.

Open Access in Rotterdam
Ik maakte vorige week al melding van de Open Access week die er aan zit te komen. Meestal wordt die week gebruikt voor het formuleren van allerlei ambities m.b.t. het open access publiceren, maar de rector van de Erasmus Universiteit heeft daar niet op willen wachten. Hij greep de opening van het academisch jaar al aan om een nieuwe doelstelling te formuleren: per 1 januari a.s. moeten alle Rotterdamse onderzoekers hun publicaties aanleveren bij het EUR-repository RePub. “Een aanslag op de monopoliepositie van uitgeverijen”, wordt het in het Rotterdamse Erasmus Magazine genoemd. Dat valt nog te bezien. 

De persoonlijke bibliothecaris
We laten onze gebruikers steeds meer zelf doen in de bibliotheek en proberen onze systemen ook zodanig in te richten dat gebruikers geen ondersteuning meer nodig hebben bij het vinden van de informatie voor hun onderwijs en onderzoek. We zijn er nog lang niet, maar we weten welke richting we op willen (na de bookless library de librarianless library?). Daarom vond ik het zo aardig om deze week te lezen dat Drexel University dit studiejaar begonnen is met alle 2.750 eerstejaars studenten een personal librarian toe te wijzen. Een groep van ruim 20 bibliotheekmedewerkers heeft als taak gekregen persoonlijke ondersteuning te bieden uitgaande van de kennis die zij over het curriculum en vakspecifieke informatiebronnen hebben opgebouwd. In de praktijk betekent dat ruim meer dan 100 studenten per bibliotheekmedewerker, en dan hebben we het alleen nog maar over eerstejaars. Desondanks, een sympathiek plan.

Infoinfarct

Hoe snel gaat het nu met web 2.0? Hoeveel blogposts worden er per dag geschreven? (bijna 900.000!) Hoeveel YouTube-filmpjes per uur bekeken? (42 miljoen!) Hoeveel tweets per seconde de wereld ingestuurd? (zo’n 50) Heel snel dus.

Gary’s Social Media Count laat het allemaal in één blik zien. Aangezien het me in de gauwigheid niet lukte Gary’s counter te embedden (WordPress wil dat geloof ik ook niet), geef ik hier maar even alleen de link. En klikken hoor!

Aan informatie geen gebrek, toch?

How to Lie With Numbers?

Gistermiddag was de maandelijkse bijeenkomst met de faculteitsbibliothecarissen. Naast allerlei lopende zaken stond de UKB benchmark van de afgelopen jaren op de agenda. UKB zelf doet een beetje geheimzinnig over die benchmarking; de jaarlijks verzamelde gegevens zitten veilig opgeborgen achter een wachtwoord. Daar is misschien ook wel reden toe. Vanaf het allereerste begin wordt het benchmark-project namelijk geplaagd door onvolledig aangeleverde cijfers, interpretatieverschillen over indicatoren en de totaal verschillende wijze waarop de Nederlandse universiteiten hun financiële huishouding hebben ingericht.

Dat neemt niet weg dat uit al die cijferverzamelarij toch ook de nodige nuttige gegevens gedestilleerd kunnen worden. Zo blijkt de UvA bovengemiddeld bij te dragen aan het landelijke IBL van boeken (het lot van het laagste nummer in de NCC?) en wordt er in Amsterdam veel meer uitgeleend dan elders (ook niet echt een wonder gegeven de omvang van de collectie). Maar er blijkt ook uit de benchmark-gegevens dat er in Amsterdam benedengemiddeld gebruik gemaakt wordt van Web of Science en dat ook het aantal downloads uit ScienceDirect lager licht dan bij vergelijkbare instellingen. Daarvoor een verklaring geven is al weer wat moeilijker. Aan de omvang van de Amsterdamse doelgroep en de inrichting van de Digitale Bibliotheek kan het toch niet liggen.

Waar de cijfers met name hun waarde bewijzen is in de trends door de jaren heen en de mogelijkheid wijzigingen in beleid daarin te onderkennen. Zo scoorde de UvA in het begin van de benchmark slecht op het punt van de snelheid van boekverwerking. Door in te grijpen in dat proces is daar in de afgelopen jaren een aanzienlijke versnelling in gerealiseerd die zich nu ook in de benchmark vertaalt in betere scores op dit punt. De boekverwerking in Amsterdam behoort inmiddels tot de snelste onder de UKB-bibliotheken.

Dat dat toch ook weer ‘nadelen’  heeft bleek vanmiddag nog toen ik mijn eigen cijfers over 2008 aan het verzamelen en analyseren was. Snelle boekverwerking betekent bijvoorbeeld dat er minder ‘geprofiteerd’ kan worden van catalogisering elders in den lande. Voor de gemeenschappelijke onderwerpsontsluiting betekent dat dat er bij geesteswetenschappen maar voor 30% van onze actuele aanschaf (op jaarbasis zo’n 5.000 titels) al onderwerpsgegevens in de GGC aanwezig zijn. Zeventig procent van het aangeschafte materiaal (ruim 11.000 titels) moet dus door onszelf van onderwerpsgegevens voorzien worden, en dat vereist een behoorlijke inzet van vakspecialisten. Maar goed, daar profiteren onze collega’s elders dan weer van.