Fact checking (2): Google Books

Google BooksGoogle Books viert deze maand haar achtste verjaardag, en de wereld was nooit meer dezelfde. Lees het laatste rapport van Ithaka SR over de actuele onderzoekspraktijk van historici: Google Books Rules. Maar hoe vér is Google nu met het realiseren van haar ambitie om alle gedrukte informatie ooit geproduceerd te digitaliseren? Het laatste WTR-rapport De bakens verzetten is daar, in navolging van het in het afgelopen jaar veel bediscussieerde Redefining the Academic Library, heel duidelijk over:

“Om maar één voorbeeld te noemen: de Universiteit van Michigan schatte duizend (!) jaar nodig te hebben om zijn collectie van zeven miljoen boeken te digitaliseren. Google kreeg dit voor elkaar in slechts zes jaar.”

Maar is Google in Michigan inderdaad al helemaal klaar met digitaliseren? Het antwoord is luid en duidelijk: nee! De bron daarvoor: Michigans eigen John Paul Wilkin die in een gesprek met Dan Cohen liet weten dat op dit moment (december 2012) ruim 70% van Michigans collectie gedigitaliseerd is (en zo’n 80% van de boeken die in het publieke domein vallen). Dat komt aardig overeen met de aantallen publicaties van Michigan in de HathiTrust. Dat zijn er volgens de laatste statistieken al ruim 4.6 miljoen. Ruim drie jaar geleden passeerde Michigan het half-way mark van 3 miljoen, dus uitgaande van het huidige tempo zal het toch zeker nog een jaar of 4 à 5 duren voordat Google écht klaar is in Michigan. Goed, ik moet toegeven dat de totale digitaliseringsperiode van zo’n 12 jaar natuurlijk nog steeds een geweldige prestatie is ten opzichte van die geschatte 1000 jaar, maar zes jaar en al klaar zijn is dus wel heel erg kort door de bocht geformuleerd.

Andere recente berichten over Google Books sluiten daar naadloos bij aan: het is al weer een aantal jaren geleden dat Google meldde overeenkomsten met twee Italiaanse bibliotheken afgesloten te hebben om hun collecties (voor zover in het publieke domein) te digitaliseren. Deze maand is men eindelijk daadwerkelijk begonnen in Rome en volgende maand in Florence. Dat gebeurt waarschijnlijk in dezelfde scanfaciliteit in Italië waar ook de boeken van onze eigen Koninklijke Bibliotheek gedigitaliseerd worden. Ook in de VS komen nu pas bibliotheken aan de beurt waar al lang geleden overeenkomsten mee zijn afgesloten, zoals nu die van Ohio State University. Google kan inmiddels selectiever zijn: men digitaliseert niet meer volledige collecties (met alle dupliceringen van dien) maar presenteert de deelnemende bibliotheken met een lijst van te digitaliseren werken. Overigens verwacht men ook in Ohio pas over een paar jaar klaar te zijn. Er is nog even te gaan…😉

Utopia

2 comments so far

  1. ingmar on

    Hee, worden de KB-boeken in Italië gescand? I
    k meende dat de boeken in Duitsland gescand worden. Zie bijvoorbeeld https://docs.google.com/document/d/1sbCXG52uDw2je3HBSnwU-SIde6d_knZM2Zd7moJKM8E

    • zeemanspraat on

      Ja, informatie van Matthijs van Otegem van de KB zelf. Ik zal proberen ’t nog een keer bi hem zelf te checken.


Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s

%d bloggers op de volgende wijze: