Google kan tellen!

Bovenstaande tabel komt uit het laatste rapport van OCLC Research over de mogelijkheden het bewaarbeleid voor boeken in Noord-Amerika op een regionale schaal te organiseren. Mij gaat het om het getal 128.1 (miljoen) in deze tabel. Dat is namelijk het getal waarmee OCLC-onderzoekers op dit moment werken als het aantal unieke gedrukte boeken in de wereldwijde collectie, op basis van de grootste beschikbare catalogus, WorldCat. Zij houden uiteraard, als goede onderzoekers, daarbij een aantal slagen om de arm, zoals:

An important caveat to note in regard to table 1, as well as other results presented in this report, is that they reflect institutional collections as they are cataloged and represented in WorldCat. The accuracy of holdings data in WorldCat may be lessened by the presence of duplicate records, cataloging errors, incomplete registration of collections, and other sources of inconsistency.

Maar toch. Die 128.1 miljoen ligt nog geen 2 miljoen van de 129.8 miljoen waarmee Google twee jaar geleden naar buiten kwam. Dat is dus blijkbaar toch de orde van grootte waar we aan moeten denken voor de omvang van het gedrukte boeken-universum.

Vervolgens leidt bovenstaande tabel tot nog wat andere sommetjes. Van die 128 miljoen verschillende boeken zijn er gemiddeld per titel wereldwijd 10 exemplaren in bibliotheken beschikbaar; gemiddeld, want dat kan natuurlijk variëren van één uniek exemplaar tot (tien)duizenden exemplaren. En van die 128 miljoen verschillende boeken (lees: titels) zijn er ‘slechts’ 41 miljoen beschikbaar in Amerikaanse bibliotheken, zeg een/derde. Qua holdings ligt dat heel anders. Dan nemen die Amerikaanse bibliotheken met 840 miljoen exemplaren van de 1.238 miljoen geregistreerde opeens twee/derde van het wereldwijde boekenbezit voor hun rekening. Stel nu dat Google inderdaad inmiddels zo’n 20 miljoen titels, voornamelijk van die Amerikaanse bibliotheken, heeft gedigitaliseerd, dan is dat (opnieuw ‘slechts’) een/zesde van de opdracht waarvoor ze zich stelden toen ze besloten alle gedrukte informatie te digitaliseren. Het moment dat “alles” gedigitaliseerd is en dat alle gedrukte informatie in digitale vorm te raadplegen is ligt dus echt nog wel even een flink aantal jaren voor ons. David Bell verwacht, in een heel lezenswaardig artikel, dat The Bookless Library over zo’n twintig jaar een realiteit zal zijn. Om dat doel te realiseren zal Google echter nog flink aan moeten poten en moeten in ieder geval de huidige juridische problemen rond het digitaliseren van auteursrechtelijk beschermde werken overwonnen worden.

No comments yet

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s

%d bloggers op de volgende wijze: