80.000.000.000.000 bytes

“There’s an elephant in the library”. Dit motto siert de website van de HathiTrust en was voor mij hét nieuws van de week. De twaalf universiteitsbibliotheken verenigd in het Committee on Institutional Cooperation, de elf campusbibliotheken van de University of California en de UB van Virginia (die andere UVA), allen partners in het Google Book Search programma, zijn overeengekomen gezamenlijk een digitaal archief in te richten voor al hun gedigitaliseerde materiaal, inclusief het door Google gedigitaliseerde deel. Op dit moment betreft dat ruim 2.1 miljoen boeken (waarvan 338.000 in het publieke domein), gezamenlijk goed voor 80 terabyte, oftwel 80.000.000.000.000 bytes.

“Google won’t be around forever,” said John P. Wilkin, an associate university librarian for the University of Michigan at Ann Arbor and executive director of HathiTrust. “This is a commitment to the permanence of the materials,” he said, noting that libraries have been around longer than any technology company has. “We’ve been doing this for a couple of hundred years, and we intend to continue doing it.”

Op zich is dit een prima initiatief dat tegemoet komt aan een van de belangrijkste bezwaren die tot nu toe tegen Google Book Search zijn geformuleerd: kunnen we er wel tot in lengte van jaren zeker van zijn dat we toegang houden tot al die gedigitaliseerde boeken? Wat als Google interesse verliest in dit project of, deze weken al wat minder ondenkbaar dan een paar jaren geleden, wat als Google aan haar eigen ambities ten onder gaat? Prima dus, maar zoals altijd, there’s a catch: weliswaar is er nu één gezamenlijk archief in stand gehouden door bibliotheken (en dus betrouwbaar !?!), maar de toegang tot de afzonderlijke boeken in dat ene archief wordt nog steeds gereguleerd door de afspraken die Google met de afzonderlijke universiteiten heeft gemaakt. Dus boeken uit de collectie van de University of Michagan zijn, ook al zitten ze nu in het gezamenlijke digitale archief, zijn nog steeds alleen maar beschikbaar binnen het University of Michigan-domein. En ook dat verdo-e-mde copyright is nog steeds van toepassing, en dus is er ook via de HathiTrust alleen toegang tot publicaties gepubliceerd voor 1923. En dat betreft vooralsnog ‘slechts’ 16% van het gearchiveerde materiaal.

Dat laatste kan niet genoeg benadrukt worden, ook of misschien wel juist tegenover bezuinigingsbeluste managers en bestuurders. “Alles wordt toch gedigitaliseerd? Wat zeuren jullie toch”. Inderdaad, er wordt veel gedigitaliseerd, en er kan niet genoeg gedigitaliseerd worden. Maar digitalisering staat nog steeds niet gelijk aan publieke toegankelijkheid, zoals Clifford Lynch onlangs in een nieuwe MIT-publicatie over open education nog eens extra benadrukte:

The Limitation of Digitized Libraries

Google’s program to digitize major university libraries at institutions such as Stanford, the University of Michigan, and Oxford has received a great deal of publicity and inspired a great amount of excitement. What is not as broadly understood as it should be is that because of copyright constraints, only the public domain works from these libraries (to a first approximation, those published before 1923) will be available for reading in the foreseeable future. For almost everything else, the user will at best be able to see a couple of sentences (a “snippet”) in response to a search, and then follow links to perhaps purchase a copy of the book or borrow a physical copy from a library (most likely through interlibrary loan).

In both cases, this is almost completely useless in most open education settings, particularly outside the United States. So the digitization of these great research libraries will not, as many assume, make the majority of their contents widely and openly available. There are many other digitization programs underway, such as the work of the Open Content Alliance, but they, too, will be able to offer access to only older, outof-copyright works, or to limited collections of in-copyright works that are being made available online with the specifi c permission of the rights holder (for example, some university press publications, particularly out-of-print ones).

So, while a vast amount of historically interesting source material is going to be available, most monographic scholarship and most textbooks from the last three quarters of the last century will not be publicly available. Huge swaths of the primary documentary evidence of the twentieth century—audio and visual, as well as textual materials—are locked up by copyright and often inaccessible even to students and researchers at our leading universities through their research libraries, as well as to the broader public seeking information on the Web.

No comments yet

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s

%d bloggers op de volgende wijze: