Een olifant ontleed

Wat is de totale omvang van de boekenproductie wereldwijd door de eeuwen? Welk percentage van die boeken valt inmiddels in het publieke domein, welk percentage is zeker nog auteursrechtelijk beschermd en wat is de omvang van de verzameling boeken waarvan we veronderstellen dat ze nog auteursrechtelijk beschermd zijn maar weten we niet wie de rechthebbenden nog zijn (de zgn. verweesde werken)? Het zijn vragen die in de afgelopen jaren door de vlucht die de digitalisering van het gedrukte boek heeft genomen, niet alleen in het Google Books programma, in het brandpunt van de belangstelling van auteurs, uitgeverijen en bibliotheken zijn komen te staan. En het zijn vragen waarop nog steeds geen steekhoudend antwoord gegeven kan worden.

Dat is ook de conclusie van John Wilkin, directeur van de HathiTrust, in zijn bjidrage aan de zoektocht naar een antwoord op de eerder geformuleerde vragen. En zijn verklaring daarvoor is eenvoudig: het ontbreken van een betrouwbare alomvattende bibliografie. WorldCat, bij eerdere pogingen om tot een antwoord te komen gebruikt als bron van relevante bibliografische data, wordt door hem gediskwalificeerd: er is niet alleen sprake van te veel ‘noise‘ in WorldCat, de database zelf is gewoon ‘chaos‘.

Laat Wilkin het daarbij? Nee hoor. Op basis van de collectie van 5 miljoen boeken die inmiddels in de digitale archieven van de HathiTrust zijn opgeslagen, en die representatief lijkt te zijn voor het totale bezit van de Amerikaanse wetenschappelijke en onderzoeksbibliotheken, tracht hij stap-voor-stap te beredeneren hoe de wereldwijde boekenproductie is samengesteld. Een paar belangrijke cijfers: 1) van de totale boekenproductie is tussen de 27 en 30% van Amerikaanse bodem (en de andere 70+% is dus non-US); 2) 20% van de boekenproductie is van voor 1923 en dus, althans volgens Amerikaanse wetgeving, volledig rechtenvrij; 3) van materiaal van na 1923 is maximaal nog eens 10% rechtenvrij; 4) waarschijnlijk 50% van de totale boekenproductie valt in de categorie verweesde werken. Wilkin presenteert tenslotte de volgende visualisatie van zijn berekeningen:

Wilkin sluit af met de constatering dat van de huidige HathiTrust-collectie de helft dus in de categorie verweesde werken valt en dat die niet zo maar online beschikbaar gesteld mag worden. Maar:

In nearly all cases, there is no economic harm to any person or organization in opening access to these in-copyright works, and there is a great loss in not providing access to them. Without an effective legal or policy framework that allows us to do so, a significant portion of our cultural heritage will be underused and undervalued.

Aan dat laatste moet dus hard gewerkt worden. En natuurlijk ook nog een betrouwbare methode om de omvang van de totale boekenproductie vast te stellen. We hebben nu de procentuele verdeling, maar ik wil ook graag het getal waar die procenten op moeten worden losgelaten.

5 comments so far

  1. Johan Stapel on

    Boeiende blog over een interessante analyse. Ik meen me te herinneren dat het aantal unieke boektitels wereldwijd is wordt geschat op ca 200 miljoen. Het aantal Nederlandse uitgaven schat ik op 2 a 3 miljoen. KB/Google digitaliseert 160.000 titels, KB/Proquest 20.000, de universiteiten ihkv Libratory 20.000 titels, alle rechtenvrij. Verder zie ik bij Google Books al behoorlijk wat NL-publicaties, helaas niet allemaal rechtenvrij.
    Een goed begin.

  2. […] This post was mentioned on Twitter by bibliohan, kenniswerkers.nu. kenniswerkers.nu said: Een olifant ontleed http://ow.ly/1bunyy […]


Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s

%d bloggers op de volgende wijze: