Archief voor de ‘boeken’ Tag

Google halverwege

KBuitnodiging

Vanmiddag was het dan zo ver: met een kort introductiefilmpje werd de website http://boeken.kb.nl gelanceerd, de toegangspoort tot de eerste 80.000 door Google gedigitaliseerde boeken van onze eigen Koninklijke Bibliotheek. Er volgen er dus nog eens 80.000.

Met deze nieuwe loot aan de rijke KB-stam wordt het wel dringen in het zoekvakje op de KB-homepage. Tot vanochtend zag dat er namelijk nog zo uit:

KB website

Maar om 11.00 uur was er opeens plaats gemaakt voor de gedigitaliseerde boeken (ten koste van de eigen KB-website):

Website KB incl boeken

Maar willen we dat eigenlijk wel, al die silo’s naast elkaar? Soms natuurlijk wel, maar we willen ook één zoekinterface waarmee we al die rijke collecties tegelijkertijd, en het liefst full-text, kunnen doorzoeken. Bas Savenije zei er nog niets over tijdens zijn toespraakje, maar ik hoorde later tijdens de receptie dat in het najaar waarschijnlijk een dergelijke faciliteit aangeboden zal worden.

Ondertussen moeten we natuurlijk gewoon blij zijn met de digitale beschikbaarheid van deze 80.000 titels. Het is een prachtige aanvulling op wat al eerder, maar dan bescheidener van opzet, met Early Dutch Books Online is gerealiseerd. Zolang we ons ook maar realiseren dat het niet heel lang zal duren voordat ook nu weer de eerste berichten zullen verschijnen van gebrekkige digitalisering en kwalitatief onvoldoende OCR van dit KB-materiaal. Het is en blijft tenslotte nog steeds mensenwerk.

GoogleBooks

Bron: The Art of Google Books

P.S. opvallend: met een eigen variant op de zogenaamd-geheime-begroting-url was boeken.kb.nl vanmorgen vanaf 11.00 uur (vijf uur vòòr de officiële lancering) al door iedereen te raadplegen via het zoekvakje op de KB-homepage en via de url boeken1.kb.nl. Alleen de échte informatiespecialist heeft dat uiteraard gesignaleerd. ;-)

Effe zeuren hoor…

Leesplankje

In het nieuwste nummer van De Academische Boekengids staat een recensie van enkele recente publicaties over leescultuur in de Middeleeuwen. De eerste alinea van de recensie begint als volgt:

Umberto Eco leest tijdens zijn vakantie Dostojevski’s Oorlog en vrede het liefst als lijvig boek, maar steeds meer moderne lezers geven de voorkeur aan het handzamere formaat van de e-reader. E-books winnen zo snel aan populariteit dat onlangs in een weblog op de site van NRC Handelsblad de begrafenis van het gedrukte boek triomfantelijk aangekondigd werd, terwijl anderen zich met Nicholas Carr zorgen maken over de vervlakking en versnippering van onze kennis door internet en Google. Hoewel het op papier gedrukte boek nog steeds niet is verdwenen, heeft de komst van de nieuwe media een onmiskenbare verandering in onze leesgewoontes veroorzaakt.

Ik weet niet wat de bedoeling van de auteurs met deze opening is. ‘Boekenlezers’ zijn ouderwetse lezers? Die begrafenis van het gedrukte boek? Dat was al weer bijna een jaar geleden. E-readers? Die zijn toch ook al weer op de schroothoop van de geschiedenis bijgezet! En ze lijken het bijna wel jammer te vinden dat het op papier gedrukte boek nog steeds niet verdwenen is. Domme lezers van gedrukte boeken! Jullie zouden toch beter moeten weten, net als Margriet Hoogvliet en Mart van Duijn!

Irritant begint het wel te worden. Steeds maar weer die aankondigingen van:

En waarom? Moeten we om de waarde van het nieuwe te er- en onderkennen het oude dood verklaren? Blijkbaar geldt dat ook voor die good old catalogus. Volgende week moet ik over de toekomst daarvan op een interne kennisdeelmiddag iets vertellen. Ik hou me aanbevolen voor suggesties: crowdsourcing the defence of the catalogue!

Google kan tellen!

Bovenstaande tabel komt uit het laatste rapport van OCLC Research over de mogelijkheden het bewaarbeleid voor boeken in Noord-Amerika op een regionale schaal te organiseren. Mij gaat het om het getal 128.1 (miljoen) in deze tabel. Dat is namelijk het getal waarmee OCLC-onderzoekers op dit moment werken als het aantal unieke gedrukte boeken in de wereldwijde collectie, op basis van de grootste beschikbare catalogus, WorldCat. Zij houden uiteraard, als goede onderzoekers, daarbij een aantal slagen om de arm, zoals:

An important caveat to note in regard to table 1, as well as other results presented in this report, is that they reflect institutional collections as they are cataloged and represented in WorldCat. The accuracy of holdings data in WorldCat may be lessened by the presence of duplicate records, cataloging errors, incomplete registration of collections, and other sources of inconsistency.

Maar toch. Die 128.1 miljoen ligt nog geen 2 miljoen van de 129.8 miljoen waarmee Google twee jaar geleden naar buiten kwam. Dat is dus blijkbaar toch de orde van grootte waar we aan moeten denken voor de omvang van het gedrukte boeken-universum.

Vervolgens leidt bovenstaande tabel tot nog wat andere sommetjes. Van die 128 miljoen verschillende boeken zijn er gemiddeld per titel wereldwijd 10 exemplaren in bibliotheken beschikbaar; gemiddeld, want dat kan natuurlijk variëren van één uniek exemplaar tot (tien)duizenden exemplaren. En van die 128 miljoen verschillende boeken (lees: titels) zijn er ‘slechts’ 41 miljoen beschikbaar in Amerikaanse bibliotheken, zeg een/derde. Qua holdings ligt dat heel anders. Dan nemen die Amerikaanse bibliotheken met 840 miljoen exemplaren van de 1.238 miljoen geregistreerde opeens twee/derde van het wereldwijde boekenbezit voor hun rekening. Stel nu dat Google inderdaad inmiddels zo’n 20 miljoen titels, voornamelijk van die Amerikaanse bibliotheken, heeft gedigitaliseerd, dan is dat (opnieuw ‘slechts’) een/zesde van de opdracht waarvoor ze zich stelden toen ze besloten alle gedrukte informatie te digitaliseren. Het moment dat “alles” gedigitaliseerd is en dat alle gedrukte informatie in digitale vorm te raadplegen is ligt dus echt nog wel even een flink aantal jaren voor ons. David Bell verwacht, in een heel lezenswaardig artikel, dat The Bookless Library over zo’n twintig jaar een realiteit zal zijn. Om dat doel te realiseren zal Google echter nog flink aan moeten poten en moeten in ieder geval de huidige juridische problemen rond het digitaliseren van auteursrechtelijk beschermde werken overwonnen worden.

Nostalgie (3, tevens slot)

Er was een tijd dat hij standaard op m’n bureau lag, het pennemes. Niet om potloden bij te snijden, maar om boeken open te snijden waarvan de afzonderlijke katernen aan onder- of bovenzijde of zijkant nog een laatste bewerking moesten ondergaan. Met name bij publicaties uit Frankrijk, Italië, maar ook soms uit de VS kwam dat nog veelvuldig voor. En wilde je met enige zekerheid iets over de inhoud van het boek kunnen vertellen, om dat vervolgens te vertalen in de inmiddels ter ziele gegane GOO-trefwoorden en basisclassificatie, dan moesten toch in de meeste gevallen in ieder geval het eerste en het laatste katern bewerkt worden.

Maar dat is nog steeds niet helemaal verleden tijd. Onlangs bestelde ik, voor privé-gebruik, uit een uitgeversrestant een Frans boek uit 1959. Een nieuw exemplaar, dat om de pennemes-behandeling vroeg. Ik moest ‘m wel weer even zoeken…

Mesje dus nog maar even bewaren…

Nostalgie

Eerlijk gezegd had ik niet meer verwacht er nog ooit een onder ogen te krijgen, laat staan een die ook nog eens recent daadwerkelijk gebruikt zou zijn. Maar de wonderen zijn de wereld nog niet uit, evenals sommige hardnekkige bibliotheekgebruiken.

Herinnert u zich deze nog? Ik kon m’n ogen eigenlijk niet geloven:

En netjes afgetekend op 23 september 2012.
De universiteitsbibliotheek anno nu. Er is dus nog steeds ruimte voor verbetering, ook in Enschede…

Watch People Shop (for Books)

Geinig:

Klik op het plaatje voor levende beelden.

Met dank aan @fhuysmans

Weekendvitaminen #20

Op het nachtkastje

Nog steeds afgeladen vol. Waarmee?

Beeld van de week


Bron: The Atlantic

Het aanbod ligt er…

Uit een interview met Brewster Kahle:

What are the challenges faced by the Internet Archive regarding the digitization of books?

There are two big problems: there is going and building a digital collection, either by digitizing materials or buying electronic books. And the other is: how do you make this available, especially the in-copyright works? For digitizing books, it costs about 10 cents a page to do a beautiful rendition of a book. So, for approximately 30 dollars a book for 300 pages you can do a gorgeous job. Google does it much more quickly and it costs only about 5 dollars for each book. So it really is much less expensive in less quality, but they are able to do things at scale. We digitize about 1000 books every day in 23 scanning centers in six countries. We will set up scanning centers anywhere, or, if there are people that would like to staff the scanners themselves, we provide the scanners and all of the backend processing for free, until we run out of scanners and we’ve got a bunch of them. So we’re looking either for people that want to scan their own collections by providing there own labour or they can employ us to do it and all told it is 10 cent a page to complete. (…)

Are there already cooperations between European libraries and the Internet Archive, and are scanners already located in Europe which could be used for digitization projects in university or national libraries?

Yes, we have scanners now in London and in Edinburgh – the Natural History Museum and the national library – where we are digitizing now. We would like to have more scanners in more places so that anybody that would be willing to staff one, keep it busy for 40 hours each week, we will provide all of the technology for free or we can go and cooperate and we can hire the people and operate these scanning centers. We find that scanning centers – i.e. 10 scanners – can scan 30.000 books in a year and it costs about 10 cents a page. It is very efficient and very high quality. This is including fold outs and difficult materials as well. And it is working right within the libraries, so the librarians have real access to how the whole process is going and what is digitized. It is really up to the libraries. The idea is to get the libraries online as quickly as possible and without the restrictions that come with corporations. (…)

You mentioned Google Books. There are agreements between libraries and Google for digitizing materials. What are the benefits for libraries of choosing the Internet Archive over Google Books?

Google offers to cover the costs of the labor to do the digitization, but the libraries that participated ended up paying a very large amount of money just trying to prepare the books and get them to Google. Often they spent more working with Google than they would have with the Internet Archive, and in the latter case they do not have restrictions on their materials. So Google digitizes even public domain materials and then puts restrictions on their re-use. Everybody that says that it is open has got to mean something bizarre by ‘open’. You can not go and take hundreds of these and move them to another server, it is against the law and Google will stop libraries that try to make these available to people and moving the books from place to place, so this is quite unfortunate.

Waar wachten we nog op?

Plank of polder?

Voor diegenen voor wie het einde van het papieren boek al een gepasseerd station is, zal alle aandacht wel uitermate overdreven overkomen. Maar voor die grote groep voor wie dat nog helemaal geen uitgemaakte zaak is, staan er de komende maanden twee discussiereeksen op het programma waarvan morgen en overmorgen de eerste bijeenkomsten zullen plaatsvinden.

Maandag vindt de aftrap plaats van Ramsj in de Amsterdamse Rode Hoed met een debat over de toekomst van het papieren boek: “Het papieren boek is voor het eerst in eeuwen niet het enige podium voor literatuur. Verandert hierdoor de wijze waarop we literatuur maken, verspreiden en bewaren? En wat doen we dan met die enorme berg papieren boeken die we in onze boekenkasten, bibliotheken en boekwinkels verzameld hebben?” Guy Verhofstadt verrichtte afgelopen zaterdag al in de Volkskrant de aftrap met zijn essay Het papieren boek is veel te sterk om te sneuvelen.

Een dag later verhuist het debat naar Spui 25 met de eerste bijeenkomst in de debatreeks De toekomst van het boek

Aan catchy slagzinnen geen gebrek: plank, polder of gewoon Google? En in een eerder stadium op een affiche: Van boekenzaal naar digitaal. De open opstelling houdt de gemoederen bij de Amsterdamse faculteit der Geesteswetenschappen bezig, met als consequentie dinsdagavond een discussiebijeenkomst georganiseerd door het academisch-cultureel centrum Spui25.

‘t Papieren boek dood? ‘t Lijkt eerder springlevend.

Vooraankondiging: op dinsdag 28 februari wordt de discussie over de nieuwe Universiteitsbibliotheek voortgezet met een lagerhuisdebat bij Perdu: sloop of hoop voor het BG-terrein?

It Giet Oan!

Wat die Elfstedentocht betreft, moeten we dat nog maar afwachten. Maar de tentoonstelling The Printed Book. A Visual History gaat wel degelijk vandaag van start. Aan het eind van de middag is de opening in de Aula en dan vanaf morgen t/m 13 mei iedere week van dinsdag tot en met zondag te bezichtigen aan de Oude Turfmarkt.

Ter gelegenheid van de tentoonstelling verschijnt van de hand van conservator Mathieu Lommen het boek Hoe boek van het gedrukte boek. Een visuele geschiedenis. Niet alleen in het Nederlands, maar ook in het Engels en Duits. Hier al vast een preview.

Volg

Ontvang elk nieuw bericht direct in je inbox.

Doe mee met 47 andere volgers