Flabbergasted

Professoren, je hebt er soms toch rare kwibussen tussen. Neem nu Antal van den Bosch, hoogleraar Geheugen, taal en betekenis aan de Universiteit van Tilburg. Op de achterpagina van het nieuwe nummer van Edata & Research staat een interview met hem naar aanleiding van de lancering in december van Google’s Ngram Viewer. Niet veel mis mee. Van den Bosch noemt een aantal onvolkomenheden aan dit nieuwe speeltje, een aantal daarvan is inmiddels door Google ook al verbeterd, en richt zijn pijlen dan op de twee grootste struikelblokken op dit moment: de kwaliteit van de door Google toegepaste OCR en de eenzijdigheid van het bronnenmateriaal van Google Books, nl. boeken. Daardoor ontstaat een vertekend beeld van de werkelijkheid, “boeken representeren de tijdgeest maar ten dele”, aldus Van den Bosch.

Ik wil het Van den Bosch niet euvel duiden dat hij Google Books (what’s in a name) gelijk stelt met gedigitaliseerde boeken. Niets is echter minder waar. Gedigitaliseerde tijdschriften vormen een integraal onderdeel van Google Books. En dat er geen websites in Google Books zijn opgenomen, klopt inderdaad. Dat is ook nooit de doelstelling van Google geweest. Maar in zijn slotopmerking vliegt Van den Bosch volledig uit de bocht: “wat staat er tegenwoordig nog in boeken?”. Hoe wereldvreemd kun je zijn.

No comments yet

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s

%d bloggers op de volgende wijze: