Archief voor de ‘Google Book Search’ Tag

TWIT #21

TWIT

Weekoogst #66

Nieuwe bibliografie
Charles has done it again. Charles Bailey, bekend van verschillende toonaangevende bibliografieën over onderwerpen als Open Access, elektronisch publiceren en Google Book Search en natuurlijk de blog DigitalKoans, heeft weer een nieuwe loot aan zijn bibliografieën-stam toegevoegd. Deze handelt over e-science en wetenschappelijke bibliotheken. Het is pas versie 1 en nog bescheiden van omvang, maar Bailey kennende zal ook deze selectie binnen afzienbare tijd uitgroeien tot de eerste port of call voor geïnteresseerden.

Open Contracts
Google heeft in de afgelopen jaren met een aantal nationale bibliotheken in Europa contracten afgesloten voor het digitaliseren van delen van hun collecties. Naast het contract met de British Library, genereert het contract met onze eigen KB natuurlijk hier de meeste belangstelling. Ingmar Koch, die eerder de KB met een beroep op de WOB dwong tot openbaarmaking van het contract met Google, meldt deze week dat hij door de KB ‘verleid’ is tot een ontmoeting in de KB om zijn vervolg-verzoek te bespreken. Gelet op het grote aantal documenten waar het om zou gaan, vroeg de KB zich af of het verstrekken van mondelinge inlichtingen niet afdoende zou kunnen zijn. Ingmar is niet ingegaan op dit voorstel van de KB, hetgeen oud-rijksarchivaris Erik Ketelaar op Twitter een ‘goed zo!‘ ontlokte.
Over de afspraken tussen Google en de Oostenrijkse nationale bibliotheek kwam ik overigens nog deze LIBER-presentatie tegen.

Als de bliksem…
Het mist het rauwe en het van-de-straat karakter van het Amerikaanse Go the Fuck to the Library, maar Alsdebliksemnaardebieb heeft toch ook al een groot aantal reacties opgeleverd. Vanuit de Amsterdamse situatie zou er daar nog een aan toegevoegd kunnen worden: als-de-bliksem-naar-de-bieb (zelfs op zondagochtend!) om nog een vrij plekje te kunnen veroveren. Vanochtend was het weer dringen geblazen om tien uur. Hoezo gebrek aan studiezin?

Weekoogst met pensioen
Dit is aflevering 66 van Weekoogst. 66 is de leeftijd dat ik, volgens de huidige AOW-plannen t.z.t. met pensioen mag. En dus vind ik 66 ook een mooi aantal om Weekoogst met pensioen te laten gaan. Het is tijd voor iets anders. Als Google Reader kan veranderen, dan kan Zeemanspraat dat met die wekelijkse keuze uit actuele ontwikkelingen het ook. Hoe die verandering er uit gaat zien? Dat weet ik eigenlijk nog niet. Het moet in ieder geval een verbetering zijn, dus de lat ligt hoog. ;-)

The Orphan Wars

Morgen verzamelen zich in een New Yorkse rechtszaal onder leiding van rechter Danny Chin de partijen in de Google Books Settlement-zaak voor het zoveelste bedrijf in deze inmiddels jaren lopende rechtbanktragedie. Het is de laatste tijd nogal stil geweest rond deze kwestie en er wordt al gespeculeerd dat de zaak wel eens als een nachtkaars uit zou kunnen gaan: geen overeenkomst tussen Google enerzijds en de Authors Guild cs. aan de andere kant en weer terug bij af.

Maar de zitting van judge Chin is in een heel nieuw daglicht komen te staan door het besluit van de Authors Guild, nu met enkele andere medestanders, om de HathiTrust en enkele Amerikaanse universiteitsbibliotheken voor het gerecht te dagen vanwege hun voornemen zgn. verweesde werken digitaal beschikbaar te gaan stellen aan hun eigen gebruikersgroepen.

Verweesde werken? Ja, dat zijn boeken die gelet op hun publicatiedatum nog beschermd zijn door het auteursrecht, maar waarvan niet meer vastgesteld kan worden wie de auteursrechthebbenden zijn. Het betreft veelal publicaties uit de 20e eeuw die in grote getalen door Google in de afgelopen jaren zijn gedigitaliseerd en waarvan in Google Book Search meestentijds alleen de zgn. snippets vertoond worden. Van die gedigitaliseerde verweesde werken zijn inmiddels vaak de digitale kopieën die door Google aan de partner-bibliotheek zijn geleverd opgenomen in hun gezamenlijke digitale archief, de HathiTrust. En enkele universiteitsbibliotheken die hun boeken aan Google ter beschikking hebben gesteld om die te digitaliseren hebben nu het voornemen om hun digitale kopieën uit de groep verweesde werken full-text digitaal beschikbaar te stellen op de eigen campus en alleen als de desbetreffende bibliotheek een papieren exemplaar van het boek in haar bezit heeft. Volgt u mij nog?

Daartegen komt de Authors Guild (de Amerikaanse beroepsorganisatie van auteurs) nu dus in het geweer. Zij vraagt aan de rechter de HathiTrust en de universiteitsbibliotheken te verbieden hun digitale versies van verweesde werken beschikbaar te stellen en, nog veel verdergaand, om verdere digitalisering door Google te verbieden in afwachting van nieuwe wetgeving door Congress over juist die verweesde werken. Waarmee een nieuw juridisch steekspel is begonnen, net nu dus de zaak rond de GBS begon te verzanden. GBS-veteraan James Grimmelmann heeft het dan ook in een eerste analyse over The Orphan Wars waarin nu net het eerste schot gelost is.

HathiTrust en de betrokken universiteitsbibliotheken zijn uiteraard onaangenaam verrast door deze actie van de auteursorganisaties. Vanaf de eerste aankondiging van hun voornemen deze verweesde werken digitaal beschikbaar te gaan stellen, dit voorjaar, hebben zij proberen aan te tonen dat zij alle moeite hebben gedaan om eventuele rechthebbenden van vrij te geven verweesde werken te achterhalen. Daarvoor is door de University of Michigan zelfs een speciale unit in het leven geroepen. Het zal de Authors Guild dan ook ongelooflijke veel genoegen hebben gedaan dat ze de HathiTrust vandaag op een onzorgvuldigheid kunnen betrappen: Found one! Het “We’ve got him!” klinkt er onaangenaam in door.

Weekoogst #57

Journal TOCs
JournalTOCs is een gratis attenderingsdienst op ca. 16.500 tijdschriften van alle grote wetenschappelijke uitgeverijen. Geen noodzaak dus om je op iedere afzonderlijke website van een uitgeverij te abonneren op nieuwe inhoudsopgaven van specifieke tijdschriften, maar één site die toegang biedt tot de relevante en belangrijke tijdschriften in alle disciplines. Op haar homepage biedt JournalTOCs ook een overzicht aan van de meest gevolgde tijdschriften. Hoe verbazingwekkend is het dat van de top-20 tijdschriften er 15 in de categorie Library and Information Science vallen? Library Hi Tech heeft de meeste followers (176). Nature moet het met een derde plaats doen (137) en Science met een 15e plaats (84). Blijkbaar heeft deze dienst de echte doelgroep nog niet bereikt.

Publish or Perish
In april publiceerde de London School of Economics Maximizing the Impacts of Your Research. A Handbook for Social Scientists. Op de bijbehorende blog worden onderwerpen uit het handbook nader toegelicht en/of verder uitgewerkt. Zo worden Web of Science, Google Scholar en Google Book Search als citation tool vergeleken met het programma Publish or Perish van Anne Harzing. De titel van de post “Why ‘Publish or Perish’ has the edge over Google Scholar and Scopus” wordt in de post zelf echter niet waargemaakt; het komt toch weer neer op het gebruiken van een combinatie van tools, afhankelijk van de discipline en het onderwerp.

GBS-zaak sleept zich voort
Google is er in de VS nog niet uit met de schrijvers en uitgevers. Tijdens de status hearing vorige week kon er nog geen overeenkomst gemeld worden over een aanpassing van de Google Books Settlement die tegemoet komt aan de bezwaren van rechter Chin. Een hervatting van de oorspronkelijke rechtszaak behoort dan ook nadrukkelijk weer tot de mogelijkheden. Chin heeft de betrokken partijen nu tot 19 juli uitstel gegeven. Publishers Weekly vat de stand van zaken alsvolgt samen:

While the hearing itself was uneventful, statements made by publishers and authors after the hearing were perhaps more telling. “The parties have held conversations to determine if a revised agreement is possible,“ said AAP president and CEO Tom Allen in s statement. “Those conversations are ongoing and if not successful, the litigation will resume.” In a brief statement, Authors Guild executive director Paul Aiken said authors were “giving settlement discussions a fair shot before pressing ahead with our litigation.” Google had no statement at press time.
Those statements stand in contrast to statements made just after the settlement’s rejection on March 22, when publishers and authors expressed eagerness to strike a revised deal.

Woord van het jaar: witwasalgoritme

Jon Orwant van Google sprak vanmiddag op het CATCH to eCATCH symposium in de Beurs van Berlage. Hij was de afsluitende keynote op een dag waarop stil werd gestaan bij de resultaten van het CATCH-programma tot nu toe. Een belangrijk deel van zijn presentatie was gewijd aan de Ngram-viewer en de nieuwe soort vragen die de beschikbaarheid van het gigantische corpus van 15+ miljoen boeken in Google Books mogelijk maakt.

In een interview met Orwant dat vlak voor het symposium in de Automatiseringsgids verscheen staat wat mij betreft het woord van het jaar 2011: witwasalgoritme. Of hij het woord zelf gebruikt heeft (maar dan vast in het Engels, whitewashalgorithm) of dat het een verzinsel is van journalist Richard Keijzer weet ik niet, maar ik vind het een prachtige vinding. En wat bedoelt Orwant er dan mee? Dat wordt uit de volgende context wel duidelijk:

Google hangt een datum aan iedere verbetering, zodat gebruikers kunnen zien met welk tekstcorpus ze werken. “En het dwingt ons ook om steeds weer te kijken of de processen verbeterd kunnen worden. En soms is de verbetering alleen cosmetisch, we hebben gemerkt dat gebruikers vooral oude boeken – denk aan de 16e of 17e eeuw – in hun originele vorm willen zien. Daar laten we ons witwasalgoritme dan ook achterwege. We zijn daar vorige week mee begonnen en de reacties uit de markt zijn enthousiast”, zegt Orwant.

De mogelijkheid 16e en 17e eeuwse drukken in het Google Books corpus in hun oorspronkelijke uitgave te zien, en niet netjes in een ‘witgewassen’ uitvoering, is inderdaad sinds begin deze week beschikbaar. Mooi dat dat mogelijk is nadat eerst, om redenen van leesbaarheid, opslag en laadsnelheid, door Google voor die bleke presentatie is gekozen. Misschien daarom straks niet ‘het woord van het jaar 2011′, maar wat mij betreft wel het boekenwoord van het jaar.

P.S. zoeken in Google op witwasalgoritme levert welgeteld één zoekresultaat op (na publicatie van deze post uiteraard twee). Kom daar tegenwoordig nog maar eens om. Andere voorbeelden?

Weekoogst #53

Unoriginal
Turnitin is misschien wel de meest gebruikte plagiaatdetectiesoftware in het hoger onderwijs. De producent ervan zit daarmee op een ongelooflijke hoeveelheid interessante data, waar af en toe iets over naar buiten gebracht wordt. Zoals in het white paper Plagiarism and the Web: Myths and Realities. Terecht wordt er in het white paper geconstateerd dat Turnitin alleen constateert of delen uit een tekst elders al gebruikt zijn op het web (“unoriginal content” zijn); niet of de auteur netjes zijn bronnen heeft verantwoord, of juist niet. Wikipedia blijkt de meest gebruikte bron van unoriginal content, maar sociale netwerk- en content sharing sites (Facebook, Scribd, SlideShare) zijn aan een opmars bezig. In de top-10 van meest populaire sites waaraan materiaal is ontleend komt slechts één site voor die zich expliciet richt op ‘frauduleus’ gebruik (oppapers.com), maar in de top-25 zijn het er al 11. Je zou willen dat hier meer informatie over wordt vrijgegeven.
Overigens wordt er ook gemeld dat door het gebruik van Turnitin het gebruik van unoriginal content zeker niet naar 0% terugloopt. In het eerste jaar na invoering wordt een reductie met 30% geconstateerd; vier jaar na introductie is die reductie maximaal 70%. “A digital culture that promotes sharing, openness and re-use is colliding with one of the fundamental tenets of education – the ability to develop, organize and express original thoughts. “
Fraaie uitdrukking trouwens: unoriginal content

                              

The continuing story of GBS
Afgelopen week had rechter Chin weer met de strijdende partijen om tafel moeten gaan zitten, maar de zitting is voorlopig uitgesteld tot 1 juni. Ongetwijfeld zullen er achter de schermen pogingen ondernomen worden om tot een oplossing te komen die zowel naar de zin van Google als die van de Authors Guild en de uitgevers is, maar eenvoudig zal het niet zijn. Voor ons, eenvoudige stervelingen, zijn er ondertussen al weer voldoende stukken beschikbaar die de uitspraak van Chin moeten duiden en die de meest waarschijnlijke oplossingsrichtingen aangeven. Jonathan Band publiceerde zijn vierde aflevering van Guide for the Perplexed, Pamela Samuelson (een van degenen die bezwaar had aangetekend tegen de overeenkomst) betoogt in een uitvoerig nieuw artikel hoe door nieuwe wetgeving door het Amerikaanse Congress het grote goed van Google Book Search gerealiseerd kan worden zonder alle nadelen die er aan de quasi-monopoliepositie voor Google op basis van de huidige overeenkomst vastzitten en Joe Esposito (We Can’t Put the Google Back in the Bottle) laat nog eens zien wat er allemaal sinds Google in 2004 met digitaliseren begon losgemaakt is in de wereld van uitgevers, bibliotheken en internet-bedrijven. Waarmee hij Google niet wil verdedigen, maar wel het positieve wil benadrukken van hetgeen Google heeft veroorzaakt. Eigenlijk eenzelfde sentiment als Bas Savenije van de KB verwoordde in de laatste aflevering van Digitale Bibliotheek (helaas, deze bijdrage van OA-kampioen Savenije zit achter de veilige pay-wall van Essentials Media).
Laatste vraag: hebben we hier trouwens met een continuing of een never-ending story te maken?

Back to the Future?
SSRN, Social Science Research Network, is het arXiv voor de sociale wetenschappen: een schitterende bron met open access online beschikbaarheid van grote aantallen wetenschappelijke artikelen, pre- en post-prints. SSRN biedt sinds kort iets nieuws, het wordt boven ieder online te raadplegen artikel prominent aangeboden: Purchase Bound Hard Copy. Voor $9.99, en voorlopig alleen nog in de Verenigde Staten, “You will receive a perfect bound, 8.5 x 11 inch, black and white printed copy of this PDF document with a glossy color cover.” Papier, het blijkt toch wel een heel hardnekkig medium te zijn. ;-)

| Purchase Bound Hard Copy

Blauw oog voor Google

Het is natuurlijk niet de rechtszaak van de eeuw, maar de uitspraak over de Google Books Settlement (in het jargon inmiddels de ASA geheten, de Amended Settlement Agreement) werd toch in veel kringen met spanning afgewacht. En gisteren, na ruim een jaar wachten, was het dan zo ver: rechter Danny Chin deed uitspraak: “The question presented is whether the ASA is fair, adequate, and reasonable. I conclude that it is not.” Daar kunnen de betrokken partijen, naast Google de Authors Guild en de Association of American Publishers, het op dit moment mee doen. Eind april wordt in de rechtszaal besproken of het hier ook bij blijft.

De belangrijkste bezwaren van Chin richten zich op de opt-out regeling waarvoor de partijen hebben gekozen (auteursrechthebbenden moeten zelf expliciet aangeven als ze niet aan de overeenkomst willen deelnemen); het belonen van Google met een de facto monopoliepositie op basis van digitaliseren zonder toestemming van rechthebbenden én het regelen van de status van de zogenaamde verweesde werken (nog wel in copyright, maar de rechthebbenden zijn onbekend of onvindbaar) via een private overeenkomst in plaats van publieke wetgeving.

Chin verwijst met grote regelmaat naar het Amerikaanse Congress dat voor die verweesde werken voor wetgeving zou moeten zorgen en draagt ook al het begin van een oplossing voor Google en de andere twee partijen aan: als zij zouden kiezen voor het opt-in principe (rechthebbenden moet expliciet aangeven deel te willen nemen aan de regeling) dan zou goedkeuring aanzienlijk dichterbij komen. Maar zoals een van de commentatoren van de uitspraak al meteen constateerde: daarmee is het probleem van de verweesde werken nog steeds niet opgelost.

Hoe nu verder? De bal ligt nu weer bij Google, AG en AAP. Google reageerde al not amused, maar zal zich met het oog op het toekomstige succes van Google Editions toch nadrukkelijk moeten beraden op de toekomst van een verder heel erg gewaardeerde en voor wetenschappelijk onderzoek ook zeer nuttige dienst. We hebben nu dus eindelijk een uitspraak, maar de toekomst blijft nog uitermate onzeker. Op naar 25 april!

Lees ook:

Weekoogst #42/43

Terug van even weggeweest… (al is de verbouwing nog niet helemaal af)

In blijde verwachting…
Binnen een week of vijf/zes zal de rechter naar verwachting uitspraak doen over de bezwaren die ingebracht zijn tegen de bouw van een nieuwe UB op het Amsterdamse Binnengasthuis-terrein. We zijn al een tijdje in afwachting van deze uitspraak en de spanning loopt toch langzamerhand op. Ook in Amerikaanse bibliotheekkringen, en ver daarbuiten, bouwt dit spanning zich op, al gaat het om een hele andere zaak. Het is nu al weer een jaar geleden dat de laatste hearing gehouden werd in de Google Books Settlement zaak en rechter Chin is nog steeds niet met een uitspraak gekomen. De Open Book Alliance vat de stand van zaken nog een keer samen.

Aan de horizon
Het rapport is links en rechts al gesignaleerd: de jaarlijkse Horizon-visie op de belangrijkste technologie-trends in het hoger onderwijs. Mobiele apparatuur en e-books scoren dit jaar opnieuw hoog. Dit achtste Horizon-rapport borduurt voort op het oude stramien: twee trends die binnen een jaar breed ingevoerd zullen zijn, twee waarvoor dat binnen 2 à 3 jaar zal duren en twee waarvoor we nog 4 à  5 jaar moeten wachten. Het zou een aardig onderzoekje zijn om al die acht rapporten eens goed tegen het licht te houden op hun voorspellende waarde. Langzamerhand zijn er voldoende data beschikbaar.

De beste tien van tweeduizendtien
Je kunt natuurlijk op dit blog vertrouwen om de belangrijkste publicaties over wetenschappelijke bibliotheken en het hoger onderwijs onder ogen te krijgen (niet doen!), maar je kunt natuurlijk beter vertrouwen op wat er wereldwijd door de community gelezen wordt. Dus klik hier voor de 10 best gelezen (online) artikelen uit Educause Review en hier voor de beste verkochte e-books van de American Library Association. Ik heb er slechts twee van de tien afgelopen jaar onder ogen gehad, en die twee zijn er waarschijnlijk voor iedereen makkelijk tussenuit te halen.

Google eBooks

De week is nog maar net begonnen of de oogst is al binnen: vanmorgen om 7 uur lokale tijd in Californië lanceerde Google eindelijk het langverwachte Google Editions, inmiddels omgedoopt tot Google eBooks. Nog niet beschikbaar buiten Europa, de wegen van het onbegrensde internet blijven ondoorgrondelijk, maar dat zal niet lang duren.

Volgens Google “Today is the first page in a new chapter of our mission to improve access to the cultural and educational treasures we know as books.” Zes jaar geleden, toen in december Google Book Search werd gelanceerd, was ook al zo’n moment.

Het bericht zingt natuurlijk al flink rond op het web, bijvoorbeeld op de ereaders-site of bij Edwins Mijns Inziens. En dus straks niet in Weekoogst #34. ;-)

Volg

Ontvang elk nieuw bericht direct in je inbox.

Doe mee met 47 andere volgers