Archief voor de ‘Google Scholar’ Tag

TWIT #12

TWIT

TWIT #7

TWIT

GRexit part 2

Keepcalm

De stof van Google’s voorjaarsschoonmaak is zo langzamerhand wel weer neergedaald, maar op de verschillende sociale media dreunt het aanstaande verdwijnen van Google Reader nog behoorlijk na. Vooral verstokte Reader-gebruikers enerzijds en notoire Google-critici anderzijds kunnen er maar geen genoeg van krijgen. Eerstgenoemden zien de bodem onder hun bestaan wegvallen (alle alternatieven schieten tenslotte tekort), terwijl laatstgenoemden zich vergenoegd omwentelen in hun ‘I told you so!‘. Zoekgoeroe Phil Bradley vatte het kernachtig en in bold typeface samen: “Google is not your friend. Do not trust Google. Google just wants to make money.

Wat resteert is uithuilen en opnieuw beginnen. De lijstjes van potentiële vervangers van Google Reader vliegen je om de oren, waarbij Feedly op dit moment de hoogste ogen lijkt te gooien. Het probleemloos kunnen importeren van je huidige feeds speelt daarbij een belangrijke rol, maar Feedly moet in de komende maanden nog wel haar claim kunnen waarmaken een eigen back-end van voldoende kwaliteit te kunnen maken (Normandy) en de toestroom van nieuwe gebruikers door de inzet van nieuwe servers en verhoging van de bandbreedte weten te accommoderen. Gelukkig hebben we nog tot 1 juli om dat even van een afstandje te bekijken.

KeepGoogleReader

Diegenen die in de kracht van online petities geloven kunnen ondertussen op verschillende plekken terecht. Alleen op change.org zijn al acht verschillende petities (maar allemaal met hetzelfde doel) terug te vinden, gezamenlijk inmiddels goed voor meer dan 150.000 ondertekenaars. Google zal daar overigens niet wakker van liggen.

Resterende vraag is natuurlijk welke Google-dienst het volgende slachtoffer zal zijn. Al eerder is ook hier over de toekomst van Google Scholar gespeculeerd en sinds vorige week gebeurt dat weer veel nadrukkelijker. Barbara Fister bijvoorbeeld op Inside Higher Ed:

I have to wonder if Google Scholar will be the next discontinued product line. It hasn’t been dressed in any spiffy new designs lately, which is fine by me, but I worry that someone at the Plex might notice it’s looking dowdy and think it should go, too, unless it can somehow become a gateway drug for Google+, self-driving cars, and dorky glasses.

De afgelopen dagen leidde dit in Amsterdam tijdens de Beyond the PDF-conferentie al tot het voorstel voor een open alternatief voor Google Scholar.
CrowdfundGoogleReader

Charleston dag #2: hard werken in de snoepwinkel

Vergeleken met de toogdagen van de ALA (‘s zomers meer dan 20.000 deelnemers, mid-winter ruim de helft daarvan) is de Charleston Conference met 1500 deelnemers maar een kleintje. De ballrooms in de hotels waar de conferentie plaatsvindt zijn dan ook van een wat kleiner formaat dan bij de ALA. Vanmorgen, bij het officiële begin van de conferentie, zat de grootste zaal echter boordevol en waren er twee overloopzalen nodig om iedereen een plekje te geven. De reden? Het feit dat Google’s Anurag Acharya een presentatie gaf over Google Scholar zal daar zeker mede debet aan geweest zijn.

Volle bak dus en dat al om acht uur ‘s ochtends. En dat moet ook maar eens gezegd worden: zo’n conferentie is doodgewoon hard werken. Zeker de Amerikanen hebben daar een handje van. Aanvangstijdstip van de eerste sessies is dus om acht uur en het programma loopt vervolgens, gelardeerd met lively lunches en fast tech talks, probleemloos door tot zeven uur ‘s avonds. Hard werken dus. En eigenlijk kom je nog werktijd tekort want het aanbod aan parallelle sessies is hier zo overweldigend (op sommige tijdstippen meer dan 15 tegelijkertijd) dat je probleemloos drie of vier meer dan interessante dagprogramma’s kunt samenstellen terwijl je in de praktijk je natuurlijk maar tot die ene keuze moet beperken. Je voelt je op momenten als een kind in de snoepwinkel die maar niet kan kiezen uit al dat lekkers.

Gelukkig wordt er soms ook voor je ‘gekozen’ door het aanbieden van een plenair programma, zoals vanochtend met Macmillans Annette Thomas en Google’s Acharya. Thomas deed een geslaagde poging de Macmillan-groep (waaronder Nature-uitgever NPG) te positioneren als de meedenkende uitgever die niet alleen maar uit is op winstmaximalisatie. Macmillan is al lang niet meer een ‘simpele’ uitgever van boeken en artikelen, maar meer en meer (vooral) een software ontwikkelaar van producten en diensten die de verschillende stappen in de onderzoekscyclus beter moeten faciliteren en ondersteunen. En dus klopt men nadrukkelijk op de deur bij wetenschappers met producten als readcube (voor pdf-opslag) en figshare (voor data-opslag). Volgens Thomas nadrukkelijk geen gesloten systemen, maar open en op basis van internationale standaarden. Thomas heeft binnen haar bedrijf daarnaast gekozen voor de proeftuin-methode waarin, zonder financiële overwegingen, nieuwe producten ontwikkeld en uitgeprobeerd kunnen worden. Die moeten zich dan wel binnen een periode van zes maanden als kansrijk bewijzen, al is falen (“fail often, but fail quickly”) niet ‘erg’.

Verder nog nieuws te melden over Google Scholar? Dat viel wat tegen. Acharya ging uitvoerig in op alle obstakels die Google (lees = hij) tegenkomt bij het realiseren van zijn droom: everybody must be able to find everything. Met het vinden van wetenschappelijke artikelen, met name die, zit het inmiddels wel goed maar het daadwerkelijke toegang bieden tot de beschikbare versies is buiten de instellingen die zich link resolvers kunnen veroorloven nog steeds slecht geregeld. En dat gaat Acharya persoonlijk zeer aan het hart. In de vraag-en-antwoord sessie na afloop kon hij al direct contact leggen met een aantal aanwezige leveranciers om bestaande problemen op te lossen, maar de laatste vraag leverde nog het meest interessante antwoord op. De vraag uit de zaal luidde waarom Scholar de laatste tijd zo slecht vindbaar is op de Google-site (lees = verbannen naar derde rang onder Even more). Acharya’s antwoord was veelzeggend: It was not my decision, maar een gevolg van de optimalisering van de Google-homepage op basis van gebruiksdata. God hoorde hem brommen.

Weekendvitaminen #33

Op het nachtkastje

  • Assessing the role of librarians in an Open Access world (InTech Open, June 2012)
  • Survey Report on Digitisation in European Cultural Heritage Institutions 2012 (ENUMERATE)
  • Onderzoekscoördinatie in de gouden driehoek. Een geschiedenis (Harry Lintsen & Evert-Jan Velzing). Een beetje off topic, maar gelet op alle aandacht voor topsectoren en wat dies meer zij niet onbelangrijk.
  • The European Library Standards Handbook, Version 1.0 (Europeana). Voor de liefhebbers…
  • Kirk Hess, Discovering Digital Library User Behavior with Google Analytics (Code4Lib, Issue 17)
  • JISC Inform (Summer 2012) met o.m. artikelen over de entrepreneurial spirit in bibliotheken en het inmiddels al vaak genoemde Researchers of Tomorrow.

Beeld van de week

Bovenstaand beeld komt uit een op auteurs gerichte Prezi van SAGE waarin advies gegeven wordt over wat je moet doen om een artikel te schrijven dat geciteerd gaat worden (afgezien uiteraard van het feit dat de inhoud iets om het lijf heeft en het goed geschreven is): How to Publish a Discoverable Journal Article: Tips for Writing a Paper that will Get Cited. Ik kan me niet herinneren eerder een dergelijk cijfer gelezen te hebben (maar dat kan uiteraard aan mij liggen): in 60% van de gevallen komen informatie-zoekenden via Google (Scholar) bij de artikelen van SAGE terecht. Dat doet natuurlijk de vraag rijzen: komen die resterende 40% via de websites/discovery tools/linkresolvers van wetenschappelijke instellingen, of is dat 25%, of 10%, of … Iemand bekend met andere cijfers over dit fenomeen? Ik houd me aanbevolen. #dtv

Discovery langs de meetlat

Tijd voor een ontboezeming. Ik voel me altijd ‘een beetje dom’ als ik weer zo’n bijdrage van een cluster Amerikaanse collega’s lees waarin statistisch al dan niet significante verschillen voor het voetlicht worden gebracht. Spearman’s rho, ANOVA result en Tukey post-hoc analysis result vliegen je om de oren, ik lees het en blijf soms in verbijstering achter. Want wat moet je nu precies met een observatie als:

This result was significant at p<.05 using a using a one-way ANOVA for all questions combined and questions 1-3, but not significant on question 4. The full ANOVA results were as follows: All questions combined: F(1,84)=15.831, p=.000, eta squared =.159; Question 1: F(1,84)=7.933, p=.006, eta squared=.086; Question 2: F(1,83)=7.611, p=.007, eta squared=.084; Question 3: F(1,84)=5.235, p=.025, eta squared=.059; Question 4: F(1,84)=-.420, p=.519, eta squared=.005

Dan kan ik slechts diep buigen en toegeven dat mijn twee modules statistiek gedurende mijn propedeuse politicologie aan de Vrije Universiteit inmiddels wel heel ver weg zijn gezakt.

Maar dan. Als er dan ook een goede ouderwetse tabel wordt opgevoerd, leef ik weer helemaal op. Dáár kan ik wat mee.

Het beantwoorden van dezelfde vragen door verschillende studenten die gebruik maakten van verschillende discovery tools (respectievelijk Google Scholar, EBSCO Discovery Service, Summon, het actuele bibliotheekaanbod van catalogi en databases, of een eigen keuze) levert verrassende en minder verrassende resultaten op.

Minder verrassend:

  • gebruikers van de bibliotheekcatalogus komen sneller bij boeken uit; in het miljoenen (inmiddels misschien miljarden) aanbod van EDS en Summon sneeuwen die al snel onder. Zelfs Google Scholar scoort beter, dankzij de integratie met Google Books.
  • gebruikers van Google Scholar lopen nog wel eens tegen een pay wall op; die artikelen filtert Google er niet uit
  • laat je gebruikers zelf de keuze van een tool dan moet je niet vreemd opkijken dat de ‘gewone’ Google dan veel gebruikt wordt, hetgeen tot een significant (!) hoger gebruik van ‘ordinaire’ websites leidt

Verrassender:

  • EDS scoort het hoogst wat betreft de keuze voor wetenschappelijke artikelen; en
  • Summon leidt gebruikers blijkbaar relatief vaak naar krantenartikelen.

De onderzoekers verklaren dit laatste gegeven uit het feit dat in de gebruikte EDS-installatie de LexisNexis krantendatabase niet geactiveerd was, terwijl dat in de Summon-installatie wel was gebeurd. Bovendien, zo zeggen althans de onderzoekers, bevoordeelt Summon in haar relevantieranking krantenartikelen sterker dan EDS waardoor “students inadvertently to less appropriate resources” worden geleid.

Hetgeen vervolgens tot de niet zo opzienbarende, maar wel heel relevante conclusie leidt (ook ondersteund door onze eigen recente implementatie van Primo):

Students’ practices of primarily utilizing the basic search functionality of any search system, as well as their tendency to rely only on the first page of search results and to trust the relevancy rankings of a given search engine makes the default settings of these search systems critically important.

Daar neem ik die statistische rimram dan maar graag voor op de koop toe.

P.S. de auteurs claimen in hun inleiding geen andere studie te kennen waarin verschillende discovery tools op deze wijze met elkaar vergeleken worden. Tegen de tijd dat hun artikel (nu beschikbaar als geaccepteerd artikel) in juli 2013 (!!!) écht wordt gepubliceerd in College and Research Libraries zal die claim ongetwijfeld aangepast moeten worden. Zou CRL dus niet gewoon met deze onzin moeten stoppen? Geaccepteerd = gepubliceerd.

Week(end)vitaminen #15

Op het nachtkastje

Beeld van de week

Op deze kaart zijn de locaties te zien waar op dit moment een Espresso Book Machine beschikbaar is, in een bibliotheek of in een boekhandel. In Latijns-Amerika moet de eerste nog aangeschaft worden (Brazilië?); in Australië, Azië, Afrika en Europa zijn er in de afgelopen jaren enkele geplaatst (waarvan twee in Nederland, in Amsterdam en Den Haag), maar de EBM is vooralsnog vooral een Noord-Amerikaans ding. En daarmee, hoe tegenstrijdig dat misschien ook klinkt, ook een goede indicator van de voortschrijdende digitalisering en de groei van de markt voor e-books.

Beeld van de komende week

Hoe zit het met Google Scholar?

“Soms kom je de meest interessante ontwikkelingen op de meest ingetogen plekken tegen.” Dat schreef Raymond Snijders n.a.v. een tweet die hem naar de website KB verwees waarop hij het bericht las over de beschikbaarstelling van 180.000+ e-books voor alle leden van de KB (en dat zijn, op basis van een gratis lidmaatschap, ook alle medewerkers van Nederlandse universiteiten!). Een beetje hetzelfde, maar dan natuurlijk geheel anders, overkwam mij ook toen ik via een tweet met de verleidelijke boodschap “how-students-and-faculty-really-find-articles” terecht kwam op de blog van Iris, een Amerikaanse collega. De inhoud van haar blogpost zelf, waarnaar de tweet doorlinkte, is interessant, maar de aanvullende discussie op FriendFeed misschien nog wel meer. Twee kwesties houden mij sindsdien bezig:


1) we zijn er zo aan gewend geraakt dat nieuwe applicaties in permanent bèta worden opgeleverd, dat het mij niet opgevallen is dat Google Scholar sinds enige tijd niet meer beta in haar logo voert. Wie is dat wel opgevallen? En wie weet wanneer dat beta uit het logo is verwijderd? Zoals zo vaak levert de onvolprezen Wayback Machine hier een (bijna) sluitend antwoord: het moet ergens tussen 10 en 13 mei 2011 zijn geweest. Google zelf heeft er, voor zover ik in ieder geval weet, geen aandacht aan besteed. Op de Google Scholar blog is er ook geen enkele vermelding van te vinden.

Maar betekent dit nu dat Google Scholar ‘af’ is? Dat kun je je eigenlijk toch ook niet voorstellen. Vorig najaar is nog de citaties-functie aan Scholar toegevoegd. Of… En dan komt de tweede kwestie:

2) gebruikers van de ‘Nederlandse’ Google zijn gewend dat Scholar in Google’s zwarte menubalk is terug te vinden onder Meer, net als Google Books, Picasa en Google Reader.

Bij de oer-Google (google.com) was dat tot voor kort ook zo, maar is dat nu niet meer. Scholar is ‘verbannen’ naar Even More.

Is dat een stap op weg naar afscheid nemen van Scholar of lees ik hier te veel in? Kunnen de echte Google-watchers hier eens hun licht over laten schijnen?

Een h-index van 6

Niets menselijks is mij vreemd, en dus ook niet enige ijdelheid. En zo pleitte ik 2,5 jaar geleden op deze plek voor een creatief gebruik van Google Books voor een realistischer beeld van het aantal citaties in de geesteswetenschappen. Puur uitgaan van citaties in peer-reviewed artikelen uit tijdschriften met een impact factor levert namelijk een nogal vertekend beeld op van het citeergedrag in de humaniora. ‘t Gebeurt niet zo heel vaak, maar nu is er door Google naar me geluisterd. Daar kwam ik achter toen ik, ik zei al: niets menselijks is mij vreemd, mijn eigen naam invoerde bij Google Scholar Citations. Deze week werd deze dienst voor iedereen opengesteld.

Om te beginnen was ik aangenaam verrast door mijn h-index van 6, hetgeen zoveel betekent dat zes artikel die ik geschreven heb minimaal 6 keer geciteerd zijn. Op de i10-index (het aantal publicaties met minimaal 10 citaties) scoor ik een 2. De eerlijkheid gebiedt wel daar aan toe te voegen, dat doet Google ten slotte ook, dat als die twee indexen voor de laatste vijf jaar genomen worden de scores zakken naar respectievelijk 3 en 0. Daar staat dan weer tegenover dat ik op de z-index bijna 26 scoor. Z-index? Ja, die heb ik zelf even bedacht: het aantal jaren dat je zonder onderbreking minimaal 1 keer geciteerd wordt. Maar ik zei al: bijna. Helaas zit er sinds 1986 een jaar zonder citaties tussen, nl. 2007. Je kunt niet alles hebben.

Maar nu waar het echt om gaat: ik ben natuurlijk ook even die citaties gaan checken en daar werd ik aangenaam verrast. het betreft namelijk niet alleen maar citaties in andere artikelen (zoals in Web of Knowledge) maar ook citaties uit boeken die voor Google Books gedigitaliseerd zijn. Kijk, dat is nu iets waar ik vrolijk van word. Eindelijk de integratie van twee produkten die daadwerkelijke meerwaarde oplevert. Het is natuurlijk geen toeval dat Thomson Reuters op hetzelfde moment druk bezig is zijn Book Citation Index te pushen. Gelukkig is er nog sprake van enige concurrentie op dit terrein.

Weekoogst #40

Nut van een blog definitief bewezen ;-)
De nieuwste editie van de Webometrics Ranking Web of World Repositories is beschikbaar. Trotse aanvoerder van deze editie is het Social Science Research Network. Snel even gekeken waar de UvA deze keer terecht is gekomen. Dat valt niet mee. De 268e plaats, net voor de Vrije Universiteit. Met name de verhouding tussen records met alleen metadata en records met full text (zgn. rich files) is in UvA-DARE niet goed. Maar hoe was dat vorig jaar ook al weer? Webometrics geeft daar zelf geen antwoord op, want bij het verschijnen van een nieuwe editie van de ranglijst verdwijnt de vorige meteen van het web. Biedt de Wayback Machine dan misschien uitsluitsel? Nee, ook niet. Maar gelukkig: dan is er altijd nog Zeemanspraat! Vorig jaar stonden we op plaats 263. Vijf gezakt dus.

Google Scholar opnieuw onder vuur
Vanaf de lancering in 2004 wordt Google Scholar vanuit de bibliotheekwereld zeer kritisch bejegend. Dekking, ranking en zoekmogelijkheden zouden onvoldoende zijn. Ook in een nieuwe review in The Charleston Advisor scoort Scholar op deze punten weer onder de maat, althans volgens Amy Hoseth. Op het punt ‘Pricing’ scoort Scholar zelfs een onbegrijpelijke ‘n/a’ (not available), terwijl er wat mij betreft eigenlijk 5 sterren toegekend moeten worden vanwege de gratis beschikbaarheid. Als totaalscore komt Scholar nu op 2,5 van de maximaal 5 haalbare sterren uit. Ten onrechte, vind ik, maar Google is gelukkig mans genoeg om haar eigen product te verdedigen.

e-Humanities
De KNAW is druk bezig zich te profileren als e-humanities organisatie. Vorige week kon ik al de samensmelting melden van Huygens Instituut en ING, deze week ging een nieuwe website live die de gezamenlijke expertise van KNAW-instituten en universiteiten op het gebied van e-humanities (en blijkbaar toch ook e-social sciences) moet samenballen. De website is duidelijk nog een work-in-progress, maar zeker een initiatief dat in de gaten gehouden moet worden.

Kindle inruilen?
E-books hebben de toekomst en e-readers, als een van de vele devices waarop ze gelezen kunnen worden, dus ook. Maar sommigen kopen zo’n ding en kunnen er vervolgens niet mee uit de voeten of missen het papier. Een boekwinkel in Portland, Oregon biedt nu uitkomst: je kunt er je Kindle zonder verlies inruilen voor ‘old school paper books’. De ingeruilde Kindles worden, met een knipoog, toegevoegd aan de collectie ‘outdated technology’ van de boekwinkel.

Volg

Get every new post delivered to your Inbox.

Join 43 other followers