Archive for the ‘data’ Tag

TWIT #23

TWIT

Advertenties

4G Sucks ;-)

Vanaf vandaag 4G beschikbaar in Amsterdam. So What?

4G

Weekendvitaminen #39

Op het nachtkastje

Beeld van de week

En lees de bijbehorende blogpost van David Smith.

“The future of information isn’t about refinements in search and retrieval sprinkled with dustings of presentation magic. It’s about active systems; predictive systems; things that model and monitor what a person is doing and accessing (watch as Google Goggles reads the academic paper at the same time as you do), and how we’ll build and deliver to those systems.”

Weekend(= vakantie)vitaminen #35

Op het nachtkastje

 • D-Lib Magazine (July/August 2012). Special issue over data mining.
 • SPEC Kit 328: Collaborative Teaching and Learning Tools (ARL)
 • Digitale drempels. Knelpunten voor legaal digitaal aanbod in de creatieve industrie (SEO)
 • Print Management at “Mega-scale”: a Regional Perspective on Print Book Collections in North America (OCLC Research)
 • David A. Bell, ‘The Bookless Library’ (The New Republic)
 • Brian Cox & Margi Jantti, ‘Discovering the Impact of Library Use and Student  Performance’ (EDUCAUSEreview Online)
 • Milena Dobreva e.a., User Studies for Digital Library Development, Facet Publishing, 2012

Beeld van de (komende) week (weken)

Weekendvitaminen #32

Op het nachtkastje

Duidelijk tijd voor vakantie! 😉

Beeld van de week

Uit een recente presentatie van ‘Mr. Embedded Librarian’ David Shumaker.

Weekendvitaminen #30

Op het nachtkastje

 • One Culture. Computationally Intensive Research in the Humanities and Social Sciences. Report on the Experiences of First Respondents to the Digging Into Data Challenge (rapport van CLIR)
 • Bo-Christer Björk, The Hybrid Model for Open Access Publication of Scholarly Articles: A Failed Experiment? In: JASIST (2012).
 • Heather Hessel & Janet Fransen, Resource Discovery: Comparative Results on Two Catalog Interfaces. In: Information Technology and Libraries (2012). Data in artikel dateren uit 2009 (vòòr de opkomst van de discovery tools), maar de observaties over verschillen in het zoeken tussen gebruikersgroepen, inclusief bibliothecarissen, snijden nog steeds hout.
 • Mary Francis, Peer Reviewers of Academic Journals. Who is Responisble for our Professional Literature. In: College & Research Libraries(2012). Twijfelgeval, want mijn wenkbrauwen gingen wel omhoog toen ik las: “From the editor surveys there were six responses for a 54% response rate.”

Beeld van de week

Data gepresenteerd door het Canadese onderzoeksinstituut Higher Education Strategy Associates op basis van een database met gegevens over 47.000 personen. Gelukkig voegen ze er de volgende kanttekeningen aan toe:

There are three reasons why a scholar might have an H-index of zero. The first is age; younger scholars are less likely to have published, and their publications have had less time in which to be cited. The second is prevailing disciplinary norms. There are some disciplines – English/Literature would be a good example – where scholarly communication simply doesn’t involve a lot of citations of other scholars’ work. The third is simply that a particular scholar might not be publishing anything of particular importance, or indeed publishing anything at all.

Ik vond op hun website ook meteen een recent rapport over de Canadese wetenschappelijke productie, Making Research Count: Analyzing Canadian Academic Publishing Cultures, waarin op basis van de h-index met naam en toenaam de beste Canadese wetenschappers per discipline en de best scorende Canadese universiteit worden berekend.

Facebook voor onderzoekers

Deze afbeelding stond in de laatste E-data & Research (juni 20120) bij een artikel over VIVO en wat daar allemaal mee mogelijk is. Het is een visualisatie van de onderlinge relaties tussen Nederlandse hoogleraren en UHDs op basis van de aanstellingsgegevens in de landelijke onderzoeksdatabank NARCIS. Met o.a. als opmerking “Het grootste knooppunt is de Universiteit van Amsterdam.” Daar wilde ik meer van weten en vandaar dat ik vanmiddag aanschoof bij een lezing van de samenstelster van deze visualisatie, Katy Börner. Zij is momenteel als visiting professor verbonden aan de KNAW en o.m. bekend als auteur/samenstelster van de Atlas of Science. Ze werkt nu aan een vergelijkbare Atlas of Knowledge die in 2014 bij MIT Press moet verschijnen.

Over haar NARCIS-project ben ik niet veel wijzer geworden, maar des te meer over haar datavisualisatie-werk van de afgelopen tien jaar. Doel daarvan is het ontwikkelen van digitale tools die individuele onderzoekers, onderzoeksgroepen, instituten of universiteiten zelf in staat stellen hun plaats binnen de (inter)nationale onderzoekswereld te bepalen. Geen publication-centric, maar people-centric data en visualisaties. Over NARCIS kon ze daarbij nog wel melden dat het internationaal gezien een unieke dataverzameling is, gelet op de kwaliteit van de data, de mate van compleetheid en de landelijke dekking. Ook bij visualisaties geldt tenslotte uiteindelijk dat de kwaliteit en zeggingskracht ervan staat of valt met de kwaliteit van de onderliggende data.

Voor haar presentatie putte ze vooral uit deze eerdere presentatie bij DANS. De website van de Atlas of Science verdient uiteraard ook nog hier genoemd te worden. Voor mooie visualisaties als deze:

Onderzoeksdata, wat te doen?

The data deluge has arrived. Aldus begint Christine Borgman haar meest recente artikel in JASIST (achter Wiley-tolpoortje, maar hier ook open access). Een rijk artikel met een uitgebreide bibliografie van bijna 4 pagina’s. Borgman poogt in de andere 15 pagina’s op een uiterst integere en competente wijze het ingewikkelde probleem van data, data management en data sharing te doorgronden. Het begint met de simpele, maar op zichzelf al veelbetekenende, observatie dat iedereen het tegenwoordig wel over data sharing hééft, maar dat er in de praktijk vooralsnog weinig sprake is van daadwerkelijk delen. Vervolgens poogt zij antwoorden te geven op vragen als ‘wat is (zijn?) data?’ en waarom willen we eigenlijk onderzoeksdata delen? Zij onderscheidt daarbij vier hoofdredenen:

 1. to reproduce or to verify research
 2. to make results of publicly funded research available to the public
 3. to enable others to ask new questions of extant data
 4. to advance the state of research and innovation

Aan de hand van voorbeelden uit de natuurwetenschappen, de sociale wetenschappen en de humaniora laat ze zien dat er weinig overeenstemming is tussen ‘dataproducenten’ (lees: de wetenschappers) en degenen die data sharing bepleiten of proberen af te dwingen over wat data is (zijn?), wat dat delen nu precies inhoudt, en hoe data interpreteerbaar en herbruikbaar voor hergebruik zijn te bewaren. ‘The challenges are to understand which data might be shared, by whom, with whom, under what conditions, why, and to what effects.”

Leidt dat nu tot een eenduidige conclusie? Nee, en ja. Nee, in de zin dat ook Borgman niet met pasklare oplossingen komt. Ja, omdat iedereen na lezing van haar artikel zich nog wel een keer achter de oren krabt voordat hij in het algemeen en ongekwalificeerd op de noodzaak van het delen van onderzoeksdata zal wijzen.

“The reasons that researchers do not share data readily are becoming better understood. However, even less is known about why researchers do share data and why they reuse data. Thus, much more research is needed about practices in fields that do share data consistently and practices in fields where data are consistently reused. Only with this knowledge in hand, coupled with a richer understanding of the array of physical and digital objects that might be considered data, can better policies, practices, services, and systems be developed to support the sharing of research data.”

Met dank voor het attenderen aan @Saschel !

Informatiespecialisten aller landen, leest!

Ik geef toe, ik heb tot nu toe alleen maar de Executive Summary gelezen en wat door het rapport gebladerd. Maar wat ik gelezen heb is wat mij betreft voldoende om daar het advies LEZEN aan te hechten. En dat niet alleen omdat op de eerste pagina van die executive summary al mijn favoriete ‘one size does not fit all’ terug te vinden is, maar vooral vanwege het onderzoek wat er aan ten grondslag ligt. Ik had daar al eerder in de vorm van een presentatie van Antony Brewerton (The Six Million Dollar Subject Librarian) kennis van kunnen nemen en nu is dan het volledige eindrapport Re-skilling for Research beschikbaar. Oprdachtgever was overigens het Britse zusje van UKB, Research Libraries UK.

De focus van het rapport richt zich op de verwachte eisen die er aan informatiespecialisten bij universiteitsbibliotheken en onderzoeksinstellingen op de kortere termijn gesteld zullen worden en op de kloof die er is tussen de aanwezige kennis en vaardigheden en de binnenkort noodzakelijke (de skills gap). In het rapport worden negen gebieden geïdentificeerd waarop, althans voor zover op basis van de in Engeland verzamelde data kan worden geconcludeerd, op dit moment al sprake is van een high skills gap:

 • Ability to advise on preserving research outputs (49% essential in 2-5 years; 10% now)
 • Knowledge to advise on data management and curation, including ingest, discovery, access, dissemination, preservation, and portability (48% essential in 2-5 years; 16% now)
 • Knowledge to support researchers in complying with the various mandates of funders, including open access requirements (40% essential in 2-5 years; 16% now)
 • Knowledge to advise on potential data manipulation tools used in the discipline/subject (34% essential in 2‐5 years; 7% now)
 • Knowledge to advise on data mining (33% essential in 2‐5 years; 3% now)
 • Knowledge to advocate, and advise on, the use of metadata (29% essential in 2‐5 years; 10% now)
 • Ability to advise on the preservation of project records e.g. correspondence (24% essential in 2‐5 years; 3% now )
 • Knowledge of sources of research funding to assist researchers to identify potential funders (21% essential in 2‐5 years; 8% now)
 • Skills to develop metadata schema, and advise on discipline/subject standards and practices, for individual research projects (16% essential in 2‐5 years; 2% now)

Werk aan de winkel dus! (en dan hebben we het hier alleen nog maar over de ondersteuning van onderzoek!)

De projectpagina

Weekendvitaminen #11

Op het nachtkastje

 • Ebrary publiceerde een onderzoek naar het gebruik door en oordeel van studenten over e-books. Het betreft een herhaling van een soortgelijk onderzoek uit 2008, waardoor het mogelijk is trends te onderkennen. Opvallend resultaat? Het gebruik van e-books is in de afgelopen drie jaar met 4% gedaald, terwijl het gebruik van papieren boeken met 2% gestegen is! Papieren boeken worden ook als de meest betrouwbare bron voor onderzoek gezien; het vertrouwen in Wikipedia is in drie jaar bijna gehalveerd.
 • Springer publiceerde een terugblik op 5 jaar e-books voor de STM-disciplines gebaseerd op gesprekken met vijf (maar in werkelijkheid) acht leading librarians, waaronder de onvermijdelijke Rick Anderson maar ook onze eigen Zofia Dzwig van de bibliotheek van de TU Delft en Ay Ong van de bibliotheek van het CWI. Springer concludeert dat 2012 een cruciaal jaar wordt voor het e-book. Hebben we dat al niet vaker gehoord?
 • mooie samenvatting van de actuele stand van zaken in The Orphan Wars door expert James Grimmelmann. Niet alleen de toekomst van de verweesde werken zelf, maar ook de toekomst van het digitaliseren van die werken staat volgens hem op het spel. En de uitkomst is vooralsnog onvoorspelbaar.
 • Afgelopen dinsdag vond er bij NWO een SURFAcademy seminar plaats over open onderzoeksdata. Voor een verslag kun je terecht op het Vakblog van Raymond Snijders; de presentaties zijn inmiddels ook al beschikbaar. Gauw ook even het boekje Toegang tot onderzoeksdata meegepikt met mijn favoriete uitspraak op pagina 26.

Beeld van de week

Voor nadere uitleg: Citography.