Archive for the ‘digitale archivering’ Tag

TWIT #30

TWIT

Advertenties

TWIT #28

TWIT

https://twitter.com/EricHennekam/status/399124857192841216

TWIT #4

TWIT

Weekendvitaminen #49

Op het nachtkastje

Beeld van de week

Geinig. En met dank aan Stephen Abram.

Weekoogst #55

And the Winner is…
De nominaties voor Salems 2011 Library Blog Awards zijn deze week bekend gemaakt. Mijn pogingen om Laika’s MedLibLog genomineerd te krijgen zijn jammerlijk mislukt. Ik kan me niet aan de indruk wekken dat de blik toch vooral gericht is op ‘lokale’ (lees: Amerikaanse) blogs. Volgend jaar maar een nieuwe poging wagen.
Wat de mogelijke prijswinnaars van dit jaar betreft: bij de ‘general’ blogs is Librarian in Black wat mij betreft de gedoodverfde winnaar.  In de categorie ‘academic’ mag wat mij betreft de prijs naar ACRLog gaan. Er kan nog tot 1 juni gestemd worden.

Webarchiving door de KB
Iedereen is uiteraard bekend met de mogelijkheid via de Wayback Machine van Internet Archive oude versies van websites op te roepen. Zeemanspraat is bijvoorbeeld inmiddels zeven keer door Internet Archive opgeslagen. De Koninklijke Bibliotheek is ook actief met webarchivering en heeft nu de eerste resultaten van haar inspanningen beschikbaar gesteld. Daarvoor moet je dan wel naar de KB en in het bezit zijn van een KB-lenerspas (hoe dat zich verhoudt tot het open access-beleid van KB-bibliothecaris Bas Savenije weet ik niet zo goed). Dit is de lijst van websites die momenteel in gearchiveerde vorm beschikbaar zijn.

Zo subtiel als een bulldozer
Trots meldt Folia, het Amsterdamse universiteitsblad, dat ze de prijs voor de beste cover van hoger onderwijsbladen van het afgelopen jaar heeft gewonnen, inderdaad een felicitatie waard. Ontwerper Pascal Tieman licht zijn ontwerpfilosofie toe: ‘Waar het om gaat is dat je de lezer op het verkeerde been zet. Hij moet pas in tweede instantie doorhebben waar de omslag om draait.’ Vervolgens moest ik toch even grinniken toen ik de Folia (cover: Pascal Tieman) van deze week zag: die is toch aanzienlijk minder subtiel dan andere ontwerpen van Pascal.

Er gaat niets boven Groningen
Wat doe je als instelling als je zelf beschikt over een prima wetenschappelijke bibliotheek die toegang biedt tot tienduizende elektronische tijdschriften en honderden databases? Dan adviseer je je studenten om zich tegen een korting van 50% online in te schrijven als lid bij de Koninklijke Bibliotheek. Waarom? Nou, dan krijg je toegang tot de Digitale Bibliotheek van de KB met “een groot aantal databases en duizenden online tijdschriften”! Is het echt?
Sorry collega’s in Groningen, ik kon het niet laten. Dit berichtje verscheen onder de mededelingen van jullie informatiseringscentrum in jullie gezamenlijke blad Pictogram. Misschien dat die ICT’ers nog eens bij jullie langs moeten komen. 😉

Mijlpaal!

Er is (nog) geen ruchtbaarheid aan gegeven, de vlag is niet in top gegaan, maar deze week zijn we de mijlpaal van 1.000 masterscripties geesteswetenschappen die online beschikbaar zijn in Scripties Online gepasseerd. En dat is een heugelijk feit waar best even bij mag worden stilgestaan en waar een felicitatie aan de betrokken onderwijssecretariaten (die voor de ‘aanvoer’ zorgen)  en bibliotheekmedewerkers (die voor de ‘invoer’ verantwoordelijk zijn) op z’n plaats is. De overstap naar de archivering van digitale versies van masterscripties vereiste een geheel nieuwe workflow, die inmiddels zichzelf bewezen heeft. Het aantal gearchiveerde scripties is in de afgelopen jaren gestaag gestegen en zal voor 2010 opnieuw hoger uitkomen dan in 2009. Uiteraard is dat vooral een consequentie van het feit dat het aantal masterstudenten nog steeds een stijgende trend vertoont (al blijft dat nog wat anders dan het aantal afstuderende masterstudenten), maar ook van het feit dat de digitale beschikbaarstelling ‘normaal’, of misschien beter: de norm, is geworden.

Toch nog een cijfer. Want er zijn meer scripties digitaal gearchiveerd dan er nu vrij beschikbaar worden gesteld. Naast die 1.000+ die nu online staan en voor iedereen raadpleegbaar, zitten er nog eens 300+ scripties in het archief die dat niet zijn. Aan elke student wordt namelijk bij het inleveren van de scriptie via een standaard-formulier gevraagd of de scriptie online beschikbaar gesteld mag worden door de bibliotheek of dat de student daar geen toestemming voor geeft. In het laatste geval zijn er twee opties: er wordt een embargo van één kalenderjaar op de scriptie gezet of de scriptie wordt in het geheel niet openbaar gemaakt. Voor dat laatste kunnen allerlei redenen zijn (waar overigens niet om gevraagd wordt): van het ontbreken van toestemming voor het beeldmateriaal dat in de scriptie gebruikt is tot het bezig zijn met een subsidie-aanvraag voor NWO of het voorbereiden van een artikel over hetzelfde onderwerp. Deze scripties zitten dus wel in het digitale archief, maar zijn niet zichtbaar, ook niet de metadata.

En dat is toch jammer. Want het percentage scripties dat op deze wijze onzichtbaar blijft voor de buitenwereld is aanzienlijk, terwijl Scripties Online niet alleen voor de verschillende masteropleidingen maar ook voor de masterstudenten zelf een prachtig uithangbord kan zijn. Dat wordt o.m. bewezen door de afgestudeerde masterstudenten die zich spontaan zelf melden, ondanks de goede workflow verdrietige, met de vraag of hun scriptie alsnog opgenomen kan worden. Daar moeten we dus toch nog iets voor verzinnen en wat dat betreft was de actie tijdens de Open Access-week gericht op studenten helemaal op z’n plaats. Open Access begint bij de auteur en bij (master-)scripties bij de student.

Brewster Kahle

Bij al het geweld dat Google met Google Book Search over ons uitstort, vergeten we nog wel eens dat Google’s voorganger op het gebied van massadigitalisering, Brewster Kahle’s Internet Archive, stug doorgaat op de in 1996 ingeslagen weg. In FLYP, een multimediaal internet magazine, gaat Kahle in woord en beeld in op de afzonderlijke onderdelen van zijn archiveringswerkzaamheden, van het digitaliseren van copyright-vrij gedrukt materiaal (inmiddels zo’n 500.000 titels op basis van een produktie van 25.000 titels per maand) tot het archiveren en ontsluiten van websites via de wereldberoemde Wayback Machine.

Bij Kahle niet zoals bij Google geheimzinnigheid over het digitaliseringsproces (het artikel biedt o.m. een filmpje van de gebruikte scanapparatuur) of de kosten van het digitaliseren. Tien dollarcent per pagina is Kahle momenteel kwijt aan het digitaliseren en voor zijn activiteiten is hij bijna volledig aangewezen op donaties van filantropische instellingen. Eenmaal gedigitaliseerd biedt Kahle’s Internet Archive de mogelijkheid tot het weer laten drukken van gedigitaliseerde versies van boeken via de Espresso Book Machine tegen de prijs van één dollarcent per pagina. Google komt in het hele artikel slechts een keer ter sprake, maar is op de achtergrond natuurlijk constant aanwezig. En Kahle kan het natuurlijk niet laten om af en toe een steek onder water richting Mountain View te geven. Maar ach, daar kunnen ze wel tegen een stootje.

Ondertussen bij de HathiTrust (en elders)

Ondertussen werkt men bij de HathiTrust rustig door aan het eigen digitale archief, dat in een paar weken tijd van 80 TeraByte met bijna 10% gegroeid is naar 87 TB. En waar nu ook de beta-versie van een eigen zoekmachine beschikbaar wordt gesteld voor het fulltext doorzoeken van het archief. Voor een testbestand waarin ca. 20% van het aantal nu gearchiveerde werken is opgenomen, biedt één zoekboxje (wie durft tegenwoordig nog anders?) toegang tot de volledig geindexeerde werken. Nog geen clustering van zoekresultaten en andere additionele zoekfaciliteiten, maar die worden ons voor de nabije toekomst nadrukkelijk in het vooruitzicht gesteld.

En nog een nieuwe zoekmachine zit eraan te komen: OCLC stelt ons, in samenwerking met Syracuse University en de University of Washington Reference Extract in het vooruitzicht:
Reference Extract is envisioned as a web search engine, like Google, Yahoo and MSN. However, unlike other search engines, Reference Extracts will be built for maximum credibility by relying on the expertise and credibility judgments of librarians from around the globe. Users will enter a search term and get results weighted towards sites most often referred to by librarians at institutions such as the Library of Congress, the University of Washington, the State of Maryland, and over 1,400 libraries worldwide.
Wie kan daar bezwaar tegen hebben?

Tot slot, een nieuwe handreiking voor de Google Book Search-overeenkomst. De American Library Association en de Association of Research Libraries hebben samen, onder de titel A Guide for the Perplexed, een studie van Jonathan Band over de consequenties voor bibliotheken gepubliceerd. Handig en overzichtelijk.

Scripties Online

Even de huidige stand van zaken m.b.t. Scripties Online bekeken. Niet omdat dat nu zo’n ontzettend innovatieve, nieuwe dienst is, maar omdat het toch redelijk langdurig overleg heeft gekost met de faculteit der Geesteswetenschappen voordat we deze stap konden maken. Bij andere faculteiten is dat veel sneller gegaan (maar in een enkel geval ook nog niet; geesteswetenschappen loopt niet helemaal achteraan). Afgesproken is dat alle masterscripties voortaan niet meer in papieren vorm in de bibliotheek beschikbaar worden gesteld, maar digitaal worden gearchiveerd en, met toestemming van de auteur, openbaar worden gemaakt voor raadpleging via het web. Vervolgens was het natuurlijk ook noodzakelijk een zodanig workflow af te spreken dat de scripties zo snel als mogelijk beschikbaar komen. Op dat vlak kunnen we nog wel wat winst boeken, maar de eerste resultaten zijn er nu inmiddels wel.

In de afgelopen maanden zijn 146 scripties aangeboden voor opname in Scripties Online. Een aanzienlijk gedeelte daarvan, nl. 31, zit vooralsnog achter slot en grendel en is dus niet zichtbaar voor de buitenwereld (maar bijvoorbeeld wel door de faculteit te gebruiken voor onderwijsvisitaties). Een veel kleiner percentage (10%)  zit één jaar achter slot en grendel, bijvoorbeeld omdat de desbetreffende student nog bezig is met een publicatie die voortvloeit uit zijn scriptie.  Deze scripties zijn al wel zichtbaar in Scripties Online met vermelding van de datum waarop de full text ook beschikbaar komt. 101 Masterscripties uit 2008 zijn op dit moment al wel publiek toegankelijk, mooi verdeeld over een breed palet van facultaire masteropleidingen: van Italiaanse taal en cultuur tot Preservation and presentation of the moving image, van archiefwetenschap tot wijsbegeerte. Het begin is er dus; nu ervoor zorgen dat de stroom gestaag blijft toenemen. Met een instroom van ruim 700 masterstudenten in 2007 (bijna 15% meer dan het jaar ervoor; cijfers voor 2008 zijn helaas nog niet bekend) moet dat gaan lukken.