Archive for the ‘Internet Archive’ Tag

TWIT #27

TWIT

Advertenties

TWIT #23

TWIT

TWIT #19

TWIT

Het aanbod ligt er…

Uit een interview met Brewster Kahle:

What are the challenges faced by the Internet Archive regarding the digitization of books?

There are two big problems: there is going and building a digital collection, either by digitizing materials or buying electronic books. And the other is: how do you make this available, especially the in-copyright works? For digitizing books, it costs about 10 cents a page to do a beautiful rendition of a book. So, for approximately 30 dollars a book for 300 pages you can do a gorgeous job. Google does it much more quickly and it costs only about 5 dollars for each book. So it really is much less expensive in less quality, but they are able to do things at scale. We digitize about 1000 books every day in 23 scanning centers in six countries. We will set up scanning centers anywhere, or, if there are people that would like to staff the scanners themselves, we provide the scanners and all of the backend processing for free, until we run out of scanners and we’ve got a bunch of them. So we’re looking either for people that want to scan their own collections by providing there own labour or they can employ us to do it and all told it is 10 cent a page to complete. (…)

Are there already cooperations between European libraries and the Internet Archive, and are scanners already located in Europe which could be used for digitization projects in university or national libraries?

Yes, we have scanners now in London and in Edinburgh – the Natural History Museum and the national library – where we are digitizing now. We would like to have more scanners in more places so that anybody that would be willing to staff one, keep it busy for 40 hours each week, we will provide all of the technology for free or we can go and cooperate and we can hire the people and operate these scanning centers. We find that scanning centers – i.e. 10 scanners – can scan 30.000 books in a year and it costs about 10 cents a page. It is very efficient and very high quality. This is including fold outs and difficult materials as well. And it is working right within the libraries, so the librarians have real access to how the whole process is going and what is digitized. It is really up to the libraries. The idea is to get the libraries online as quickly as possible and without the restrictions that come with corporations. (…)

You mentioned Google Books. There are agreements between libraries and Google for digitizing materials. What are the benefits for libraries of choosing the Internet Archive over Google Books?

Google offers to cover the costs of the labor to do the digitization, but the libraries that participated ended up paying a very large amount of money just trying to prepare the books and get them to Google. Often they spent more working with Google than they would have with the Internet Archive, and in the latter case they do not have restrictions on their materials. So Google digitizes even public domain materials and then puts restrictions on their re-use. Everybody that says that it is open has got to mean something bizarre by ‘open’. You can not go and take hundreds of these and move them to another server, it is against the law and Google will stop libraries that try to make these available to people and moving the books from place to place, so this is quite unfortunate.

Waar wachten we nog op?

Weekoogst #58

One for All and All for One?

Deze verzuchting van collega Lukas Koster bekruipt je af en toe ook als je de Nederlandse discussie over de gemeenschappelijke informatie infrastructuur (GII) volgt en de moeizame verhouding daarbinnen tussen openbare bibliotheken enerzijds, universiteitsbibliotheken anderzijds en de Koninklijke Bibliotheek die hierin een geheel eigen koers probeert te varen. En je ziet die tweedeling ook terugkeren in de actuele discussie in de VS over Robert Darntons idee van een Digital Public Library of America (DPLA). Deze heeft namelijk al aanleiding gegeven tot twee nieuwe acroniemen, de SDLA en de NDLA. De Scientific Digital Library of America voor de wetenschappelijke wereld en de National Digital Library of America voor de openbare bibliotheken. Sommigen in de discussie zien die scheiding met leedwezen aan en pleiten, zoals Karen Coyle, hartstochtelijk voor een ‘One for All and All for One’. De belangen lopen echter voor de veschillende doelgroepen niet voor de volle 100% parallel en dat maakt een gezamenlijk optrekken er niet eenvoudiger op. In de VS net zo min als in Nederland.

Het Spitsbergen-archief
Brewster Kahle’s Internet Archive richt zich niet meer alleen op het archiveren van het wereldwijde web en het digitaliseren van gedrukt materiaal, maar heeft zich nu ook de ambitie gesteld eenmaal gedigitaliseerde boeken voor de eeuwigheid in hun fysieke staat te bewaren. Op dit moment denkt Kahle aan een opslagfaciliteit voor ca. 10 miljoen boeken die netjes verpakt in verhuisdozen in aangepaste scheepscontainers worden opgeslagen in Richmond, California.

shipping containers

In een uitvoerige toelichting op het waarom van deze activiteit verwijst Kahle naar de Wereldzaadbank op Spitsbergen: “A seed bank might be conceptually closest to what we have in mind: storing important objects in safe ways to be used for redundancy, authority, and in case of catastrophe.” Mooi initiatief. Donaties, zowel van boeken als van geld, zijn overigens van harte welkom!

Espresso on the move
Nederland beschikt inmiddels, als enige land op het Europese continent, over twee Espresso Book Machines, met dank aan het American Book Center. Elders in Europa is de markt er blijkbaar nog niet rijp voor. Een indicatie voor hoe het met de acceptatie en penetratie van e-books staat? Wellicht.

Elders in de wereld groeit het aantal EBMs langzaam maar gestaag, zowel bij universiteitsbibliotheken en -boekwinkels als in het reguliere boekhandelcircuit, maar een echte verkoophit lijkt het nog niet te zijn.

Small is Beautiful (en makkelijk)

De KB heeft het als ambitie voor de komende twee decennia geformuleerd: alle gedrukte werken van Nederlandse bodem vanaf 1470 digitaliseren. Als er maar voldoende geld beschikbaar gesteld wordt, moet dat doel in 2030 bereikt kunnen worden. IJsland gaat het gewoon doen. Althans als het aan Brewster Kahle van The Internet Archive ligt. Op het IA blog bericht hij over zijn gesprekken met de IJslandse minister van Cultuur, de bibliothecaris van de IJslandse nationale bibliotheek en anderen over de mogelijkheden om binnen twee jaar de volledige IJslandse boekenproduktie van ca. 50.000 banden, van het allereerste begin tot vandaag, te digitaliseren en voor iedereen vrij beschikbaar te stellen. “A digital lending system could be a way that they decide to limit access to a book to one person at a time in order to balance the interests of the writers and publishers while still having some access to everything from anywhere forever for free.”

Aardig is de berekening die Kahle er bij geeft: voor die 50.000 banden (peanuts, zou je toch zeggen) denkt hij 2 jaar nodig te hebben als er 12 scanners tegelijkertijd ingezet worden. Dat is, omgerekend, ruim 2.000 banden per scanner per jaar. Wedden dat Google dat sneller doet. 😉

Brewster Kahle

Bij al het geweld dat Google met Google Book Search over ons uitstort, vergeten we nog wel eens dat Google’s voorganger op het gebied van massadigitalisering, Brewster Kahle’s Internet Archive, stug doorgaat op de in 1996 ingeslagen weg. In FLYP, een multimediaal internet magazine, gaat Kahle in woord en beeld in op de afzonderlijke onderdelen van zijn archiveringswerkzaamheden, van het digitaliseren van copyright-vrij gedrukt materiaal (inmiddels zo’n 500.000 titels op basis van een produktie van 25.000 titels per maand) tot het archiveren en ontsluiten van websites via de wereldberoemde Wayback Machine.

Bij Kahle niet zoals bij Google geheimzinnigheid over het digitaliseringsproces (het artikel biedt o.m. een filmpje van de gebruikte scanapparatuur) of de kosten van het digitaliseren. Tien dollarcent per pagina is Kahle momenteel kwijt aan het digitaliseren en voor zijn activiteiten is hij bijna volledig aangewezen op donaties van filantropische instellingen. Eenmaal gedigitaliseerd biedt Kahle’s Internet Archive de mogelijkheid tot het weer laten drukken van gedigitaliseerde versies van boeken via de Espresso Book Machine tegen de prijs van één dollarcent per pagina. Google komt in het hele artikel slechts een keer ter sprake, maar is op de achtergrond natuurlijk constant aanwezig. En Kahle kan het natuurlijk niet laten om af en toe een steek onder water richting Mountain View te geven. Maar ach, daar kunnen ze wel tegen een stootje.