Archive for the ‘Brewster Kahle’ Tag

TWIT #13



Het aanbod ligt er…

Uit een interview met Brewster Kahle:

What are the challenges faced by the Internet Archive regarding the digitization of books?

There are two big problems: there is going and building a digital collection, either by digitizing materials or buying electronic books. And the other is: how do you make this available, especially the in-copyright works? For digitizing books, it costs about 10 cents a page to do a beautiful rendition of a book. So, for approximately 30 dollars a book for 300 pages you can do a gorgeous job. Google does it much more quickly and it costs only about 5 dollars for each book. So it really is much less expensive in less quality, but they are able to do things at scale. We digitize about 1000 books every day in 23 scanning centers in six countries. We will set up scanning centers anywhere, or, if there are people that would like to staff the scanners themselves, we provide the scanners and all of the backend processing for free, until we run out of scanners and we’ve got a bunch of them. So we’re looking either for people that want to scan their own collections by providing there own labour or they can employ us to do it and all told it is 10 cent a page to complete. (…)

Are there already cooperations between European libraries and the Internet Archive, and are scanners already located in Europe which could be used for digitization projects in university or national libraries?

Yes, we have scanners now in London and in Edinburgh – the Natural History Museum and the national library – where we are digitizing now. We would like to have more scanners in more places so that anybody that would be willing to staff one, keep it busy for 40 hours each week, we will provide all of the technology for free or we can go and cooperate and we can hire the people and operate these scanning centers. We find that scanning centers – i.e. 10 scanners – can scan 30.000 books in a year and it costs about 10 cents a page. It is very efficient and very high quality. This is including fold outs and difficult materials as well. And it is working right within the libraries, so the librarians have real access to how the whole process is going and what is digitized. It is really up to the libraries. The idea is to get the libraries online as quickly as possible and without the restrictions that come with corporations. (…)

You mentioned Google Books. There are agreements between libraries and Google for digitizing materials. What are the benefits for libraries of choosing the Internet Archive over Google Books?

Google offers to cover the costs of the labor to do the digitization, but the libraries that participated ended up paying a very large amount of money just trying to prepare the books and get them to Google. Often they spent more working with Google than they would have with the Internet Archive, and in the latter case they do not have restrictions on their materials. So Google digitizes even public domain materials and then puts restrictions on their re-use. Everybody that says that it is open has got to mean something bizarre by ‘open’. You can not go and take hundreds of these and move them to another server, it is against the law and Google will stop libraries that try to make these available to people and moving the books from place to place, so this is quite unfortunate.

Waar wachten we nog op?

Weekendvitaminen #16

Op het nachtkastje

Beeld van de week

Het is een prachtig beeld: een wat gedrongen, kleinere man voor een batterij scheepscontainers. Brewster Kahle, grondlegger en drijvende kracht achter het Internet Archive en de Wayback Machine, inspecteert zijn papieren archief ergens buiten San Francisco. Kahle wil niet langer alleen het internet archiveren, maar wil er tevens voor gaan zorgen dat het gedrukte boek tot in de eeuwigheid bewaard en raadpleegbaar blijft. En dus vult hij momenteel zeecontainer na zeecontainer met afgeschreven en afgedankte boeken, elke week 20.000 verse banden. ‘One copy in one institution is not good enough’, volgens Kahle. En dus verwacht hij in de komende jaren een groei van nu 500.000 banden naar 10 miljoen banden (terwijl Google naar het schijnt inmiddels de 20 miljoen gescande boeken is gepasseerd). En is hij inmiddels ook al met de opslag van films begonnen.

Brewster Kahle

Bij al het geweld dat Google met Google Book Search over ons uitstort, vergeten we nog wel eens dat Google’s voorganger op het gebied van massadigitalisering, Brewster Kahle’s Internet Archive, stug doorgaat op de in 1996 ingeslagen weg. In FLYP, een multimediaal internet magazine, gaat Kahle in woord en beeld in op de afzonderlijke onderdelen van zijn archiveringswerkzaamheden, van het digitaliseren van copyright-vrij gedrukt materiaal (inmiddels zo’n 500.000 titels op basis van een produktie van 25.000 titels per maand) tot het archiveren en ontsluiten van websites via de wereldberoemde Wayback Machine.

Bij Kahle niet zoals bij Google geheimzinnigheid over het digitaliseringsproces (het artikel biedt o.m. een filmpje van de gebruikte scanapparatuur) of de kosten van het digitaliseren. Tien dollarcent per pagina is Kahle momenteel kwijt aan het digitaliseren en voor zijn activiteiten is hij bijna volledig aangewezen op donaties van filantropische instellingen. Eenmaal gedigitaliseerd biedt Kahle’s Internet Archive de mogelijkheid tot het weer laten drukken van gedigitaliseerde versies van boeken via de Espresso Book Machine tegen de prijs van één dollarcent per pagina. Google komt in het hele artikel slechts een keer ter sprake, maar is op de achtergrond natuurlijk constant aanwezig. En Kahle kan het natuurlijk niet laten om af en toe een steek onder water richting Mountain View te geven. Maar ach, daar kunnen ze wel tegen een stootje.