Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
Clioweb, le blog
27 octobre 2016

Internet Archive a 20 ans

 

 wayback

WayBack Machine : http://web.archive.org
http://web.archive.org/web/*/http://clioweb.free.fr



« Vingt ans d’archivage du Web : les coulisses d’un projet titanesque - Le Monde  26.10.2016
http://www.lemonde.fr/pixels/article/2016/10/26/vingt-ans-d-archivage-du-web

En 1996, l’Américain Brewster Kahle lance la fondation Internet Archive. Il développe un « crawler », un programme capable de naviguer automatiquement sur des sites et de stocker des copies des pages Web visitées. 
En 2001, la Wayback Machine, permet aux internautes de parcourir ces vastes archives à distance.
Aujourd’hui, la fondation héberge aujourd’hui plus 460 milliards de fichiers Web, 8 millions de livres, 2 millions de films, des images et des fichiers audios. les serveurs sont installés à San Francisco.
Un International Internet Preservation Consortium a l'ambition d'harmoniser les manières d'archiver le web.

L’article évoque les choix politiques (dont droit d'auteur) et techniques (archiver les medias sociaux ?)
ainsi que le rôle de la BNF en France.


BrewsterKahle2009

http://en.wikipedia.org/wiki/Brewster_Kahle

TED dec 2007 - Brewster Kahle is building a truly huge digital library
- every book ever published, every movie ever released, all the strata of web history ...
It's all free to the public - unless someone else gets to it first.
http://www.ted.com/talks/brewster_kahle_builds_a_free_digital_library

 


Internet Archive, Wikipedia : « Brewster Kahle founded the Archive in 1996 at around the same time that he began the for-profit web crawling company Alexa Internet. In October 1996, the Internet Archive had begun to archive and preserve the World Wide Web. The archived content wasn't available to the general public until 2001, when it developed the Wayback Machine.
In late 1999, the Archive expanded its collections beyond the Web archive, beginning with the Prelinger Archives. Now the Internet Archive includes texts, audio, moving images, and software. It hosts a number of other projects: the NASA Images Archive, the contract crawling service Archive-It, and the wiki-editable library catalog and book information site Open Library.

In August 2012, the Archive announced that it has added BitTorrent to its file download options for over 1.3 million existing files, and all newly uploaded files. This method is the fastest means of downloading media from the Archive, as files are served from two Archive data centers »

http://en.wikipedia.org/wiki/Internet_Archive
http://fr.wikipedia.org/wiki/Internet_Archive



materiaux79

 Une partie des enjeux liés à l'archivage numérique a été abordée dès 2005 dans un dossier de la revue
Matériaux pour l'histoire de notre temps - BDIC, Juillet-Septembre 2005 - N°79 12.00 €
Internet et mouvements sociaux : nouvelles pratiques militantes, nouvelles sources pour l’histoire.
sommaire :
http://clioweb.canalblog.com/archives/2014/12/19/31166982.html

 

.

Publicité
Publicité
Commentaires
F
Super, merci !
Répondre
Clioweb, le blog
Publicité
Archives
Publicité