Soluciones para descargar páginas antiguas Cómo descargar páginas antiguas de Archive.org

Internet cambia muy rápido, y en el camino, perdemos contenido. Los sitios web cambian de aspecto y otros desaparecen o cierran.

Internet Archive es, como indica su propia página principal, “una librería sin ánimo de lucro con millones de libros, películas, programas, música, páginas web y más”, todo ello gratuito.

Gracias a su buscador y a sus decenas de colecciones, encontraremos joyas de ayer y de antes de ayer que han desaparecido de la web, de las tiendas de aplicaciones, de las librerías físicas o de los catálogos multimedia.

En el apartado de contenido web, veremos un calendario con capturas de las páginas más populares, tal y como eran años atrás. Y con las siguientes herramientas podemos descargarlas a nuestro ordenador.

Descargando el pasado de Internet

Hay muchos servicios que nos permiten descargar contenido de Internet Archive, con mayor o menor acierto. El problema es que la mayoría son de pago o tienen ciertas limitaciones, por lo que la manera más efectiva es combinar métodos que hemos visto con anterioridad.

En primer lugar, buscaremos la página que nos interesa directamente en Wayback Machine. Indicamos su dominio principal, y veremos un calendario donde seleccionar la fecha exacta de la que nos interesa obtener una captura.

Una vez cargada la captura que queremos, o snapshot en inglés, podemos guardarla, tal y como hemos visto en el pasado. Una manera sencilla de descargar páginas antiguas.

Por un lado, es posible descargar la página en forma de un HTML único mediante la extensión SingleFile, disponible para Firefox, Chrome, Edge y Opera.

Otra posibilidad es emplear herramientas como WebCopier, que permite descargar todo el contenido de la página en cuestión, incluyendo imágenes, scripts, archivos CSS y HTML…

Parecido a WebCopier, podemos emplear la extensión o complemento Web ScrapBookpara Chrome y Firefox, que sirve para descargar una página web en formato HTML único o en archivo ZIP que engloba todo el contenido.

Darcy Ripper es otra herramienta, para Windows, Mac y Linux gracias a que está programada en Java.

Indicando el enlace de la página en cuestión, en nuestro caso, la URL que hemos obtenido con Wayback Machine, Darcy Ripper, analizará y descargará todo el contenido que encuentre, ya sean archivos HTML, JavaScript, CSS, imágenes, etc.

Guardando ese contenido descargado en una carpeta, respetando las subcarpetas descargadas, podremos abrir la página en el navegador.

Como último recurso, manualmente es posible descargar una página desde el navegador. Desde el Archivo > Guardar página o similar, podremos guardar la dirección que tengamos abierta junto con todo el contenido por separado, en este caso, una página guardada en Wayback Machine.

Soluciones para descargar páginas antiguas

Descargando el pasado de Internet

Sobre el autor

José María López

RELACIONADOS

El discípulo quiere comprar al maestro: la opa de Stripe por PayPal

Cómo internet se está blindando ante la inminente revolución cuántica

La desaparición del formato físico: tenemos todo y nada a la vez.

La biblioteca en tu bolsillo: cómo leer libros electrónicos gratis en España