Regresso ao passado da Internet

O site norte-americano “Internet Archive Wayback Machine” arquiva há 12 anos páginas web de todo o mundo, inclusive portuguesas. Hoje são mais de 85 mil milhões de sites guardados neste arquivo digital que pretende mostrar a evolução da Internet e preservar a informação online.

Ao aceder ao site encontra-se uma caixa de pesquisa em que se pode escrever o endereço que se quer visitar. “Take me back” (“Leva-me de volta”) é o que diz no botão que nos permite voltar ao passado e ver as versões da página escolhida. Podemos regressar até 1996, ano em que a Internet começava a dar os primeiros passos em Portugal.

(…) A apresentação dos conteúdos aparece com um lapso temporal de seis meses, o que explica ainda não termos acesso ao ano 2008. Revistar as versões antigas dos órgãos de comunicação social, instituições públicas e até blogs é possível com apenas um clique.

Além de permitir aos cibernautas de visitarem versões antigas dos sites, o Internet Archive Wayback Machine permite também estabelecer ligações para páginas que já não estão disponíveis, servindo o próprio endereço para mostrar em data elas foram obtidas.

Os 85 mil milhões de páginas guardadas ocupam 2,5 peta bytes (o equivalente a 3,5 milhões de CD) e o arquivo cresce ao ritmo mensal de 20 tera bytes (o espaço de cerca de 30 mil CD).

Criar uma nova biblioteca de Alexandria

O fundador do Internet Archive declarou à Lusa que pretende, desde 1980, altura em que estudava engenharia, “construir uma grande biblioteca digital”. “A ideia era tentar solucionar um problema: que contributo positivo para o futuro poderíamos dar usando a tecnologia”, contou. A intenção é criar uma segunda versão da Biblioteca de Alexandria, pode ler-se no site.

Outro dos objectivos do arquivo é guardar conteúdos que de outra forma poderiam perder-se na Internet. Para Sérgio Nunes, engenheiro informático da Faculdade de Engenharia da Universidade do Porto, a “preservação da informação” é a maior vantagem do Internet Archive.

Para conseguir organizar a enorme biblioteca digital, o site trabalha directamente com 12 bibliotecas nacionais e 30 bibliotecas de universidades e tem colaboradores na França, Itália, Austrália, Japão e Inglaterra.

O programa utilizado para fazer a recolha é o Alexa Internet, um motor de busca que captura cópias das páginas, excepto se estas estiverem protegidas para a recolha ou tenham uma palavra-passe.

Útil para investigadores e académicos

O Internet Archive Wayback Machine pode ser utilizado por qualquer pessoa mas é especialmente útil para investigadores e académicos que procuram compreender de que forma a rede evoluiu em termos de conteúdos, design, interactividade, entre outros factores. De acordo com o site, a missão do Internet Archive é ajudar a preservar informação e criar uma biblioteca para investigadores, historiadores e estudantes.

“Actualmente o site é muito usado por investigadores e pessoas das áreas sociais que procuram ver a evolução da web”, diz Sérgio Nunes, que é doutorando em Engenharia Informática.

O sítio disponibiliza ainda informações sobre temas específicos, como o furacão Katrina, que atingiu Nova Orleães em 2005, o tsunami no Sudeste Asiático em 2004 ou os atentados terroristas de 11 de Setembro.

in Público


Technorati : , , , ,
Del.icio.us : , , , ,
Ice Rocket : , , , ,

Anúncios

One comment

Deixe uma Resposta

Preencha os seus detalhes abaixo ou clique num ícone para iniciar sessão:

Logótipo da WordPress.com

Está a comentar usando a sua conta WordPress.com Terminar Sessão / Alterar )

Imagem do Twitter

Está a comentar usando a sua conta Twitter Terminar Sessão / Alterar )

Facebook photo

Está a comentar usando a sua conta Facebook Terminar Sessão / Alterar )

Google+ photo

Está a comentar usando a sua conta Google+ Terminar Sessão / Alterar )

Connecting to %s