sábado, 8 de abril de 2006

A volatilidade dos endereços Web




Fonte: Agência FAPESP <http://www.fapesp.br/agencia/boletim_dentro.php?data[id_materia_boletim]=1653>
Data: 15 abril 2004
Dos milhares de artigos publicados anualmente em revistas científicas de todo o mundo, grande parte ganha, além da versão em papel, um espaço na internet. Com a popularização da rede mundial de computadores, muitos são inclusive publicados apenas na versão eletrônica. Até aí, nenhuma novidade.O problema é que essa inclusão digital não significa permanência – e muito menos perenidade.Um estudo feito pelo norte-americano Jonathan Wren, do Centro Avançado deTecnologia Genômica da Universidade de Oklahoma <http://www.genome.gov/>,mostrou que grande parte dos artigos publicados na internet acabam em um limbo digital e os endereços onde deveriam estar retornam apenas as infamesmensagens de "página não encontrada" no programa de navegação.Após longa análise, Wren descobriu que, por exemplo, quase um quinto de todos os endereços mencionados na última década em resumos do Medline<http://medline.cos.com/>,um serviço do governo norte-americano extremamente popular entre a comunidade científica, simplesmente desapareceu. Segundo a Nature<http://www.nature.com/>,Wren decidiu investigar o problema depois que encontrou um endereço não existente mencionado no Medline para um dos artigos que escreveu.
Outro cientista preocupado com o problema é Robert Dellavalle, da Faculdadede Dermatologia da Universidade do Colorado <http://www.colostate.edu/> que,em outra pesquisa, verificou que cerca de 12% dos endereços de internet mencionados nos periódicos The New England Journal ofMedicine, The Journal of the American Medical Association e Science depareceram apenas dois anos após a publicação. Dellavalle sugere o desenvolvimento de sistemas aprimorados de catalogação eletrônica, pois considera "inadequada" a resposta das editoras ao problema.
"Os periódicos não estão fazendo coisa alguma para amenizar a situação. É impressionante o que tem desaparecido. Até mesmo um artigo que escrevi sobre preservação digital não se encontra mais onde deveria estar", disse à Nature. O pesquisador da Universidade do Colorado acredita que, se os responsáveis pelas publicações solicitassem aos autores o envio das referências do artigo ao Internet Archive <http://www.archive.org/>, um projeto da Biblioteca do Congresso dos Estados Unidos, além de manter cópias escritas do trabalho, o problema poderia diminuir. Pelo menos um periódico, o PLoS Biology<http://biology.plosjournals.org/>está pedindo aos autores para usarem o Internet Archive. Enquanto isso, outros editores estão trabalhando em uma iniciativa chamada CrossRef <http://www.crossref.org/>, que pretende fornecer códigos numéricos permanentes para documentos eletrônicos, de modo que eles não se percam, mesmo com a mudança dos endereços de internet.

4 Comentários:

Fernando_Vilarinho on 10 abril, 2006 disse...

Problema muito complexo, mesmo! Encontro amiúde posts que escrevi em foruns, listas, websites e até + recente em blogs com hiperligações quebradas ou redireccionadas. E o máximo que têm é de uns sete, oito anos. Imagino daqui a 30 anos se metade ainda está correcto! E eu que coloco sempre um exagero de hiperligações ! Vale a pena?

Murilo Cunha on 10 abril, 2006 disse...

Fernando:
Não precisa esperar 30 anos! Comenta-se que a vida média de uma págin web é de 70 dias! Assim, se não houver uma preservação digital séria haverá um "vazio" na memória mundial. Precisamos divulgar mais esse problema, ainda não percebido pela maioria dos usuários da Internet.

Anónimo disse...

Conscientes de que esta é uma questão de importância maior na troca de informação e seu posterior acesso, convém não esquecermos que esta mesma questão deve ser transposta para a informação produzida por instituições, apenas em suporte digital como é cada vez mais "moda", sem se questionar a duração da mesma. Que valor damos ao que produzimos???

Marisa

Filipe Correia on 11 abril, 2006 disse...

Seja física ou digital, a forma de suporte da informação tem de ser preservada se se pretender preservar a própria informação. A única diferença entre estes dois casos é que implicam acções de preservação distintas.

A informação em suporte digital tem, a meu ver, um potencial muito maior de preservação. A título de exemplo, informações em suporte digital podem ser sujeitas a várias cópias de segurança, cada uma delas armazenada em num local e condições distintas das restantes.

Pensando na Web, o que acontece é que a responsabilidade de preservação da informação tende a ficar do lado de quem pode vir a ter interesse nela, que não é necessariamente o seu produtor.

Arquivo

Categorias