PADICAT: arxivant la Internet catalana

PADICAT: arxivant la Internet catalana

Resum: 

La Biblioteca de Catalunya i el Centre de Supercomputació de Catalunya presenten una nova eina per generar arxius web en el marc del International Internet Preservation Consortium meeting Viena 2010

Membres de la Biblioteca de Catalunya, coordinadora del projecte PADICAT, i del Centre de Supercomputació de Catalunya (CESCA), col·laborador tecnològic, porten desenvolupant des del any 2005 una nova eina de programari lliure que permetrà millorar la manera de com arxivar el web.

L'objectiu d'aquest projecte és el de capturar, processar i donar accés permanent al patrimoni digital de Catalunya: recollint tota producció cultural, científica o de caràcter general produïda en format digital i publicada a Internet. Per realitzar l'elaboració d'aquest arxiu han desenvolupat una eina de programari lliure amb la que es realitza la captura, l'emmagatzematge, la categorització i l'accés a les diferents versions: el CAT (del anglès, Curator Archiving Tool)

Ja hi ha diverses eines que realitzen aquesta funció (com per exemple Internet Archive), però el CAT aporta certes millores:

  • permet la cerca per url (per adreça web) com altres eines existents

  • permet, a la vegada, la cerca per directoris temàtics

  • i permet la cerca a través de paraules clau

Per fer això, la eina permet afegir el contingut de diverses maneres:

  • compilant massivament els recursos digitals publicats en obert sota dominis .cat

  • creant dipòsits específics realitats en conveni amb entitats catalanes

  • integrant recursos digitals de determinats esdeveniments de la vida pública catalana

Aquesta eina combina la indexació automàtica de continguts amb la catalogació manual, permetent una millora en la identificació de categories temàtiques concretes.

Un espai que ens permetrà preservar la nostra Internet per a generacions futures... hi vols formar part?

Etiquetes: 

Afegeix un comentari nou