Os custos da digitalização do património e a normalização

A digitalização do património cultural é um tema que me interessa muito. Já o tinha abordado, embora sobre diferentes perspectivas, aqui, aqui e aqui. Hoje retomo o tema tendo como pretexto a leitura do excelente artigo de Martin Doerr e de Dominic Oldman, intitulado “The Costs of Cultural Heritage Data Services: The CIDOC CRM or Aggregator formats?“, publicado no blog de Dominic Oldman (que recomendo vivamente). Martin Doerr é um investigador com muita experiência nesta matéria (façam uma pequena pesquisa no google e perceberão) e Dominic Oldman é “Deputy Head of Information Systems” no British Museum e é o investigador principal no projecto Researchspace onde procura desenvolver um ambiente colaborativo de investigação online através da utilização de conjuntos de dados ricos semanticamente. Algo que perceberão melhor depois da leitura deste post (e para os com mais conhecimentos técnicos passarem por aqui) e de assistirem a estes vídeos:

Voltando então ao artigo sobre os custos da digitalização do património e os custos associados, gostava que pudessem reflectir no seguinte excerto do mesmo onde os autores mencionam a necessidade de uma representação do contexto adequada, em substituição da tradicional disponibilização de dados “principais” e descontextualizados sobre os diversos objectos, como datas, medidas, autores, informação de conservação, etc., indo de encontro ao pedido por cada um dos modelos de dados dos agregadores de informação (ver como exemplo o EDM da Europeana).

The institution actually curating content must document it so that it will be not only found, but understood in the future. It therefore needs an adequate [1] representation of the context, content and objects come from and their meaning. This representation already has some disciplinary focus, and ultimately allows for integrating the more specialized author knowledge or lab data. For instance, chronological data curves from a carbon dating (C14) lab should be integrated at a museum level (2) by exact reference to the excavation event and records, but on an aggregator level (3) may be described just by a creation date.

Na opinião dos autores, com a qual eu concordo absolutamente, o custo da digitalização do património cultural poderia ser consideravelmente reduzido, se as instituições que providenciam os dados aos diferentes agregadores (museus, arquivos e bibliotecas) centrassem a sua atenção e esforços na criação de dados de acordo com o definido no CIDOC CRM (ISO 21127:2006). A principal razão para o fazerem prende-se com o facto de o CIDOC CRM possibilitar a definição de uma estrutura semântica de referência que possibilita, segundo os autores, a exportação da informação para qualquer tipo de modelo de dados definido pelos agregadores, tendo como vantagem, no futuro, a possibilidade de criar melhores sistemas de pesquisa e de investigação colaborativa na área do património cultural. Sendo uma possibilidade que nos agradará a todos (imagino eu), esta interessante ideia é concretizada (com as limitações tecnológicas actuais) na ferramenta que os vídeos atrás demonstram, no entanto, a questão principal mantém-se: será que os museus (e já agora os arquivos e bibliotecas) percebem que o trabalho que têm na documentação e gestão das suas colecções pode ser dificilmente reutilizável no futuro, caso não comecem a conhecer e trabalhar de acordo com o definido no CIDOC CRM?

É uma questão importante a ter em conta no planeamento dos projectos de documentação de qualquer colecção, não vos parece? Comentem e partilhem, se acharem o tema interessante.

© imagem: daqui.