O mistério dos “números em falta” e outras histórias em torno do identificador único* – Maria José Almeida

Quem nunca ouviu falar em “números em falta”? Eu não vos vejo, mas imagino que se pedisse que levantasse o braço quem nunca ouviu falar desta coisa veria… muito poucos, se não mesmo nenhum braço levantado. Todos já nos deparamos com alguém muito aflito porque “faltam números de inventário!”, porque “há um salto do 103 para o 109!”

O que são estes misteriosos “números em falta”? São, muito singela e matematicamente, quebras numa sequência de números naturais. E, tradicionalmente, o identificador único dos objectos nos museus é expresso por um número natural, atribuído sequencialmente. Mesmo quando o “número de inventário” não é um número (e isso dava outro texto neste blog), há sempre uma parte, ou partes, da codificação que são conjuntos de algarismos e espera-se que esses respeitem a sequência dos números naturais.

Porquê? Porque a forma mais simples, e consequentemente mais eficaz, de atribuir um identificador único a qualquer coisa é usar um número. Um número é inequívoco, nunca se acabam os números. E a sequência natural dos números, nem podia ser de outra forma, é a sequência dos números naturais. Podia ser a sequência de números primos ou a sequência de Fibonacci? Podia, mas não dava tanto jeito.

Quando os inventários eram feitos em fichas de papel, arrumadas em caixas, os mecanismos de controlo para assegurar que o identificador único fosse, de facto, único, eram complexos e exigiam bastante esforço. O menos mau deles todos era a verificação das sequências: a identificação de “números repetidos” e “números em falta” podia indicar a existência de erros e era um bom alerta para ir verificar o conteúdo das fichas em causa. Também servia para saber que entre x e y tinha havido instruções para que se registasse de uma maneira aquilo que de z a w foi registado de outra, e por aí fora. Claro que não era infalível e dependia muito da capacidade e memória de quem fazia estas verificações. Por exemplo, eu sou péssima nesse tipo de tarefas: sou capaz de ver o número de inventário de um objecto na secretária, levantar-me para o ir buscar e, quando chego à estante ou vitrina, já não faço ideia qual é. Mas a D.ª Margarida, funcionária do Museu Nacional de Arqueologia que conheci no século passado, era excelente: sabia de cor onde havia quebras nas sequências de números de inventário, o que é que significavam, e ainda tinha sempre uma história pitoresca para contar sobre o assunto.

Como o mundo tem mais pessoas como eu do que como a D.ª Margarida, e existem outras pessoas extraordinárias que desenvolvem soluções para os nossos problemas, a tecnologia de registo e tratamento da informação evoluiu e é nossa amiga. É tão amiga que hoje em dia é banal em qualquer aplicação ter mecanismos que atribuem automaticamente identificadores únicos que são, garantidamente, únicos.  Isto impede a repetição de números, mas não impede as quebras na sequência: se um registo é apagado, o número único que ele usava – porque é irrepetível – fica “em falta”. Isso não é um problema, mas a maioria dos utilizadores reage como se fosse. Deve haver uma explicação neurolinguística qualquer para este incómodo causado pelas quebras de sequência. Com a quantidade de gente a sugerir soluções para identificar essas quebras no identificador único em bases de dados, deve ser um sentimento comum.

Neurolinguística à parte, perde-se muito tempo com isto dos “números em falta”. Em tempos trabalhei num local onde havia um complexo esquema de identificação e redistribuição de “números vagos”: escusado será dizer que isso contribuía para a confusão total, para a multiplicação e reprodução caótica de erros, com os (infelizmente) habituais gritos dos (ir)responsáveis. O problema é que, associada ao “mistério dos números em falta”, costuma andar a “fobia da informação eliminada”.

Sim, é verdade. As quebras de sequência resultam de registos que foram apagados. E…?

Há um sem número de razões legítimas para apagar registos e, se vamos documentar todas as eliminações, perdemos muito tempo precioso. Valerá mesmo a pena fixar para o futuro a informação de que um registo foi apagado porque o utilizador o criou por engano? Ou para fazer testes? Não será melhor preocuparmo-nos antes se todos os registos descrevem da melhor maneira os objectos a que se referem ou se todos os objectos que temos à nossa guarda têm registo? A continuidade da sequência de números de inventário não garante nada disso. Podemos ter uma sequência “perfeita” de números de inventário mas de que é que isso nos serve, por exemplo, se nas respectivas fichas não há qualquer tipo de informação que nos permita encontrar os objectos no museu? Quando descobrirmos que foram roubados ou estão podres porque se encontram armazenados da forma errada, a integridade da sequência de inventário será certamente um fraco consolo.

Aqui já não há neurolinguística que nos valha. Aqui o problema é mesmo cultural: substituímos muitas vezes rigor por mesquinhez. A “fobia da informação eliminada”, da qual os “números em falta” são um sinal exterior, é a vontade de apontar o dedo ao erro alheio. Há quem diga que isso é uma herança da nossa longa ditadura, há quem diga que isso tem a ver com a matriz católica do pecado e da culpa. Mas eu percebo tanto disso como de neurolinguística… O que sei é de muita hora de trabalho desperdiçada a procurar e justificar os “números em falta”!

Não faço ideia como é que isto se resolve. Mas, se é expectável que haja sempre alguém que faça dos “números em falta” um problema, que tal quebrarmos a tradição do identificador único ser uma sequência de números naturais? Também não vale a pena usar a sequência de números primos, a de Fibonacci ou outra qualquer sequência infinita: haverá sempre um doido que usa uma folha de cálculo e umas fórmulas e vai dizer que também aí há “números em falta”. A minha proposta é mesmo que não seja uma sequência. O identificador único é um número atribuído aleatoriamente, irrepetível. Isso é difícil, engenheiros que me leem? (vamos acreditar que há uns quantos leitores deste blog que o são). É que se não for (ou mesmo que seja, o desafio da tecnologia é esse mesmo: resolver problemas independentemente do grau de dificuldade), talvez isso ajudasse a quebrar o enguiço. Aos poucos, os utilizadores de bases de dados deixavam de esperar que o número de inventário fosse “seguinte” ou “anterior”. Era só (?) um identificador único. Com tanta relevância para o conteúdo da ficha como o número das notas para as compras que fazemos.

* O título parafraseia o livro de Jorge Buescu O mistério do BI e outras histórias : crónicas das fronteiras da Ciência , cuja leitura se recomenda vivamente; o texto que dá nome ao livro pode ser lido integralmente aqui.

© Imagem daqui.

 Maria José de Almeida

Maria José de Almeida é licenciada História, variante Arqueologia, pela Universidade de Lisboa, tendo obtido o grau de mestre em Arqueologia Romana na Universidade de Coimbra. Actualmente integra o programa de Doutoramento em Arqueologia e Pré-história da Universidade de Lisboa, na especialidade de Arqueologia. É autora de vários artigos publicados sobre a temática da ocupação romana no território de Augusta Emerita. Entre 1996 e 2002 trabalhou no município de Santarém, desenvolvendo acções de arqueologia urbana em núcleos históricos. Foi responsável pela primeira fase da Carta Arqueológica de Santarém e pela organização da Reserva Municipal de Bens Arqueológicos. Foi comissária da exposição temporária De Scallabis a Santarém (MNA, 2002). Desde 2003 exerce funções na Câmara Municipal de Cascais, onde implementou o Sistema de Informação dos Museus de Cascais e coordenou a elaboração do respectivo Manual de Procedimentos. Ainda em Cascais, dirigiu o Gabinete de Arqueologia e, actualmente, desempenha funções na Divisão de Ordenamento do Território, tendo coordenado a integração do referido sistema de informação com a plataforma SIG da autarquia. Integrou os corpos gerentes da Associação Profissional de Arqueólogos (APA) desde 2002, tendo sendo presidente da direcção no triénio 2007-2009.

Curriculum detalhado aqui.