Uma das principais razões para usar um banco de dados relacional é evitar dados duplicados. Entretanto, com o passar do tempo, os bancos de dados freqüentemente adquirem valores duplicados, principalmente quando vários usuários inserem dados. Normalmente, a eliminação de dados duplicados economiza custos de armazenamento e aumenta a precisão dos dados. Essa precisão, por sua vez, pode ajudar você a tomar melhores decisões de negócios. Por exemplo, se você inserir um pedido de venda mais de uma vez, o cliente poderá receber produtos desnecessários e a redundância poderá acarretar despesas adicionais de envio e contabilidade.
O QUE A DUPLICAÇÃO REALMENTE SIGNIFICA
Antes de começar a identificar e excluir registros duplicados, lembre-se de que você terá que depender do seu próprio conhecimento dos dados. Diferentemente do processo de criação de um banco de dados, não é possível seguir um conjunto de regras ou procedimentos específicos para localizar com precisão os registros duplicados. Lembre-se deste fato antes de prosseguir: as consultas a bancos de dados podem retornar registros que parecem ser duplicados mas, na verdade, são dados válidos. Essa aparente duplicação geralmente acontece quando não são incluídos na consulta campos que identifiquem cada registro de maneira exclusiva.
Além disso, você deve ter em mente que não é possível excluir todos os dados duplicados, pois alguma duplicação é necessária para que o banco de dados funcione adequadamente. Em outras palavras, os bancos de dados podem conter redundâncias tanto necessárias como desnecessárias, e você deve eliminar somente as redundâncias desnecessárias.
As redundâncias necessárias geralmente se enquadram em duas categorias. O primeiro tipo de redundância permite que o banco de dados funcione. Por exemplo, os dados de um campo de chave primária são duplicados sempre que é necessário estabelecer uma relação um para muitos ou muitos para muitos entre tabelas.
O segundo tipo de redundância necessária surge durante o uso do banco de dados. Por exemplo, talvez você insira muitas vezes o nome de uma cidade, de um fornecedor, ou um nome comum como João da Silva. Quando isso acontece, não há qualquer risco de duplicação de dados porque outros campos do banco de dados (como os valores das chaves primárias, os endereços e os CEPs) contêm informações exclusivas suficientes para impedir que os registros sejam considerados como duplicatas.
As redundâncias desnecessárias podem ocorrer de diversas maneiras:
Embora cada registro tenha um código exclusivo de cliente (o valor na primeira coluna à esquerda), os valores de Nome, Endereço e Cidade são correspondentes. Nessas situações, mesmo uma correspondência parcial pode ser uma boa razão para usar seus conhecimentos sobre a sua própria empresa e rever os registros para verificar se são duplicados.
Como ambas as tabelas, embora suas estruturas possam ser diferentes, contêm os mesmos tipos de informações — dados sobre clientes — talvez seja aconselhável mesclar todos os valores exclusivos (não duplicados) em uma única tabela e eliminar a tabela extra.
Visite a seção Gerenciamento de banco de dados do Microsoft Office Marketplace para verificar quais são as ferramentas de gerenciamento de banco de dados disponíveis atualmente.
OBS: Se, mesmo depois de adotar as medidas necessárias para eliminar dados duplicados das suas tabelas, você ainda encontrar dados duplicados em um formulário ou em um relatório, talvez isso seja devido ao design incorreto do formulário ou relatório. Verifique se as tabelas e consultas de base foram associadas corretamente e se as seções do formulário ou relatório não incluem mais de um controle ligado à mesma fonte de controle.
O QUE A DUPLICAÇÃO REALMENTE SIGNIFICA
Antes de começar a identificar e excluir registros duplicados, lembre-se de que você terá que depender do seu próprio conhecimento dos dados. Diferentemente do processo de criação de um banco de dados, não é possível seguir um conjunto de regras ou procedimentos específicos para localizar com precisão os registros duplicados. Lembre-se deste fato antes de prosseguir: as consultas a bancos de dados podem retornar registros que parecem ser duplicados mas, na verdade, são dados válidos. Essa aparente duplicação geralmente acontece quando não são incluídos na consulta campos que identifiquem cada registro de maneira exclusiva.
Além disso, você deve ter em mente que não é possível excluir todos os dados duplicados, pois alguma duplicação é necessária para que o banco de dados funcione adequadamente. Em outras palavras, os bancos de dados podem conter redundâncias tanto necessárias como desnecessárias, e você deve eliminar somente as redundâncias desnecessárias.
As redundâncias necessárias geralmente se enquadram em duas categorias. O primeiro tipo de redundância permite que o banco de dados funcione. Por exemplo, os dados de um campo de chave primária são duplicados sempre que é necessário estabelecer uma relação um para muitos ou muitos para muitos entre tabelas.
O segundo tipo de redundância necessária surge durante o uso do banco de dados. Por exemplo, talvez você insira muitas vezes o nome de uma cidade, de um fornecedor, ou um nome comum como João da Silva. Quando isso acontece, não há qualquer risco de duplicação de dados porque outros campos do banco de dados (como os valores das chaves primárias, os endereços e os CEPs) contêm informações exclusivas suficientes para impedir que os registros sejam considerados como duplicatas.
As redundâncias desnecessárias podem ocorrer de diversas maneiras:
- Dois ou mais registros podem conter campos duplicados. Dois registros podem ser considerados como duplicatas mesmo quando nem todos os respectivos campos contêm valores correspondentes. Por exemplo, nesta figura você pode ver dois registros referentes a Antonio Moreno Taquería.
Registro Duplicado |
- Duas ou mais tabelas podem conter dados semelhantes. Por exemplo, talvez você constate que a tabela Clientes e a tabela Compradores possuem registros sobre os mesmos clientes.
Access, Registros Duplicados |
- Dois ou mais bancos de dados podem conter dados semelhantes. Se você constatar que dois ou mais bancos de dados contêm dados semelhantes, ou herdar um banco de dados que contém redundâncias com relação ao seu banco de dados atual, é aconselhável comparar os dados e as estruturas de ambos e tomar as providências necessárias para consolidá-los.
Visite a seção Gerenciamento de banco de dados do Microsoft Office Marketplace para verificar quais são as ferramentas de gerenciamento de banco de dados disponíveis atualmente.
OBS: Se, mesmo depois de adotar as medidas necessárias para eliminar dados duplicados das suas tabelas, você ainda encontrar dados duplicados em um formulário ou em um relatório, talvez isso seja devido ao design incorreto do formulário ou relatório. Verifique se as tabelas e consultas de base foram associadas corretamente e se as seções do formulário ou relatório não incluem mais de um controle ligado à mesma fonte de controle.
Comentários