La redondance des données peut provoquer des anomalies de données dans une base de données - le plus souvent des erreurs d'insertion, de suppression et de mise à jour. Le processus de normalisation des données aide à éliminer la redondance des données et les anomalies qui en résultent.
La redondance des données se produit lorsqu'une donnée spécifique peut être trouvée dans plusieurs zones de la base de données. Un exemple courant serait la base de données d'une université ou d'un collège sur les inscriptions actuelles aux cours. Un étudiant peut être inscrit à plusieurs cours différents, de sorte que son dossier individuel d'étudiant peut être reproduit plusieurs fois. Dans un scénario de fabrication, un seul fournisseur peut être utilisé pour divers projets et produits.
Il est important d'éliminer l'occurrence de la redondance des données tout en maintenant l'intégrité des données grâce au processus de normalisation en plusieurs étapes. La redondance entraîne généralement trois anomalies de données courantes - ou des cas où les données sont incohérentes.
- Anomalie d'insertion - où les données ne peuvent pas être stockées ou mises à jour à moins qu'une autre donnée ne soit stockée en même temps. Dans l'exemple des dossiers d'étudiant, cela peut se produire s'il n'est pas possible de saisir un dossier d'étudiant tant qu'il n'est pas inscrit à un cours.
- Anomalie de mise à jour : l'une des copies d'un enregistrement est mise à jour alors que l'autre ne l'est pas ; toutes les copies doivent être mises à jour simultanément.
- Anomalie de suppression : cela se produit lorsque la suppression d'une donnée signifie que d'autres informations sont également perdues. Dans les exemples d'étudiants, cela peut se produire si la suppression d'un cours impliquait également la suppression des dossiers d'étudiants associés.