?Qué significa redundancia de datos?
La redundancia de datos es una condición creada dentro de una base de datos o tecnología de almacenamiento de datos en la que el mismo dato se guarda en dos lugares distintos.
Puede tratarse de dos campos distintos dentro de una misma base de datos, o de dos lugares distintos en varios entornos o plataformas de software. Siempre que se repiten datos, básicamente constituye redundancia de datos.
La redundancia de datos puede ocurrir por accidente, pero también se hace deliberadamente con fines de copia de seguridad y recuperación.
Definición de redundancia de datos
Dentro de la definición general de redundancia de datos, existen diferentes clasificaciones basadas en lo que se considera apropiado en la gestión de bases de datos, y lo que se considera excesivo o despilfarro.
La redundancia inútil de datos suele producirse cuando un determinado dato no necesita repetirse, pero acaba duplicándose debido a una codificación ineficiente o a la complejidad del proceso.
Por ejemplo, la redundancia de datos por despilfarro podría producirse cuando se encuentran duplicados incoherentes de la misma entrada en la misma base de datos.
La redundancia accidental de datos podría producirse debido a una codificación ineficiente o a procesos de almacenamiento de datos demasiado complicados, y representar un problema en términos de eficiencia y costes.
Dado que la existencia de campos de datos duplicados o innecesarios debe resolverse, las operaciones de conciliación, integración y normalización necesarias para eliminar las incoherencias pueden ser costosas y llevar mucho tiempo.
Los errores generados al acceder a conjuntos de datos redundantes erróneos pueden dar lugar a muchos problemas con los clientes. Por último, el espacio adicional que ocupan los datos redundantes puede empezar a acumularse con el tiempo, dando lugar a bases de datos hinchadas.
Un tipo positivo de redundancia de datos funciona para salvaguardar los datos y promover la coherencia. Se pueden aprovechar múltiples instancias de los mismos conjuntos de datos para realizar copias de seguridad, recuperación ante desastres (DR) y comprobaciones de calidad.
Los datos redundantes pueden almacenarse a propósito creando versiones comprimidas de los datos de copia de seguridad que puedan restaurarse, y formar parte de estrategias específicas de RD.
En caso de ciberataque o violación de datos, por ejemplo, tener los mismos datos almacenados en varios lugares distintos puede ser fundamental para garantizar la continuidad de las operaciones y mitigar los da?os.
La redundancia de datos también puede aprovecharse para mejorar la velocidad de las actualizaciones y el acceso a los datos si se almacenan en varios sistemas a los que puedan acceder distintos departamentos.
Muchos desarrolladores consideran aceptable que los datos se almacenen en varios lugares. La clave está en disponer de un campo o espacio central y maestro para estos datos, de modo que haya una forma de actualizar todos los lugares donde los datos son redundantes a través de un punto de acceso central.
De lo contrario, la redundancia de datos puede dar lugar a grandes problemas de incoherencia de datos, en los que una actualización no actualiza automáticamente otro campo. Como resultado, fragmentos de datos que se supone que son idénticos acaban teniendo valores diferentes.
Cuando la prevención no es suficiente, pueden ser necesarias operaciones de normalización o reconciliación de la base de datos para eliminar las redundancias ya existentes. Primero se definen una serie de reglas de normalización para establecer qué son realmente ?datos normales?.
Después, se comprueba la base de datos para asegurarse de que las dependencias en todas las columnas y tablas se aplican correctamente y de que todos los duplicados innecesarios se tratan correctamente.