Escrito por Ana Canteli el 29 de marzo de 2022
La gestión de datos se basa en la recogida, custodia y uso eficiente y seguro de los mismos. El objetivo de la gestión de datos es contribuir a optimizar su uso en función de las políticas de gestión de datos y el marco normativo. No hay que olvidar que cada vez hay más empresas cuyo núcleo es la gestión de datos, es decir, no se basan en material tangible para crear valor.
Se dice que la gestión de datos comenzó hacia 1890 con la creación de tarjetas perforadas. Pero en realidad hasta 1960 no se trata el concepto de gestión de datos o copias de seguridad como lo utilizamos hoy en día. Es entonces cuando la Asociación de Organizaciones de Servicios de Procesamiento de Datos (ADPSO) comenzó su actividad de asesoramiento en la gestión de datos maestros y las copias de seguridad entre otros asuntos. Una década después los sistemas de gestión de datos eran únicamente operativos; es decir, proporcionaban informes sobre operaciones en un determinado momento. Datos maestros extraídos de una base de datos relacional - almacén de datos - que los guardaba en filas y columnas.
Actualmente las empresas necesitan soluciones de gestión de datos que les proporcionen una forma unificada de gestionar los datos, pero a diversos niveles. Y es que los sistemas de gestión de datos se basan en plataformas de gestión de datos y pueden incluir bases de datos maestros, lagos de datos y almacenes de datos, sistemas de gestión de big data, análisis de datos, etc.
Una plataforma de gestión de datos es el sistema básico para recopilar y analizar grandes volúmenes de datos en una organización. Las plataformas de datos suelen incluir herramientas de software para la gestión, y pueden estar desarrolladas por el proveedor de la base de datos o por terceros. Estas soluciones de gestión de datos ayudan a los equipos técnicos y a los administradores de bases de datos a realizar tareas como:
Identificar, diagnosticar y resolver fallos en el sistema de base de datos o la infraestructura.
Asignar recursos de almacenamiento.
Actualizar el diseño de la base de datos.
Optimizar las respuestas de las consultas de la base de datos para un mejor rendimiento.
En cuanto al big data es exactamente lo que parece: muchos datos, montones de datos. Pero los grandes volúmenes de datos vienen en una amplia variedad de formatos, y además se recopilan a una gran velocidad. Por ejemplo, piense en todos los datos que recopila Meta de todas sus redes sociales. La cantidad, variedad y velocidad de esos datos son lo que los hace tan valiosos para las empresas, pero también los convierten en difíciles de gestionar.
A medida que se recopilan más y más datos de fuentes tan dispares como circuito cerrado de televisión, redes sociales, grabaciones de audio y dispositivos de Internet de las cosas (IoT), han surgido sistemas de gestión de big data.
Un lago de datos es un sistema de almacenamiento de datos en su formato natural, es decir, sin procesar. Suele incluir copias de seguridad sin procesar de los datos del sistema de origen.
Los datos son una forma de capital, ya que en la economía actual son capaces de crear valor por sí mismos. Son muy relevantes a nivel estratégico y competitivo. Los datos son también un capital definido, pues son información registrada y necesaria para producir bienes o servicios. Y como habíamos dicho más arriba, incluye cualquier tipo de dato capturado:
Organización: transacciones, registros de clientes, informes de soporte.
Móvil: interacción de aplicaciones, configuración de dispositivos, geoposicionamiento.
Audio: atención al cliente, servicios por voz y sistemas automatizados.
Vídeo: imágenes vía satélite, rayos X, metraje de seguridad.
Sensores: temperatura, humedad, vibración, aceleración.
Arquitectura de datos: es diseñada y desplegada con un sistema de bases de datos y otros repositorios para albergar los datos de una organización.
Modelo de datos: son creados para mapear los flujos de trabajo y las relaciones entre los datos, de forma que la información pueda ser organizada para cumplir los requerimientos de la empresa.
Datos: generados, procesados y almacenados en una base de datos, sistema de archivo, servicio cloud u otro sistema de almacenamiento.
Sistema de transacción: y otras fuentes de datos son integradas en un almacén de datos o lago de datos para su análisis.
Control de calidad de datos: son realizados para identificar errores e inconsistencias, para resolverlas mediante tareas de limpieza de datos.
Gobernanza de datos: crea definiciones de datos y políticas de uso de datos.
La mayoría de los desafíos en la gestión de datos actual se derivan del ritmo cada vez más acelerado de los negocios y la creciente proliferación de datos. La variedad, la velocidad y el volumen cada vez mayor de datos disponibles para las empresas, las está empujando a buscar herramientas de administración más efectivas para mantenerse. Algunos de los principales desafíos que enfrentan las organizaciones son:
Falta de conocimiento sobre los datos: Se recopilan y almacenan muchísimos datos en cantidad y variedad pero ninguno de esos datos es útil si la organización no sabe qué datos tiene, dónde están y cómo usarlos. Las soluciones de gestión de datos necesitan escala y rendimiento para brindar información significativa cuando se necesita.
Dificultad para mantener los niveles de rendimiento: Las organizaciones capturan, almacenan y usan cada vez más datos durante más tiempo. Para mantener los tiempos de respuesta competitivos al máximo nivel, las organizaciones deben monitorear continuamente el tipo de consultas que responde la base de datos y cambiar los índices a medida que cambian las preguntas, sin afectar el rendimiento.
Dificultades para cumplir requisitos cambiantes: Los requerimientos normativos, como el reglamento general de protección de datos, son complejos y multijurisdiccionales y tienden a actualizarse constantemente. En estas circunstancias las empresas deben poder revisar fácilmente sus datos, e identificar cualquier elemento susceptible de incumplir las nuevas normas. En particular, la información de identificación personal (IIP) debe detectarse, rastrearse y monitorearse para cumplir con las cada vez más estrictas regulaciones de privacidad global.
Necesidad de procesamiento y conversión de datos: Recopilar e identificar los datos en sí no proporciona ningún valor; la entidad necesita procesarlos. Si lleva mucho tiempo y esfuerzo convertir los datos en lo que necesitan para el análisis, eso simplemente no ocurrirá. Como resultado, se pierde el valor potencial de esos datos.
Necesidad de almacenamiento efectivo constante: Actualmente las organizaciones almacenan datos en múltiples sistemas, incluidos almacenes de datos y lagos de datos no estructurados que almacenan cualquier dato en cualquier formato, en un sólo repositorio. Los científicos de datos de una organización necesitan transformar los datos de su formato original a la forma, el formato o el modelo que necesitan para una amplia gama de análisis, siguiendo un proceso que sea rápido y sencillo, y como podemos imaginar, eso muchas veces se parece a la cuadratura del círculo.
Optimización constante de rendimiento y costes tecnológicos: Con la aparición de los sistemas de gestión de datos en la nube, las empresas pueden elegir si conservar y analizar los datos en entornos locales, en la nube o en una instalación híbrida. Las empresas TIC necesitan evaluar el nivel de identidad entre los entornos locales y la nube, para mantener la máxima agilidad a nivel tecnológico; a la vez que se reducen costes y mantener o garantizar ese equilibrio es francamente difícil.
Un programa de gobernanza de datos bien diseñado es un elemento esencial en una sólida y fiable estrategia de gestión de datos, especialmente en empresas con entornos de datos distribuidos que incluyen multitud de sistemas. Un decidido enfoque en la calidad de datos también es fundamental para aplicar las mejores prácticas. Sin embargo, en ambos casos, los equipos de administración de datos y tecnologías de la información no pueden con todo. La directiva, los empleados y los usuarios deben comprometerse en garantizar el uso adecuado de datos y el mantenimiento de la calidad de datos para aplicar las mejores prácticas.
Además, la multitud de bases de datos y otras plataformas de datos disponibles para implementar requiere un cuidadoso diseño de arquitectura de datos y para ello hay que evaluar y seleccionar la tecnología adecuada. Los administradores de datos y de sistemas de gestión de datos deben asegurarse de que los sistemas que implementen se ajusten al objetivo propuesto y cuenten con las capacidades de procesamiento de datos y la información de análisis necesarias para las operaciones de su organización.
El sistema de gestión documental de OpenKM cuenta con todas las funcionalidades y capacidades para procesar los datos de una organización y configurar o formar parte del sistema de gestión de datos que ésta elabore. Con OpenKM su empresa podrá sacar el máximo partido a su capital de datos.