33
Asegurando la Calidad del Dato en nuestros entornos de BI Mary Arcia SQL PASS Venezuela [email protected] @maryarcia https://ve.linkedin.com/pub/mary-arcia/ Blog: geeks.ms/blogs/marcia MCTS SQL Server 2005/2008

Asegurando la calidad del dato en mi entorno de business intelligence

Embed Size (px)

Citation preview

Page 1: Asegurando la calidad del dato en mi entorno de business intelligence

Asegurando la Calidad del Dato en

nuestros entornos de BI

Mary Arcia

SQL PASS Venezuela

[email protected]@maryarcia

https://ve.linkedin.com/pub/mary-arcia/Blog: geeks.ms/blogs/marcia

MCTS SQL Server 2005/2008

Page 2: Asegurando la calidad del dato en mi entorno de business intelligence

Organiza

http://tinyurl.com/ComunidadWindows

Page 3: Asegurando la calidad del dato en mi entorno de business intelligence

Patrocinadores del SQL Saturday

Premier Sponsor

Gold Sponsor

Bronze Sponsor

Page 4: Asegurando la calidad del dato en mi entorno de business intelligence

AGENDA

Introducción a la calidad de datos

Calidad de datos en Poyectos de BI

Metodología de Calidad de Datos en BI

Capacidades de Data Quality Services

Proyectos de Data Quality Services

Preguntas

4 |

Page 5: Asegurando la calidad del dato en mi entorno de business intelligence

Qué es Calidad de Datos?

Algunos problemas

5 |

Nuestros envíos postales

tienen un grado de

devolución muy alto.

Los datos de ventas

no me cuadran.El sistema está

maloMuchas personas

Muchas verdades

Page 6: Asegurando la calidad del dato en mi entorno de business intelligence

Por qué necesito calidad de datos?

Imprescindible para una toma de decisiones

correcta.

Pieza básica en la gestión de información

corporativa.

Impacto directo en el negocio.

ROI inmediato.

6 |

“Si los datos son la materia prima con la cual creamos

la Información; entonces la confiabilidad de la

información depende directamente de la calidad de los

datos utilizados para producirla”

Page 7: Asegurando la calidad del dato en mi entorno de business intelligence

En qué afecta la falta de calidad de datos

7 |

Page 8: Asegurando la calidad del dato en mi entorno de business intelligence

A Quién afecta la falta de calidad de datos

Áreas Productivas del Negocio

8 |

Ventas no dispone de información correcta.

Marketing realiza segmentaciones erróneas,

campañas no eficientes.

Dirección toma decisiones basándose en

información errónea.

Atención al Cliente sufre y es causante a la vez de

la mala calidad de los datos.

Tecnología toma tiempos muy largos para la

culminación de los proyectos (Time To Market).

Page 9: Asegurando la calidad del dato en mi entorno de business intelligence

A quién afecta la falta de calidad….

Todo es Dinero….

9 | Caída en ventas

Baja la rentabilidad del negocio

Pérdida de clientes. Segmentación

Poco control sobre el gasto

Análisis de fraude limitado

Page 10: Asegurando la calidad del dato en mi entorno de business intelligence

Qué nos resuelve calidad de datos

10 |

Ahorra dinero.

Aumenta Ventas

Aumenta

rentabilidad del

negocio

Page 11: Asegurando la calidad del dato en mi entorno de business intelligence

Impacto en Múltiples Proyectos

En BI buenos datos….buenas decisiones

11 |

Análisis predictivo

MDM (visión única del cliente/proveedor/producto)

Migraciones: Sistema nuevo con datos buenos (Garbage In/Garbage Out)

Cumplimiento de normativas y leyes

Gestión del CRM, ERP , etc.

Page 12: Asegurando la calidad del dato en mi entorno de business intelligence

Ciclo de Vida en la Calidad de los datos

12 |

1. Descubrir

2. Perfilar

3. Limpiar

4. Match

5. Consolidar

6. Monitorizar

Identificar y medir la calidad de los datos

Definir reglas y

objetivos

de la calidad

de los datos

Diseñar los procesos

de mejora de la

calidad de los datos

Matcheo de información y estadísticas

Implementar

los procesos

de mejora

de calidad

Monitorear

la calidad de

los datos

vs los objetivos

Page 13: Asegurando la calidad del dato en mi entorno de business intelligence

Dimensiones de la calidad de datos

Dimensión Qué mide?

Perfilado de

columna

Cuáles son las caracteríticas físicas de los datos?

Relación Qué relación existe entre grupos de datos?

Redundancia Es un dato redundante?

Existencia Qué dato falta o no nos es útil?

Conformidad Qué dato está almacenado en formato no estándar?

Consistencia Qué datos aportan información no conflictiva?

Precisión Qué datos son incorrectos o están caducados?

Duplicados Qué datos o atributos están repetidos?

Integridad Qué información no está referenciada?

Rango Qué resultados, cálculos, valores están fuera de

rango?

13 |

Page 14: Asegurando la calidad del dato en mi entorno de business intelligence

Dimensiones de calidad de datos

Ejemplo: Maestra de Clientes

Existencia

Existencia

Existencia

Existencia Tenemos todos los datos completos?

Page 15: Asegurando la calidad del dato en mi entorno de business intelligence

Dimensiones de calidad de datos

Ejemplo: Maestra de ClientesConformidad

Conformidad El dato tiene un formato correcto?

Conformidad

Conformidad

Conformidad

Conformidad

Page 16: Asegurando la calidad del dato en mi entorno de business intelligence

Dimensiones de calidad de datos

Ejemplo: Maestra de ClientesConsistencia

Consistencia El dato tiene el formato correcto pero rompe las reglas de negocio

Consistencia

Consistencia

Page 17: Asegurando la calidad del dato en mi entorno de business intelligence

Dimensiones de calidad de datos

Ejemplo: Maestra de Clientes

Duplicidad Los datos aparecen varias veces? Coincidencia difusa

Duplicidad

Duplicidad

Page 18: Asegurando la calidad del dato en mi entorno de business intelligence

Dimensiones de calidad de datos

Ejemplo: Maestra de Clientes

Integridad Las relaciones del dato son consistentes?

Integridad

Page 19: Asegurando la calidad del dato en mi entorno de business intelligence

Dimensiones de calidad de datos

Ejemplo: Maestra de Clientes

Rango Se encuentran los valores entre rangos aceptables?

Rango

Rango

Page 20: Asegurando la calidad del dato en mi entorno de business intelligence

Dimensiones de calidad de datos

Ejemplo: Maestra de Clientes

Precisión El dato representa la realidad exacta? Son las fuentes verificables?

PrecisiónPrecisión

Page 21: Asegurando la calidad del dato en mi entorno de business intelligence

DEMO

Perfilado de Datos

21 |

Page 22: Asegurando la calidad del dato en mi entorno de business intelligence

Qué es Data Quality Services?

Data Quality Services (DQS) es una

solución basada en el conocimiento

de la calidad de datos que permite a

los administradores de datos y

profesionales de IT la mejora de la

calidad de sus datos fácilmente.

Page 23: Asegurando la calidad del dato en mi entorno de business intelligence

En qué nos apoya Data Quality Services?

Conocimiento

Limpieza

Consolidación

Aporte de Valor

Page 24: Asegurando la calidad del dato en mi entorno de business intelligence

Arquitectura de DQS

CLIENTE

Data Quality Services

Client

Componente Integration

Services

SERVIDOR

DQS_MAIN

DQS_PROJECT

DQS_STAGING

Page 25: Asegurando la calidad del dato en mi entorno de business intelligence

Arquitectura de DQS

Dominios

Reglas de matching

Dominios Compuestos

Bases de Conocimiento

DominioReglas y Relacion

es

Valores

Referencias

Externas

Page 26: Asegurando la calidad del dato en mi entorno de business intelligence

Base de Conocimiento

ENTIDAD

Tarjetahabientes

Apellidos y Nombres

Nacionalidad

Nro. Tarjeta

Tipo Producto

Limite de CréditoAtributos

DQKB_Tarjetahabiente

Dominios

Tipo de Producto

Límite de Crédito

Nacionalidad

6 dígitos dentro

de un rango

Lista de

Valores y

correcciones

Lista de

Valores y

correcciones

Page 27: Asegurando la calidad del dato en mi entorno de business intelligence

DEMO

Construyendo una Base de Conocimiento

27 |

Page 28: Asegurando la calidad del dato en mi entorno de business intelligence

Proyectos DQS Proyectos de Cleansing

Limpieza de Datos

Partiendo de la

Base de Conocimiento

Información Extra

Sobre las decisiones

que toma

Base de Conocimiento

en la nube

Consumir datos

Page 29: Asegurando la calidad del dato en mi entorno de business intelligence

Proyectos DQS Proyectos de Matching

Creación de Reglas

Política de comportamiento

del motor DQS

Matching

Lógica Difusa

Agrega Metadatos

Exportación

Datos que quedan

en el modelo

SQL Server, Excel, DQS

Page 30: Asegurando la calidad del dato en mi entorno de business intelligence

Ciclo de Vida de Proyectos BI sin DQ

Detectar Orígenes

Información Extra

Pruebas de Carga de Datos

Desarrollo de

Informes

Pruebas y cuadresUAT

Aceptación Final

Page 31: Asegurando la calidad del dato en mi entorno de business intelligence

Ciclo de Vida de Proyectos BI con DQ

Detectar Orígenes

Información Extra

Análisis de Perfilado de Datos

Procesos de Carga

Enriquecimiento y Matching

UATAceptación

Final

Monitorear DQ

Pruebas y cuadres

Desarrollo de

Informes

Page 32: Asegurando la calidad del dato en mi entorno de business intelligence

Impacto de DQ en Proyectos de BI

Aumenta la rapidez de implementación

Menor Time To Market del Proyecto

Menor esfuerzo en la fase de pruebas y UAT

Mejora la calidad de la información decisiones

Genera origenes de datos de calidad para Campañas

Mayor confianza y usabilidad de la aplicación

Mayor cumplimiento de expectativas y obtención de mayor satisfacción.

33 |

Page 33: Asegurando la calidad del dato en mi entorno de business intelligence

34 |

[email protected] geeks.ms/blogs/marcia/

@maryarcia

PREGUNTAS Y RESPUESTAS

SQL PASS

Venezuela

Mary Arcia