Upload
ngongoc
View
216
Download
4
Embed Size (px)
Citation preview
DATAWAREHOUSE
Harold Pérez
David Jiménez
Grado: 10º
INSTITUCION EDUCATIVA CIUDAD DON BOSCO
Medellín
2011
Contenido
1. INTRODUCCIÓN..................................................................................................................4
2. DEFINICIÓN..........................................................................................................................5
2.1 Que es un Data WareHouse?......................................................................................5
3. TIPOS DE DATA WAREHOUSE.........................................................................................7
3.1 Native data Warehouse appliance;.............................................................................7
3.2 Software data Warehouse appliance;........................................................................7
3.3 Packaged data Warehouse appliance;.......................................................................7
3.4 Data management appliance;.....................................................................................8
4. LOS ELEMENTOS BÁSICOS DE UN DATA WAREHOUSE...........................................9
4.1 Sistema fuente:..............................................................................................................9
4.2 Área de tráfico de datos:..............................................................................................9
4.3 Servidor de presentación:...........................................................................................9
4.4 Modelo dimensional:....................................................................................................9
4.5 Procesos de negocios:...............................................................................................10
4.6 Data Mart:.....................................................................................................................10
4.7 Data WareHouse:.........................................................................................................10
4.8 Almacenamiento operacional de datos:..................................................................10
4.9 OLAP:............................................................................................................................10
4.10 ROLAP:.......................................................................................................................10
4.11MOLAP:........................................................................................................................11
4.12 Aplicaciones para usuarios finales:.......................................................................11
4.13 Herramientas de acceso a datos por usuarios finales:.......................................11
4.14Ad Hoc Query Tool:...................................................................................................11
4.15Modelado de aplicaciones:.......................................................................................11
4.16 Meta Data:..................................................................................................................11
5. LOS PROCESOS BÁSICOS DEL DATA WAREHOUSE................................................12
5.1 Extracción:...................................................................................................................12
5.2Transformación:...........................................................................................................12
5.3Carga:.............................................................................................................................12
6.LOSOBJETIVOS FUNDAMENTALES DE UN DATA WAREHOUSE.............................13
6.1Hace que la información de la organización sea accesible:.................................13
6.2Hacer que la información de la organización sea consistente:............................13
6.3Es información adaptable y elástica:........................................................................14
6.4Es un seguro baluarte que protege los valores de la información:.....................14
6.5Es la fundación de la toma de decisiones:..............................................................14
7. FUNCIONES DE UN DATA WAREHOUSE......................................................................15
7.1 Integración...................................................................................................................15
7.2 Separación...................................................................................................................15
8. conclusiones.....................................................................................................................16
9. cibergarfia..........................................................................................................................17
1. INTRODUCCIÓN
En un almacén de datos lo que se quiere es contener datos que son necesarios o
útiles para una organización, es decir, que se utiliza como un repositorio de datos
para posteriormente transformarlos en información útil para el usuario. Un almacén
de datos debe entregar la información correcta a la gente indicada en el momento
óptimo y en el formato adecuado. El almacén de datos da respuesta a las
necesidades de usuarios expertos, utilizando Sistemas de Soporte a Decisiones
(DSS), Sistemas de información ejecutiva (EIS) o herramientas para hacer
consultas o informes. Los usuarios finales pueden hacer fácilmente consultas
sobre sus almacenes de datos sin tocar o afectar la operación del sistema.
2. DEFINICIÓN
2.1 Que es un Data WareHouse?
Es un repositorio de datos de muy fácil acceso, alimentado de numerosas fuentes,
transformadas en grupos de información sobre temas específicos de negocios,
para permitir nuevas consultas, análisis, reporteador y decisiones.
Un Data WareHouse es un lugar donde se almacenan los datos con fines de
archivamiento, análisis de efectos y seguridad. Por lo general, un Data
WareHouse es un único equipo o varios ordenadores (servidores) atados juntos
para crear un sistema gigante de computadoras.
Además de ser una Depósito (Warehouse) para almacenar grandes cantidades de
datos, poseen sistemas que facilitan el acceso a los datos y su utilización en
operaciones de día a día. Un Data Warehouse es importante ya que sirve como un
sistema de apoyo a las decisiones. Además sirve para organizar la utilización de
los datos para llegar a los hechos, las tendencias o las relaciones que pueden
ayudarles a tomar decisiones efectivas o crear estrategias eficaces para lograr sus
objetivos.
Hay muchos modelos diferentes de Data Warehouse incluyendo el “procesamiento
de transacciones en línea” que es un modelo construido para la velocidad y la
facilidad de uso. Otro tipo de Data Warehouse se llama “procesamiento analítico
en línea”, este tipo de Data Warehouse es más difícil de utilizar y agrega un paso
adicional en el análisis de los datos. Por lo general, requiere más medidas que
hacen más lento el proceso de datos y mucho más difícil el analizar algunas
consultas.
3. TIPOS DE DATA WAREHOUSE
3.1 Native data Warehouse appliance;
Donde tanto el hardware como el software están estrechamente integrados en una
sola plataforma. No se pueden licenciar por separado y tampoco se pueden utilizar
de forma individualizada.
Algunos ejemplos de este tipo son: data llegro, netezza, y tera data.
3.2 Software data Warehouse appliance;
En este caso, Bases de datos relacionales, tanto Open Source como comerciales
son optimizadas para su uso en entornos Data Warehouse. Aquí, se puede utilizar
en diferentes configuraciones de Hardware.
Algunos ejemplos son Greenplum, Sybase e Ingres.
3.3 PACKAGED DATA WAREHOUSE APPLIANCE;
Donde software y hardware comercial es configurado para funcionar como una
única plataforma y que es comercializado por un único vendedor. Además, se
instala y mantiene en un único sistema.
Ejemplos de este tipo son HP Neoview, IBM Balance Warehouse y
Sun/Greenplum.
3.4 Data management appliance;
Que obtiene los datos de forma intensiva desde un servidor. Estos sistemas
pueden implicar procesos operacionales, analíticos o de almacenamiento.
Algunos ejemplos son ParAccel y Dataupia.
4. LOS ELEMENTOS BÁSICOS DE UN DATA WAREHOUSE
4.1 Sistema fuente:
Sistemas operacionales de registros donde sus funciones son capturar las
transacciones del negocio. A los sistemas fuentes también se le conoce como
Legacy System.
4.2 Área de tráfico de datos:
Es un área de almacenamiento y grupo de procesos, que limpian transforman,
combinan, remover los duplicados, guardan, archivan y preparan los datos
fuente para ser usados en el Data WareHouse.
4.3 Servidor de presentación:
La maquina físicaobjetivo en donde los datos del Data WareHouse son
organizados y almacenados para queries directos por los usuarios finales,
reportes y otras aplicaciones.
4.4 Modelo dimensional:
Una disciplina específica para el modelado de datos que es una alternativa para
los modelos de entidad – relación.
4.5 Procesos de negocios:
Un coherente grupo de actividades de negocio que hacen sentido a los
usuarios del negocio del Data WareHouse.
4.6 Data Mart:
Un subgrupo lógico del Data WareHouse completo.
4.7 Data Ware House:
Búsquedas fuentes de datos de la empresa. Y es la unión de todos los data
marts que la constituyen.
4.8 Almacenamiento operacional de datos:
Es el punto de integración por los sistemas operacionales. Es el acceso al
soporte de decisiones por los ejecutivos.
4.9 OLAP:
Actividad general de búsquedas para presentación de texto y números del
Data WareHouse, también un estilo dimensional especifico de búsquedas y
presentación de información y que es ejemplificada por vendedores de OLAP.
4.10 ROLAP:
Un grupo de interfaces de usuarios y aplicaciones que le dan a la base de datos
relacional un estilo dimensional.
4.11MOLAP:
Un grupo de interfaces de usuarios, aplicaciones y propietarios de tecnología
de bases de datos que tienen un fuerte estilo dimensional.
4.12 Aplicaciones para usuarios finales:
Una colección de herramientas que hacen los queries, analizan y presentan la
información objetivo para el soporte de las necesidades del negocio.
4.13 Herramientas de acceso a datos por usuarios finales:
Un cliente de Data WareHouse.
4.14Ad Hoc Query Tool:
Un tipo específico de herramientas de acceso a datos por usuarios finales que
invita al usuario a formas sus propios queries manipulando directamente las
tablas relacionales y sus uniones.
4.15Modelado de aplicaciones:
Un sofisticado tipo de cliente de Data WareHouse con capacidades analíticas
que transforma o digiere las salidas del Data WareHouse.
4.16 Meta Data:
Toda la información en el ambiente del Data WareHouse que no son así mismo
los datos actuales.
5. LOS PROCESOS BÁSICOS DEL DATA WAREHOUSE
5.1 Extracción:
Este es el primer paso de obtener la información hacia el ambiente del Data
WareHouse.
5.2Transformación:
una vez que la información es extraída hacia el área de tráfico de datos, hay
posibles paso de transformación como; limpieza de la información, tirar la
basura que no nos sirve, seleccionar únicamente los campos necesarios para el
Data WareHouse, combinar fuentes de datos, haciéndolas coincidir por los
valores de las llaves, creando nuevas llaves para cada registro de una
dimensión.
5.3Carga:
Al final del proceso de transformación, los datos están en forma para ser
cargados
6. LOSOBJETIVOS FUNDAMENTALES DE UN DATA WAREHOUSE
6.1Hace que la información de la organización sea accesible:
Los contenidos del Data WareHouse son entendibles y navegables, y el acceso
a ellos es caracterizado por el rápido desempeño. Estos requerimientos no
tienen fronteras y tampoco limites fijos. Cuando hablamos de entendible
significa, que los niveles de la información sean correctos y obvios. Y
Navegables significa el reconocer el destino en la pantalla y llegar a donde
queramos con solo un clic. Rápido desempeño significa, cero tiempo de espera.
Todo lo demás es un compromiso y por consiguiente algo que queremos
mejorar.
6.2Hacer que la información de la organización sea consistente:
La información de una parte de la organización puede hacerse coincidir con la
información de la otra parte de la organización. Si dos medidas de la
organización tienen el mismo nombre, entonces deben significar la misma cosa.
Y a la inversa, si dos medidas no significan la misma cosa, entonces son
etiquetados diferentes. Información consistente significa, información de alta
calidad. Significa que toda la información es contabilizada y completada. Todo
lo demás es un compromiso y por consiguiente algo que queremos mejorar.
6.3Es información adaptable y elástica:
El Data WareHouse está diseñado para cambios continuos. Cuando se le
hacen nuevas preguntas al Data WareHouse, los datos existentes y las
tecnologías no cambian ni se corrompen. Cuando se agregan datos nuevos al
Data WareHouse, los datos existentes y las tecnologías tampoco cambian ni se
corrompen. El diseño de Data Marts separados que hacen al Data WareHouse,
deben ser distribuidos e incrementados. Todo lo demás es un compromiso y
por consiguiente algo que queremos mejorar.
6.4Es un seguro baluarte que protege los valores de la información:
El Data WareHouse no solamente controla el acceso efectivo a los datos, si no
que da a los dueños de la información gran visibilidad en el uso y abusos de los
datos, aún después de haber dejado el Data WareHouse. Todo lo demás es un
compromiso y por consiguiente algo que queremos mejorar.
6.5Es la fundación de la toma de decisiones:
El Data WareHouse tiene los datos correctos para soportar la toma de
decisiones. Solo hay una salida verdadera del Data WareHouse: las decisiones
que son hechas después de que el Data WareHouse haya presentado las
evidencias. La original etiqueta que preside el Data WareHouse sigue siendo la
mejor descripción de lo que queremos construir: un sistema de soporte a las
decisiones
7. FUNCIONES DE UN DATA WAREHOUSE
7.1 Integración
De los datos provenientes de bases de datos distribuidas por las diferentes
unidades de la organización y que con frecuencia tendrán diferentes
estructuras (fuentes heterogéneas). Se debe facilitar una descripción global
y un análisis comprensivo de toda la organización en el almacén de datos.
7.2 Separación
de los datos usados en operaciones diarias de los datos usados en el
almacén de datos para los propósitos de divulgación, de ayuda en la toma
de decisiones, para el análisis y para operaciones de control. Ambos tipos
de datos no deben coincidir en la misma base de datos, ya que obedecen a
objetivos muy distintos y podrían entorpecerse entre sí.
8. conclusiones
En conclusión el data Warehouse es un almacén de datos en donde se procesa la
información de una forma en la que en el futuro donde se necesite sea mucho más
fácil acceder a la información. También es un sistema en donde cada que recibe
información se actualiza poniendo de primero la información más nueva y dejando
atrás la más antigua.
Estas bodegas de datos son de mucho uso en las empresas de telecomunicación
por que a cada momento tienen que ver si los usuario que están llamando si
tienen saldo. Estos data WareHouse son muy rápidos.
9. cibergarfia