21
DATAWAREHOUSE Harold Pérez David Jiménez Grado: 10º INSTITUCION EDUCATIVA CIUDAD DON BOSCO Medellín 2011

file · Web viewpara posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el

  • Upload
    ngongoc

  • View
    216

  • Download
    4

Embed Size (px)

Citation preview

Page 1: file · Web viewpara posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el

DATAWAREHOUSE

Harold Pérez

David Jiménez

Grado: 10º

INSTITUCION EDUCATIVA CIUDAD DON BOSCO

Medellín

2011

Page 2: file · Web viewpara posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el

Contenido

1. INTRODUCCIÓN..................................................................................................................4

2. DEFINICIÓN..........................................................................................................................5

2.1 Que es un Data WareHouse?......................................................................................5

3. TIPOS DE DATA WAREHOUSE.........................................................................................7

3.1 Native data Warehouse appliance;.............................................................................7

3.2 Software data Warehouse appliance;........................................................................7

3.3 Packaged data Warehouse appliance;.......................................................................7

3.4 Data management appliance;.....................................................................................8

4. LOS ELEMENTOS BÁSICOS DE UN DATA WAREHOUSE...........................................9

4.1 Sistema fuente:..............................................................................................................9

4.2 Área de tráfico de datos:..............................................................................................9

4.3 Servidor de presentación:...........................................................................................9

4.4 Modelo dimensional:....................................................................................................9

4.5 Procesos de negocios:...............................................................................................10

4.6 Data Mart:.....................................................................................................................10

4.7 Data WareHouse:.........................................................................................................10

4.8 Almacenamiento operacional de datos:..................................................................10

4.9 OLAP:............................................................................................................................10

4.10 ROLAP:.......................................................................................................................10

4.11MOLAP:........................................................................................................................11

4.12 Aplicaciones para usuarios finales:.......................................................................11

4.13 Herramientas de acceso a datos por usuarios finales:.......................................11

Page 3: file · Web viewpara posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el

4.14Ad Hoc Query Tool:...................................................................................................11

4.15Modelado de aplicaciones:.......................................................................................11

4.16 Meta Data:..................................................................................................................11

5. LOS PROCESOS BÁSICOS DEL DATA WAREHOUSE................................................12

5.1 Extracción:...................................................................................................................12

5.2Transformación:...........................................................................................................12

5.3Carga:.............................................................................................................................12

6.LOSOBJETIVOS FUNDAMENTALES DE UN DATA WAREHOUSE.............................13

6.1Hace que la información de la organización sea accesible:.................................13

6.2Hacer que la información de la organización sea consistente:............................13

6.3Es información adaptable y elástica:........................................................................14

6.4Es un seguro baluarte que protege los valores de la información:.....................14

6.5Es la fundación de la toma de decisiones:..............................................................14

7. FUNCIONES DE UN DATA WAREHOUSE......................................................................15

7.1 Integración...................................................................................................................15

7.2 Separación...................................................................................................................15

8. conclusiones.....................................................................................................................16

9. cibergarfia..........................................................................................................................17

Page 4: file · Web viewpara posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el

1. INTRODUCCIÓN

En un almacén de datos lo que se quiere es contener datos que son necesarios o

útiles para una organización, es decir, que se utiliza como un repositorio de datos

para posteriormente transformarlos en información útil para el usuario. Un almacén

de datos debe entregar la información correcta a la gente indicada en el momento

óptimo y en el formato adecuado. El almacén de datos da respuesta a las

necesidades de usuarios expertos, utilizando Sistemas de Soporte a Decisiones

(DSS), Sistemas de información ejecutiva (EIS) o herramientas para hacer

consultas o informes. Los usuarios finales pueden hacer fácilmente consultas

sobre sus almacenes de datos sin tocar o afectar la operación del sistema.

Page 5: file · Web viewpara posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el

2. DEFINICIÓN

2.1 Que es un Data WareHouse?

Es un repositorio de datos de muy fácil acceso, alimentado de numerosas fuentes,

transformadas en grupos de información sobre temas específicos de negocios,

para permitir nuevas consultas, análisis, reporteador y decisiones.

Un Data WareHouse es un lugar donde se almacenan los datos con fines de

archivamiento, análisis de efectos y seguridad. Por lo general, un Data

WareHouse es un único equipo o varios ordenadores (servidores) atados juntos

para crear un sistema gigante de computadoras.

Además de ser una Depósito (Warehouse) para almacenar grandes cantidades de

datos, poseen sistemas que facilitan el acceso a los datos y su utilización en

operaciones de día a día. Un Data Warehouse es importante ya que sirve como un

sistema de apoyo a las decisiones. Además sirve para organizar la utilización de

los datos para llegar a los hechos, las tendencias o las relaciones que pueden

ayudarles a tomar decisiones efectivas o crear estrategias eficaces para lograr sus

objetivos.

Hay muchos modelos diferentes de Data Warehouse incluyendo el “procesamiento

Page 6: file · Web viewpara posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el

de transacciones en línea” que es un modelo construido para la velocidad y la

facilidad de uso. Otro tipo de Data Warehouse se llama “procesamiento analítico

en línea”, este tipo de Data Warehouse es más difícil de utilizar y agrega un paso

adicional en el análisis de los datos. Por lo general, requiere más medidas que

hacen más lento el proceso de datos y mucho más difícil el analizar algunas

consultas.

Page 7: file · Web viewpara posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el

3. TIPOS DE DATA WAREHOUSE

3.1 Native data Warehouse appliance;

Donde tanto el hardware como el software están estrechamente integrados en una

sola plataforma. No se pueden licenciar por separado y tampoco se pueden utilizar

de forma individualizada.

Algunos ejemplos de este tipo son: data llegro, netezza, y tera data.

3.2 Software data Warehouse appliance;

En este caso, Bases de datos relacionales, tanto Open Source como comerciales

son optimizadas para su uso en entornos Data Warehouse. Aquí, se puede utilizar

en diferentes configuraciones de Hardware.

Algunos ejemplos son Greenplum, Sybase e Ingres.

3.3 PACKAGED DATA WAREHOUSE APPLIANCE;

Donde software y hardware comercial es configurado para funcionar como una

única plataforma y que es comercializado por un único vendedor. Además, se

instala y mantiene en un único sistema.

Ejemplos de este tipo son HP Neoview, IBM Balance Warehouse y

Page 8: file · Web viewpara posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el

Sun/Greenplum.

3.4 Data management appliance;

Que obtiene los datos de forma intensiva desde un servidor. Estos sistemas

pueden implicar procesos operacionales, analíticos o de almacenamiento.

Algunos ejemplos son ParAccel y Dataupia.

Page 9: file · Web viewpara posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el

4. LOS ELEMENTOS BÁSICOS DE UN DATA WAREHOUSE

4.1 Sistema fuente:

Sistemas operacionales de registros donde sus funciones son capturar las

transacciones del negocio. A los sistemas fuentes también se le conoce como

Legacy System.

4.2 Área de tráfico de datos:

Es un área de almacenamiento y grupo de procesos, que limpian transforman,

combinan, remover los duplicados, guardan, archivan y preparan los datos

fuente para ser usados en el Data WareHouse.

4.3 Servidor de presentación:

La maquina físicaobjetivo en donde los datos del Data WareHouse son

organizados y almacenados para queries directos por los usuarios finales,

reportes y otras aplicaciones.

4.4 Modelo dimensional:

Una disciplina específica para el modelado de datos que es una alternativa para

los modelos de entidad – relación.

Page 10: file · Web viewpara posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el

4.5 Procesos de negocios:

Un coherente grupo de actividades de negocio que hacen sentido a los

usuarios del negocio del Data WareHouse.

4.6 Data Mart:

Un subgrupo lógico del Data WareHouse completo.

4.7 Data Ware House:

Búsquedas fuentes de datos de la empresa. Y es la unión de todos los data

marts que la constituyen.

4.8 Almacenamiento operacional de datos:

Es el punto de integración por los sistemas operacionales. Es el acceso al

soporte de decisiones por los ejecutivos.

4.9 OLAP:

Actividad general de búsquedas para presentación de texto y números del

Data WareHouse, también un estilo dimensional especifico de búsquedas y

presentación de información y que es ejemplificada por vendedores de OLAP.

4.10 ROLAP:

Un grupo de interfaces de usuarios y aplicaciones que le dan a la base de datos

relacional un estilo dimensional.

Page 11: file · Web viewpara posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el

4.11MOLAP:

Un grupo de interfaces de usuarios, aplicaciones y propietarios de tecnología

de bases de datos que tienen un fuerte estilo dimensional.

4.12 Aplicaciones para usuarios finales:

Una colección de herramientas que hacen los queries, analizan y presentan la

información objetivo para el soporte de las necesidades del negocio.

4.13 Herramientas de acceso a datos por usuarios finales:

Un cliente de Data WareHouse.

4.14Ad Hoc Query Tool:

Un tipo específico de herramientas de acceso a datos por usuarios finales que

invita al usuario a formas sus propios queries manipulando directamente las

tablas relacionales y sus uniones.

4.15Modelado de aplicaciones:

Un sofisticado tipo de cliente de Data WareHouse con capacidades analíticas

que transforma o digiere las salidas del Data WareHouse.

4.16 Meta Data:

Toda la información en el ambiente del Data WareHouse que no son así mismo

los datos actuales.

Page 12: file · Web viewpara posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el

5. LOS PROCESOS BÁSICOS DEL DATA WAREHOUSE

5.1 Extracción:

Este es el primer paso de obtener la información hacia el ambiente del Data

WareHouse.

5.2Transformación:

una vez que la información es extraída hacia el área de tráfico de datos, hay

posibles paso de transformación como; limpieza de la información, tirar la

basura que no nos sirve, seleccionar únicamente los campos necesarios para el

Data WareHouse, combinar fuentes de datos, haciéndolas coincidir por los

valores de las llaves, creando nuevas llaves para cada registro de una

dimensión.

5.3Carga:

Al final del proceso de transformación, los datos están en forma para ser

cargados

Page 13: file · Web viewpara posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el

6. LOSOBJETIVOS FUNDAMENTALES DE UN DATA WAREHOUSE

6.1Hace que la información de la organización sea accesible:

Los contenidos del Data WareHouse son entendibles y navegables, y el acceso

a ellos es caracterizado por el rápido desempeño. Estos requerimientos no

tienen fronteras y tampoco limites fijos. Cuando hablamos de entendible

significa, que los niveles de la información sean correctos y obvios. Y

Navegables significa el reconocer el destino en la pantalla y llegar a donde

queramos con solo un clic. Rápido desempeño significa, cero tiempo de espera.

Todo lo demás es un compromiso y por consiguiente algo que queremos

mejorar.

6.2Hacer que la información de la organización sea consistente:

La información de una parte de la organización puede hacerse coincidir con la

información de la otra parte de la organización. Si dos medidas de la

organización tienen el mismo nombre, entonces deben significar la misma cosa.

Y a la inversa, si dos medidas no significan la misma cosa, entonces son

etiquetados diferentes. Información consistente significa, información de alta

calidad. Significa que toda la información es contabilizada y completada. Todo

lo demás es un compromiso y por consiguiente algo que queremos mejorar.

Page 14: file · Web viewpara posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el

6.3Es información adaptable y elástica:

El Data WareHouse está diseñado para cambios continuos. Cuando se le

hacen nuevas preguntas al Data WareHouse, los datos existentes y las

tecnologías no cambian ni se corrompen. Cuando se agregan datos nuevos al

Data WareHouse, los datos existentes y las tecnologías tampoco cambian ni se

corrompen. El diseño de Data Marts separados que hacen al Data WareHouse,

deben ser distribuidos e incrementados. Todo lo demás es un compromiso y

por consiguiente algo que queremos mejorar.

6.4Es un seguro baluarte que protege los valores de la información:

El Data WareHouse no solamente controla el acceso efectivo a los datos, si no

que da a los dueños de la información gran visibilidad en el uso y abusos de los

datos, aún después de haber dejado el Data WareHouse. Todo lo demás es un

compromiso y por consiguiente algo que queremos mejorar.

6.5Es la fundación de la toma de decisiones:

El Data WareHouse tiene los datos correctos para soportar la toma de

decisiones. Solo hay una salida verdadera del Data WareHouse: las decisiones

que son hechas después de que el Data WareHouse haya presentado las

evidencias. La original etiqueta que preside el Data WareHouse sigue siendo la

mejor descripción de lo que queremos construir: un sistema de soporte a las

decisiones

Page 15: file · Web viewpara posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el

7. FUNCIONES DE UN DATA WAREHOUSE

7.1 Integración

De los datos provenientes de bases de datos distribuidas por las diferentes

unidades de la organización y que con frecuencia tendrán diferentes

estructuras (fuentes heterogéneas). Se debe facilitar una descripción global

y un análisis comprensivo de toda la organización en el almacén de datos.

7.2 Separación

de los datos usados en operaciones diarias de los datos usados en el

almacén de datos para los propósitos de divulgación, de ayuda en la toma

de decisiones, para el análisis y para operaciones de control. Ambos tipos

de datos no deben coincidir en la misma base de datos, ya que obedecen a

objetivos muy distintos y podrían entorpecerse entre sí.

Page 16: file · Web viewpara posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el

8. conclusiones

En conclusión el data Warehouse es un almacén de datos en donde se procesa la

información de una forma en la que en el futuro donde se necesite sea mucho más

fácil acceder a la información. También es un sistema en donde cada que recibe

información se actualiza poniendo de primero la información más nueva y dejando

atrás la más antigua.

Estas bodegas de datos son de mucho uso en las empresas de telecomunicación

por que a cada momento tienen que ver si los usuario que están llamando si

tienen saldo. Estos data WareHouse son muy rápidos.

Page 17: file · Web viewpara posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el

9. cibergarfia