44
Pentaho BI Suite 3.5 Pentaho BI Suite 3.5 Introducción Introducción SIU – Datawarehouse / Julio 2010

Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Embed Size (px)

Citation preview

Page 1: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Pentaho BI Suite 3.5Pentaho BI Suite 3.5IntroducciónIntroducción

SIU – Datawarehouse / Julio 2010

Page 2: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

“Inteligencia de Negocios es el proceso de convertir datos en conocimientos y el

conocimiento en acción, para la toma de decisiones”

Business IntelligenceBusiness Intelligence

DATOSDATOS

ANÁLISIS

ANÁLISIS

CONOCIMIENTO

CONOCIMIENT

O

SIU – Datawarehouse / Julio 2010

Page 3: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Fases de un proceso BIFases de un proceso BI

SIU – Datawarehouse / Julio 2010

Page 4: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Pentaho OSBIPentaho OSBIOpen Source Business IntelligenceOpen Source Business Intelligence

SIU – Datawarehouse / Julio 2010

Page 5: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Proyecto Open Source (GNU GPL) cuyo objetivo es crear soluciones para Inteligencia de Negocios.

Las funcionalidades principales son: Reporting empresarial y Análisis. Tableros de mando. Minería de datos. Integración de datos. Workflow, alertas, suscripciones, etc.

¿Qué es Pentaho? (1/2)¿Qué es Pentaho? (1/2)

SIU – Datawarehouse / Julio 2010

Page 6: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Plataforma “orientada a la solución” y “centrada en procesos”.

Compuesto por múltiples programas que trabajan juntos para crear y distribuir soluciones BI. (diferentes funcionalidades).

Puede ser accedido desde un simple web browser, embebido en portales (LifeRay), embebido en sistemas de gestión (Alfresco).

Su diseño modular le permite utilizar otros programas ajenos a la suite (BIRT, Jasper).

¿Qué es Pentaho? (2/2)¿Qué es Pentaho? (2/2)

SIU – Datawarehouse / Julio 2010

Page 7: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

PrincipalesPrincipales proyectosproyectos

Pentaho Reporting (antes JFreeReport):http://reporting.pentaho.org

Pentaho Data Integration (Kettle): http:// kettle.pentaho.org

Pentaho Analysis (Mondrian OLAP server):http:// mondrian.pentaho.org

Pentaho Data Mining (Weka): http:// weka.pentaho.org

Pentaho Dashboards (CDF):http://www.pentaho.com/products/dashboards/

Pentaho BI Platform:http:// community.pentaho.com/projects/bi_platform/

SIU – Datawarehouse / Julio 2010

Page 8: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Análisis OLAPAnálisis OLAP

SIU – Datawarehouse / Julio 2010

Page 9: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

GráficosGráficos

SIU – Datawarehouse / Julio 2010

Page 10: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Tableros de mandoTableros de mando

SIU – Datawarehouse / Julio 2010

Page 11: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

ReportesReportes

SIU – Datawarehouse / Julio 2010

Page 12: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Componentes (1/3)Componentes (1/3)

Plataforma 100% J2EE, asegurando la escalabilidad, integración y portabilidad.

Servidor: puede correr en servidores compatibles con J2EE como JBOSS AS, WebSphere, Tomcat, WebLogic y Oracle AS.

Base de datos: vía JDBC, IBM DB2, Microsft SQL Server, MySQL, Oracle, PostgreSQL, NCR Teradata, Firebird, etc.

SIU – Datawarehouse / Julio 2010

Page 13: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Componentes (2/3)Componentes (2/3)

Sistema operativo: no hay dependencia. Lenguaje interpretado.

Lenguaje de programación: Java, Javascript, JSP, XSL (XSLT/XPath/XSL-FO).

Interfaz de desarrollo: Java SWT, Eclipse, Web-based.

Repositorio de datos basado en XML.

Todos los componentes están expuestos vía Web Services para facilitar la integración con Arquitecturas Orientadas a Servicios (SOA).

SIU – Datawarehouse / Julio 2010

Page 14: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Componentes (3/3)Componentes (3/3)

SIU – Datawarehouse / Julio 2010

Page 15: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

ArquitecturaArquitectura

SIU – Datawarehouse / Julio 2010

Page 16: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Existen dos versiones disponibles de PentahoExisten dos versiones disponibles de Pentaho

Pentaho Community EditionPentaho Community Edition

Pentaho Enterprise Edition (*)Pentaho Enterprise Edition (*)

(*) (Costo de soporte 10.000 US$/año hasta 25 usuarios – 1º semestre 2010)http://desarrollos.siu.edu.ar/trac/datawarehouse/attachment/wiki/Información%20de%20interés/lower%20costs%20with%20OSBI.pdf

SIU – Datawarehouse / Julio 2010

Page 17: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Versión Comunitaria

Sin costos de licencia

Sin servicios de soporte asociados

Suite completa con todas las funcionalidades para el desarrollo de proyectos de Business Intelligence.

Aunque Pentaho soló la recomienda para: Aficionados al BI Académicos Programadores de Software Abierto

Pentaho Community EditionPentaho Community Edition

SIU – Datawarehouse / Julio 2010

Page 18: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Versión Empresarial.

Sin costos de licencia.

Costo de soporte y mantención con suscripción anual.

Versión certificada con funcionalidades mejoradas para la consola de administración, y la construcción de tableros de control.

Pentaho Enterprise EditionPentaho Enterprise Edition

SIU – Datawarehouse / Julio 2010

Page 19: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

¿Community ó Enterprise?¿Community ó Enterprise?

http://www.pentaho.com/download/asset_container.php?durl=pentaho_bi_suite_enterprise_edition.pdf&furl=540000

SIU – Datawarehouse / Julio 2010

Page 20: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

http://www.pentaho.com/download/asset_container.php?durl=pentaho_bi_suite_enterprise_edition.pdf&furl=540000

¿Community ó Enterprise?¿Community ó Enterprise?

SIU – Datawarehouse / Julio 2010

Page 21: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

http://www.pentaho.com/download/asset_container.php?durl=pentaho_bi_suite_enterprise_edition.pdf&furl=540000

¿Community ó Enterprise?¿Community ó Enterprise?

SIU – Datawarehouse / Julio 2010

Page 22: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

¿Dónde conseguir ayuda ?¿Dónde conseguir ayuda ?

Web principal: Web principal: http://www.pentaho.com

Descarga de: Descarga de: http://sourceforge.net/projects/pentaho

Material comunitario: Material comunitario: http://community.pentaho.com

Wiki Comunidad: Wiki Comunidad: http://wiki.pentaho.com/display/COM/Community+Wiki+Home

Foros Comunidad: Foros Comunidad: http://forums.pentaho.org/

Wiki - SIU-Datawarehouse:Wiki - SIU-Datawarehouse: http://desarrollos.siu.edu.ar/trac/datawarehouse

SIU – Datawarehouse / Julio 2010

Page 23: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Suites BISuites BI

Pentaho Community Edition (CE): Aplicación web desarrollada en J2EE. Modular. Multiplataforma. Incluye: ETL, Reporting, OLAP, Data mining, Dashboards. GNU GPL.

OpenI: Aplicación de tipo SaaS. Desarrolada en J2EE. Multiplataforma. Incluye: OLAP. Licencia Open Source.

SIU – Datawarehouse / Julio 2010

Page 24: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

SpagoBI:Aplicación web desarrollada en J2EE. Modular.Multiplataforma.Incluye: ETL, Reporting, OLAP, Data mining, Dashboards.Licencia GNU LGPL.

JasperSoft Community Edition:Aplicación de tipo SaaS. Modular. Multiplataforma.Incuye: ETL, Reporting, OLAP, Dashboards.Licencia GNU GPL.

Suites BISuites BI

SIU – Datawarehouse / Julio 2010

Page 25: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Palo Community Version:Orientada a Planificación y Presupuestos. Basada enAJAX. Multiplataforma.Incluye: ETL, Reporting, OLAP.Licencia Open Source.

Suites BISuites BI

SIU – Datawarehouse / Julio 2010

Page 26: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Pentaho Data Integration Pentaho Data Integration (PDI) - Kettle(PDI) - Kettle

SIU – Datawarehouse / Julio 2010

Page 27: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

SIU – Datawarehouse / Julio 2010

Page 28: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Usos comunesUsos comunes

Carga de datawarehouses y datamarts.

Integración de datos.

Limpieza de datos (Data cleansing).

Migración y depuración de datos.

Exportación de datos.

Integración de PDI usando Pentaho BI.

...

SIU – Datawarehouse / Julio 2010

Introducción (1/4)Introducción (1/4)

Page 29: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Pentaho Data Integration (PDI) - Kettle → Kettle Extracción, Transformación, y Carga.

Licencia GNU LGPL.

Las soluciones de PDI se basan en dos tipos de objetos diferentes: Transformaciones Trabajos

PDI cuenta con un Motor propio que le permite interpretar, planificar y ejecutar Transformaciones y Trabajos (T&T).

Introducción (2/4)Introducción (2/4)

SIU – Datawarehouse / Julio 2010

Page 30: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

PDI cuenta con herramientas y utilidades para crear, administrar y ejecutar T&T:

Spoon: IDE gráfico para crear T&T.

Kitchen: herramienta de línea de comandos para ejecutar Trabajos.

Pan: herramienta de línea de comandos para ejecutar Transformaciones.

Carte: servidor liviano para ejecutar T&T en host remotos.

Las T&T utilizan un lenguaje descriptivo (XML), el cual será interpretado por el Data Integration Engine para su ejecución.

Introducción (3/4)Introducción (3/4)

SIU – Datawarehouse / Julio 2010

Page 31: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

CatálogoCatálogo

“Sin Catálogo”: se almacenan y gestionan las T&T en algún directorio.“Con Catálogo”: se utiliza una BD Relacional para almacenar y gestionar T&T.

Introducción (4/4)Introducción (4/4)

SIU – Datawarehouse / Julio 2010

Page 32: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Kettle en el proceso de BIKettle en el proceso de BI

SIU – Datawarehouse / Julio 2010

Page 33: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Componentes PDIComponentes PDI

SIU – Datawarehouse / Julio 2010

Page 34: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Data Integration EngineData Integration Engine

Responsable de interpretar y ejecutar los T&T de PDI.

Data Integration Engine utiliza: Para Transformaciones → Motor de Transformaciones Para Trabajos → Motor de Trabajos

Implementado como una librería Java.

Cuenta con una GUI muy avanzada.

Incluido en Pentaho BI server, para permitir ejecutar Trabajos como parte de una xaction.

SIU – Datawarehouse / Julio 2010

Page 35: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Transformación (transformation)Transformación (transformation) Orientación a los Datos. Representa una tarea ETL.

Es una colección de “pasos”. Cada paso es una operación particular sobre datos.

Los “pasos” se conectan entre sí a través de “saltos”, que indica cual será el flujo de los datos.

Los “pasos” trabajan de manera simultánea y asincrónica.

SIU – Datawarehouse / Julio 2010

Page 36: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Trabajo (job)Trabajo (job) Orientación a la Tarea y a los Datos.

Usualmente un Trabajo se compone de una o más Transformaciones, que serán ejecutadas secuencialmente.

La ejecución de cada “Entrada de Trabajo” presenta una salida de status, que puede ser analizada para la realización de diferentes acciones.

SIU – Datawarehouse / Julio 2010

Page 37: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Transformación (transformation)Transformación (transformation)

Ejemplo:Ejemplo:

SIU – Datawarehouse / Julio 2010

Page 38: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Trabajo (job)Trabajo (job) Ejemplo: Carga de un DWEjemplo: Carga de un DW

SIU – Datawarehouse / Julio 2010

Page 39: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Interfase gráficaInterfase gráfica

SIU – Datawarehouse / Julio 2010

Page 40: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

DemoDemo

SIU – Datawarehouse / Julio 2010

Page 41: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Web: http://kettle.pentaho.orgWeb: http://kettle.pentaho.orgForo: http://forums.pentaho.org/forumdisplay.php?f=69Foro: http://forums.pentaho.org/forumdisplay.php?f=69Wiki: http://wiki.pentaho.org/display/EAIWiki: http://wiki.pentaho.org/display/EAILista de mails: http://groups.google.com/group/kettle-developersLista de mails: http://groups.google.com/group/kettle-developersManual de Spoon en español: Manual de Spoon en español:

http://wiki.pentaho.com/display/EAIes/Manual+del+Usuario+de+Spoonhttp://wiki.pentaho.com/display/EAIes/Manual+del+Usuario+de+SpoonDocumentación en español: http://wiki.pentaho.com/display/EAIes/InicioDocumentación en español: http://wiki.pentaho.com/display/EAIes/Inicio Libros: Libros:

Pentaho 3.2 Data Integration - Beginner's Guide. Pentaho 3.2 Data Integration - Beginner's Guide. Pentaho Solutions: Business Intelligence and Data Warehousing with Pentaho Solutions: Business Intelligence and Data Warehousing with Pentaho and MySQL.Pentaho and MySQL. Pentaho Kettle Solutions - Building Open Source ETL Solutions with Pentaho Kettle Solutions - Building Open Source ETL Solutions with Pentaho Data Integration. (Septiembre 2010)Pentaho Data Integration. (Septiembre 2010)

Donde obtener informaciónDonde obtener información

SIU – Datawarehouse / Julio 2010

Page 42: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

BibliografíaBibliografía Roland Bouman, Jos van Dongen, 2009. “Pentaho Solutions: Business Roland Bouman, Jos van Dongen, 2009. “Pentaho Solutions: Business

Intelligence and Data Warehousing with Pentaho and MySQL”. Wiley Intelligence and Data Warehousing with Pentaho and MySQL”. Wiley

Publishing, Inc.Publishing, Inc. María Carina Roldan, 2010. “Pentaho 3.2 Data Integration - Beginner's María Carina Roldan, 2010. “Pentaho 3.2 Data Integration - Beginner's

Guide”. Packt Publishing.Guide”. Packt Publishing. Ing. Bernabeu Ricardo Dario, 2010. “DATA WAREHOUSING:Investigación y Ing. Bernabeu Ricardo Dario, 2010. “DATA WAREHOUSING:Investigación y

Sistematización de Conceptos – HEFESTO: Metodología propia para la Sistematización de Conceptos – HEFESTO: Metodología propia para la

Construcción de un Data Warehouse”. Construcción de un Data Warehouse”. http://tgx-hefesto.blogspot.com/2010/07/hefesto-v20.htmlhttp://tgx-hefesto.blogspot.com/2010/07/hefesto-v20.html Matt Casters. Pentaho Data Integration 4 and MySQL.. MySQL User Matt Casters. Pentaho Data Integration 4 and MySQL.. MySQL User

Conference, Tuesday April 13th , 2010.Conference, Tuesday April 13th , 2010. http://community.pentaho.comhttp://community.pentaho.com http://kettle.pentaho.orghttp://kettle.pentaho.org http://todobi.blogspot.comhttp://todobi.blogspot.com

SIU – Datawarehouse / Julio 2010

Page 43: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

¿Preguntas?¿Preguntas?

SIU – Datawarehouse / Julio 2010

Page 44: Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Muchas Gracias!!!Muchas Gracias!!!

SIU – Datawarehouse / Julio 2010