Sección: 53IIntegrantes: Arias Moreno, Jhino Guzmán Tapia, Pedro Solis Alarcón, José Yacolca Neyra, Renato Jesús Zumaeta Mejía, Doris Inteligencia de Negocios Pentaho (BI Open Source) OSBI - Concepto En el área de Business Intelligence, se ha producido recientemente un despegue espectacular en el desarrollo de soluciones e implementación de herramientas Open Source. La cantidad de proyectos libres de licencias en este segmento y el número de personas implicadas demuestran que existe capacidad para que se desarrolle de formas muy diferentes y complementarias a la vez. Inteligencia de Negocios Pentaho (BI Open Source) Por qué OSBI ? Adaptabilidad a todos los entornos. Sin costos de licencias Independencia del proveedor Seguridad Garantías de permanencia. Upgrades y mejoras frecuentes Tendencia a la calidad y utilización de estándares Dedicación full a los servicios y a la solución de negocios Gran aprovechamiento de Web Services y tecnología SOA La comunidad del software libre Los proyectos BI deberían ser proyectos a largo plazo, porque de ellos depende no sólo el presente de nuestras decisiones, sino el futuro. Inteligencia de Negocios Pentaho (BI Open Source) OSBI existentes Inteligencia de Negocios Pentaho (BI Open Source) La plataforma Pentaho Open Source Business Intelligence Inteligencia de Negocios Pentaho (BI Open Source) La plataforma Pentaho Open Source Business Intelligence La plataforma Open Source Pentaho Business Intelligence cubre muy amplias necesidades de Análisis de los Datos y de Informes empresariales. Las soluciones de Pentaho están escritas en Java y tienen un ambiente de implementación también basado en Java. Administración y distribución de reportes, análisis y dashboards Fácil integración de fuentes de datos, portales y aplicaciones usando estándares abiertos Programación de tareas y autentificación integradas Funcionalidades de customización a través de APIs, Web Services o modificación a plantillas, reglas de negocio o incluso el código fuente Registro de auditoría integrado para seguimiento de actividades de usuarios, performance y acceso a contenido Procesos basados en workflow que permiten implementar lógica de negocios única Inteligencia de Negocios Pentaho (BI Open Source) Estado actual de la solución y componentes Inteligencia de Negocios Pentaho (BI Open Source) Estado actual de la solución y componentes Plataforma 100% J2EE, asegurando la escalabilidad, integración y portabilidad. Servidor: puede correr en servidores compatibles con J2EE como JBOSS AS, WebSphere, Tomcat, WebLogic y Oracle AS. Base de datos: vía JDBC, IBM DB2, Microsft SQL Server, MySQL, Oracle, PostgreSQL, NCR Teradata, Firebird. Sistema operativo: no hay dependencia. Lenguaje interpretado. Lenguaje de programación: Java, Javascript, JSP, XSL (XSLT/XPath/XSLFO). Interfaz de desarrollo: Java SWT, Eclipse, Web-based. Repositorio de datos basado en XML. Todos los componentes están expuestos vía Web Services para facilitar la integración con Arquitecturas Orientadas a Servicios (SOA). Inteligencia de Negocios Pentaho (BI Open Source) Estado actual de la solución y componentes Pentaho se define a si mismo como una plataforma de BI “orientada a la solución” “centrada en procesos” que incluye todos los principales componentes requeridos para implementar soluciones basados en procesos y ha sido concebido desde el principio para estar basada en procesos. Las soluciones que Pentaho pretende ofrecer se componen fundamentalmente de una infraestructura de herramientas de análisis e informes integrado con un motor de workflow de procesos de negocio, una de las capacidades BI claves de la plataforma. Inteligencia de Negocios Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Inteligencia de Negocios Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Integración de Datos Se compone de 4 herramientas: SPOON: permite diseñar de forma gráfica la transformación ETL. PAN ejecuta la transformaciones diseñadas con SPOON. CHEF permite, mediante una interfaz gráfica, diseñar la carga de datos incluyendo un control de estado de los trabajos. KITCHEN permite ejecutar los trabajos batch diseñados con Chef. Inteligencia de Negocios Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Inteligencia de Negocios Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Análisis de Datos Despliegue gráfico interactivo, con grillas de datos Resultados explorables y navegables incluso en los gráficos Sofisticadas capacidades OLAP, arquitectura ROLAP Técnicas de optimización para mejoras de tiempos de respuesta Inteligencia de Negocios Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Análisis de Datos El servidor OLAP : Para obtener la funcionalidad de procesamiento analítico en línea (OLAP) se utilizan dos aplicaciones combinadas el servidor OLAP Mondrian, y Jpivot, Ambos permiten realizar querys a Datamarts, y que los resultados sean presentados mediante un browser y que el usuario pueda realizar drill down y el resto de las navegaciones típicas. Inteligencia de Negocios Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Análisis de Datos Algunas cuestiones interesantes sobre Mondrian: Mondrian utiliza MDX como lenguaje de consulta, que no tendría nada de raro si no fuera porque fue un lenguaje propuesto por Microsoft. En noviembre de 2005 Mondrian se incorporó al proyecto Pentaho. Mondrian funciona sobre las bases de datos estándar del mercado: Oracle, DB2, SQL-Server, MySQL,PostgreSQL... lo cual habilita y facilita el desarrollo de negocio basado en la plataforma Pentaho. JPivot está considerado con un “proyecto hermano” de Mondrian. Al incorporarse Mondrian también lo ha hecho JPivot Inteligencia de Negocios Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Pentaho Dashboards Todos los componentes del modulo Pentaho Reporting y Pentaho Análisis pueden formar parte de un Dashboard. Identificación de Indicadores (KPI’s, Key Performance Indicators) Monitoreo/Métricas Investigar detalles subyacentes Drill a reportes de soporte Seguimiento de excepciones Alertas basadas en reglas del negocio Inteligencia de Negocios Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Pentaho Dashboards Inteligencia de Negocios Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Pentaho Datamining Pentaho está incorporando la tecnología WeKa. Poderoso motor de minería de datos provee de un set de algoritmos de aprendizaje del proyecto Weka incluyendo clustering, segmentación, árboles de decisión, random forests, redes neuronales y análisis de componentes principales, entre otros. Integración de Pentaho Data Integration, automatización de procesos de transformación de datos al formato que requiere el motor de data mining. Los algoritmos pueden ser aplicados directamente a un set de datos o invocados desde código Java. Provee filtros para discretización, normalización, re-muestreo, selección de atributos, transformación y combinación de atributos. Modelos para predicción de variables nominales o numéricas. Herramientas gráficas de diseño para preprocesamiento de datos, regresión, clustering, reglas de asociación. Inteligencia de Negocios Pentaho (BI Open Source) Pentaho Datamining Componentes de la plataforma Pentaho BI Inteligencia de Negocios Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Pentaho Reporting Es una solución basada en el proyecto JFreeReport (hay quienes usan BIRT). Permite la distribución de los resultados del análisis en múltiples formatos - todos los informes incluyen la opción de imprimir o exportar a formato PDF, XLS, HTML y texto- y permiten también la programación de tareas y ejecución automática de informes con una determinada periodicidad. Inteligencia de Negocios Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Pentaho Reporting Esta herramienta cuenta con: Implementación flexible, desde solución standalone de escritorio, a reportes interactivos basados en Inteligencia de Negocios Amplio soporte a fuentes de datos incluyendo datos relacionales, OLAP o basados en XML Solución proporcionada por pentaho e integrada en su suite para el desarrollo de informes Inteligencia de Negocios Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Pentaho Reporting Existen tres productos con diferentes enfoques y dirigidos a diferentes tipos de usuarios: Pentaho Report Designer Pentaho Report Design Wizard Web ad-hoc reporting Inteligencia de Negocios Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Pentaho Reporting Inteligencia de Negocios Pentaho (BI Open Source) Componentes de la plataforma Pentaho BI Pentaho Workflow de Procesos de Negocio Existen dos fundamentos del Workflow de Procesos de Negocio: El motor de workflow Enhydra Shark El estándar WPDL, auspiciado por la WorkFlow Management Coalition (WFMC), organismo que declara tener más de 300 empresas asociadas, incluyendo a las desconocidas IBM, Oracle, BEA, Adobe, SAP, TIBCO o SUN, por citar algunas de ellas. Inteligencia de Negocios Pentaho (BI Open Source) COMMUNITY ó ENTERPRISE? Existen dos versiones disponibles de Pentaho Pentaho Community Edition Pentaho Enterprise Edition Inteligencia de Negocios Pentaho (BI Open Source) COMMUNITY ó ENTERPRISE? Pentaho Community Edition Versión comunitaria, sin costos de licencia, sin servicios de soporte asociados. Es una suite completa con todas las funcionalidades necesarias para el correcto desarrollo de proyectos de Business Intelligence. Aunque Pentaho soló la recomienda para: Aficionados al BI Académicos Programadores de Software Abierto Es totalmente software de código abierto, la licencia en su mayoría bajo la versión GNU General Public License versión 2, con partes bajo el LGPLv2, la Common Public License, y la Licencia Pública de Mozilla. Inteligencia de Negocios Pentaho (BI Open Source) COMMUNITY ó ENTERPRISE? Pentaho Enterprise Edition Versión empresarial, sin costos de licencia. Tiene asociados servicios de soporte y mantención que se pagan a través de una suscripción anual. Es una versión certificada que además posee algunas funcionalidades mejoradas para la consola de administración, y para la construcción de tableros de control. Inteligencia de Negocios Pentaho (BI Open Source) COMMUNITY ó ENTERPRISE? Comparativa Inteligencia de Negocios Pentaho (BI Open Source) COMMUNITY ó ENTERPRISE? Comparativa Inteligencia de Negocios Pentaho (BI Open Source) Dónde conseguir ayuda ? Pentaho Community Community Wiki Home http://wiki.pentaho.com/display/COM/Community+Wiki+Home Community Forums http://forums.pentaho.org/ Inteligencia de Negocios Pentaho (BI Open Source) Por qué Pentaho ? Mejores productos Cobertura completa de punta a punta de las necesidades de BI Calidad sin igual, comunidad extensa y adopción empresarial Arquitectura moderna, construida sobre estándares y en base a componentes Servicios de administración Mejor servicio Soporte a producción disponible 24x7x365 Atención a soporte por los verdaderos expertos Pentaho desde la primera Llamada Capacitación y consultoría profesional Inteligencia de Negocios Pentaho (BI Open Source) Por qué Pentaho ? Mejor valor Licencia Open Source sin costo Servicio de supscripción y soporte a una fracción de proveedores propietarios. Mejor relación Completa transparencia Relación basada 100% en la calidad de soporte al cliente Inteligencia de Negocios Pentaho (BI Open Source) Desventajas de Pentaho Falta de Documentación Fiable Pentaho pone a disposición un manual de usuario de la herramienta en el cual se olvidan de importantes conceptos que dificultan el desarrollo y despliegue de una solución BI. Herramientas Derivadas Las herramientas que forma la suite de Pentaho han sido creadas por separado, esto acaba perjudicando a la estandarización de conceptos ya que no se trabaja de la misma forma en las herramientas. Inteligencia de Negocios Pentaho (BI Open Source) Herramientas cliente Report Designer (http://reporting.pentaho.org) Designer Studio Aggregation Designer Metadata Edition Pentaho Data Integration Schema Workbench Inteligencia de Negocios Pentaho (BI Open Source) Instalación Qué necesitamos descargar ? BI-Server de Pentaho, su distribución CE (Community Edition) Pentaho/ administrationconsole/ biserver-ce/ Crear un directorio /pentaho/design-tools Schema Workbench (http://sourceforge.net/projects/mondrian/files/) Report Designer (http://sourceforge.net/projects/pentaho/files/) Report Wizard (http://sourceforge.net/projects/pentaho/files/) Pentaho Design Studio (http://sourceforge.net/projects/pentaho/files/) Pentaho Metadata (http://sourceforge.net/projects/pentaho/files/) Data Integration (http://sourceforge.net/projects/pentaho/files/) Inteligencia de Negocios Pentaho (BI Open Source) Instalación Qué necesitamos descargar ? Tendremos entonces la siguiente estructura de directorios: Pentaho/ administrationconsole/ biserver-ce/ design-tools/ schema-workbench/ report-design/ report-wizard/ design-studio/ pentaho-metada/ data-integration/ Descargaremos el motor Postgresql 8.4 que usaremos como repositorio de datos. PostreSQL 8.4.3-1 for windows incluye PGADMIN III (http://www.enterprisedb.com/products/pgdownload.do) JDBC de PostgreSQL (http://jdbc.postgresql.org/download/postgresql-8.4-701.jdbc3.jar) Para mayor información de download ver: http://wiki.pentaho.com/display/COM/Community+Edition+Downloads Inteligencia de Negocios Pentaho (BI Open Source) Instalación Repositorio de la solución Viene por default en un RDBMS, HyperSQL, pero puede migrarse a: MySQL 5.x PostgreSQL 8.x.x Oracle 10g & 11g Prashant Raju nos dá un buen aporte con esto: http://www.prashantraju.com/projects/pentaho/ En está página encontramos cómo migrar el repositorio a con los correspondientes script de migración. Inteligencia de Negocios Pentaho (BI Open Source) Qué deberíamos conocer ? Apache Tomcat Hibernate Jetty PostgreSQL Quartz Hypersonic Ver terminología usada en el proyecto Pentaho en http://wiki.pentaho.com/display/PEOpen/Pentaho+Terminology+Project Inteligencia de Negocios Pentaho (BI Open Source) Instalación Configuración Correo Puertos /pentaho/biserverp-ce/tomcatt/conf/server.xml Publicaciones /pentaho/biserver-ce/pentaho-solutions/system/publisher_config.xml Despliegue /pentaho/biserver-ce/tomcat/webapps/pentaho/WEB-INF <context-param> <param-name>base-url</param-name> <param-value>http://myserver.pentaho.org:8080/pentaho</paramvalue> </context-param> JAVA HOME SET JAVA_HOME= /pentaho/biserver-ce/tomcat/jre Inteligencia de Negocios /pentaho/biserver-ce/pentaho-solutions/system/smtpemail/email_config.xml Pentaho (BI Open Source) Instalación Iniciar el Business Intelligence Server Registrar el Tomcat como un servicio /pentaho/biserver-ce/tomcat/bin> service.bat install tomcat5 Iniciar el servicio, desde la consola de servicios de windows. Entrar a la Consola de Usuario ya que tenemos el servidor BI corriendo. http://localhost:8080/pentaho Ingresar seleccionar el usuario “joe” del combo con los usuarios para demo, que es el usuario con rol de administrador. La password es “password”. Inteligencia de Negocios Pentaho (BI Open Source) Instalación Iniciar la Consola de Administración Tener en cuenta que siempre debe estar corriendo primero el servidor BI. Ejecutar /pentaho/administration-console/start-pac.bat. Se abrirá una ventana de comandos cuya última línea mostrará: console if now started. It can be accessed using http://[servidor]:8099 Puede ingresar a la interfase en http://localhost:8099/ o la dirección que especifique en la ventana anterior. Verá una ventana de login que pedirá usuario y clave; estas son "admin" y "password". Creamos un nuevo Datasource para las soluciones que vamos a implementar Inteligencia de Negocios Gracias.