¿Por qué usar Pentaho?
Pentaho es un software de Inteligencia de Negocio con distintos componentes. Proporciona herramientas diseñadas para ayudar a las organizaciones a recopilar, procesar, analizar y visualizar datos para tomar decisiones informadas y estratégicas.
Pentaho es un software de Inteligencia de Negocio con distintos componentes. Proporciona herramientas diseñadas para ayudar a las organizaciones a recopilar, procesar, analizar y visualizar datos para tomar decisiones informadas y estratégicas.
Pero la verdad es que nosotros solo te recomendamos uno de sus componentes: Data Integration. Abajo te explicamos el porqué👇🏻
1️⃣ Open source: Pentaho tiene un versión gratuita conocida como Pentaho Data Integration Community Edition (Pentaho CE).
Si bien existe una licencia de pago que otorga mayores funcionalidades, nuestro equipo considera que la versión open source es más que suficiente para tu organización
2️⃣ Drag and Drop: existen múltiples herramientas para desarrollar procesos ETL (ELT en nuestro caso), muchas de las cuales incluyen bastante código para realizar cualquier carga / transformación de datos.
Pentaho, por el contrario, ofrece una interfaz gráfica que te permite utilizar “cajas” para realizar distintas acciones en formato “drag & drop”.
Acá te dejamos un ejemplo de proceso para uno de nuestros clientes, con el cual podrás entender mejor:
Este proceso realiza lo siguiente:
- Nos conectamos a la VPN para tener acceso a la fuente relevante.
- Actualizamos los tipos de cambio consumiendo una API.
- Obtenemos la información relevante de Softland.
- Consumimos planillas en Google Sheets.
- Transformamos los datos invocando a dbt.
- Nos desconectamos de la VPN.
En caso de que exista una falla en cualquiera de estas etapas, recibiremos una email con la notificación correspondiente.
3️⃣ Integraciones ya desarrolladas: Pentaho viene con un set de integraciones ya desarrolladas. También existe un montón de integraciones creadas por la comunidad.
4️⃣ Múltiples conectores: ¡eso es mega bacán!
1.Motores de bases de datos (postgresql, MySQL, SQL Server, Oracle, Redshift, Snowflake, y un largo etcétera).
2.Archivos Excel, csv, Google Sheets.
Incluso conectores desarrollados para sistemas específicos como es el caso de Salesforce, donde puedes configurar la extracción de distintos módulos (según los que la empresa tenga contratados), de acuerdo a rangos de fecha definidos o móviles.
No todos los conectores vienen por defecto, pero existe una comunidad que los desarrolla y comparte distintos tipos de ellos.
¿Qué opinan de Pentaho? ¿Cuál ha sido su experiencia con esta herramienta?