Sei que o assunto é polêmico, mas precisa ser dito!
Pentaho Data Integration (projeto Kettle) é uma excelente ferramenta de integração de dados. Sem sombra de dúvidas uma das melhores do mercado.
Mas, atualmente há uma outra ferramenta, também derivada do projeto Kettle que vem ganhando notoriedade e arrisco a dizer que é a MELHOR ferramenta de orquestração de dados! Estou falando do Apache Hop e hoje venho trazer 5 motivos (dos muitos que existem) para você migrar de vez seus projetos em Pentaho Data Integration para Apache Hop
Motivo 1 – Integração nativa com GIT
Não precisar usar clientes GIT de terceiros é uma verdadeira mão na roda para tornar seu ambiente DevOps e DataOps mais amigável e produtivo. Além de tudo, ainda há uma interface visual no hop que permite ver tudo que foi alterado, inclusive mostrando graficamente o pipeline ou workflow editado. Com certeza este é um grande avanço se comparado a todos os tipos de repositórios de artefatos (transformations e jobs) do Pentaho Community Edition.
Motivo 2 – Velocidade na Atualização
Já está claro que Pentaho e Apache Hop tomaram rumos diferentes, possuem objetivos diferentes e portanto têm suas atualizações seguindo por caminhos diferentes. O que destaco aqui é que, quando há uma necessidade legítima da comunidade sobre a atualização de uma transform do Hop (equivalente ao step do Pentaho), isso acontece em uma velocidade incrível. Pude observar de perto uma requisição que, segundo um dos requisitantes, já havia sido feita para ocorrer no Pentaho e que até o dia em que escrevo este artigo, não foi implementada, ter seu processo completo (abertura, votação, implementação, testes e liberação) realizado no Hop em menos de 11 horas corridas.
Motivo 3 – É um Projeto Top Level da Apache Software Foundation
Apache Software Foundation é uma organização sem fins lucrativos criada para suportar os projetos de código aberto.
Ser um projeto da Apache requer que o Software preencha uma séries de requisitos, o que dá grande credibilidade e robustez ao projeto.
Qualquer empresa preocupada com a confiabilidade e ciclo de vida dos Softwares acabam olhando para soluções proprietárias e gastam verdadeiras fortunas em licenciamento. Os projetos da Apache Foudation trazem a mesma confiabilidade e longevidade para os Softwares sem a obrigatoriedade da compra de licenças e ainda conta com uma enorme comunidade trabalhando para a franca evolução dos seus projetos.
Motivo 4 – Integração nativa com Apache Beam
O Apache Beam é um modelo de programação unificado de código aberto para definir e executar pipelines de processamento de dados.
Essa integração permite que você execute qualquer artefato criado no Apache Hop em motores como Apache Flink , Apache Spark e Google Cloud Dataflow.
Trocando em miúdos, você pode executar remotamente seus pipelines usando o poder de processamento dos serviços de nuvem.
Motivo 5 – O Matt Casters Está na Comunidade
Não só faz parte da comunidade, mas o pai do projeto Kettle, que deu origem ao Pentaho Data Integration e ao Apache Hop, é o líder da comunidade Hop e o maior “commiter” do projeto!
Sem sombra de dúvidas, ter ele no projeto é garantia de qualidade e a certeza que é realmente um produto da comunidade.
Abaixo uma foto minha com “O CARA”
Cara, eu parei no 1. Git nativo é uma mega mão-na-roda!!
Meu amigo isso é um eixo e um motor ligado em rodas kkkk. Faz o trabalho fluir muito mais!