O blog da AWS

Opções de Arquitetura para extrair Dados do SAP com Serviços da AWS

Por Ferry Mulyadi, Alliance Partner SA e
Thuan Bui Thi, Associate SA

Introdução

A Gartner descobriu que quase 97% dos dados não são usados pelas organizações e mais de 87% das organizações estão classificadas como tendo baixos níveis de maturidade em termos de inteligência de negócios e capacidade analítica. Esse déficit de capacidade pode restringir severamente o crescimento de uma empresa e introduzir riscos à sua existência, uma vez que ela não será capaz de se reinventar. Cada empresa deve agir rapidamente para avaliar suas capacidades de análise de dados e traçar um curso de transformação para uma empresa orientada a dados. É crucial ser mais responsivo aos clientes e às oportunidades de mercado, e mais ágil para lidar com a natureza rapidamente mutável da tecnologia e do mercado.

Aqui estão alguns clientes da AWS que se beneficiaram por serem empresas orientadas a dados:

  • A Moderna é uma empresa de biotecnologia pioneira em uma nova classe de medicamentos de RNA mensageiro (mRNA). Aproveitando sua plataforma de mRNA e instalações de fabricação com o mecanismo de pesquisa desenvolvido na AWS, a Moderna entregou o primeiro lote clínico de sua vacina candidata (mRNA-1273) contra a COVID-19 ao Instituto Nacional de Saúde (NIH) para o teste de Fase 1 42 dias após o sequenciamento inicial do vírus. Ao implementar e escalar suas operações na AWS, incluindo SAP S/4HANA, Amazon Redshift e Amazon Simple Storage Service (S3), a Moderna é capaz de desenhar rapidamente experimentos de pesquisa, descobrir novos insights, automatizar seus processos laboratoriais e de fabricação para melhorar seu pipeline de descoberta de medicamentos e cumprir mais facilmente leis e regulamentações durante a produção e teste de vacinas e candidatos terapêuticos.
  • A Zalando (a maior plataforma de moda on-line da Europa) começou a migrar seus sistemas SAP para a AWS para aumentar a agilidade, simplificar a manutenção de TI e criar uma arquitetura de dados pronta para o futuro como parte de sua transformação digital. Com um data lake híbrido na AWS que está totalmente integrado a um dos maiores sistemas SAP S/4HANA do mundo, a Zalando reduziu seu custo de obtenção de insights em 30%, ao mesmo tempo que melhorou a satisfação de seus clientes. A Zalando construiu seu data lake com serviços como Amazon Redshift, AWS Glue e Amazon S3.

O primeiro passo para aproveitar melhor seus dados SAP é trazê-los para o seu data lake da AWS, que o habilitará a descobrir novas oportunidades e solucionar desafios de negócios. Neste blog, discutiremos as opções de arquitetura para extrair dados do SAP para a AWS com base nas suas versões do SAP ERP ou do S/4HANA.

Vamos nos concentrar nos serviços da AWS, como Amazon Appflow, AWS Glue, AWS Lambda, Amazon API Gateway, bem como em soluções SAP, como SAP Data Services, SAP Data Intelligence para fornecer cenários básicos.

Há várias soluções de parceiros da AWS que podem ajudar na extração, processamento e análise de dados SAP, como Qlik, Bryteflow, HVR, Linke, Boomi e outros. No entanto, eles não serão discutidos neste blog, mas você pode visitar o AWS Marketplace ou entrar em contato com seu ponto de contato da AWS para obter mais informações. Se precisar de ajuda para implementar esses serviços da AWS, entre em contato com o AWS Professional Services ou com os parceiros da AWS, que estão listados no Portal de Descoberta de Parceiros da AWS.

Considerações sobre a solução

As principais considerações ao extrair dados dos sistemas SAP se enquadram em duas categorias principais, 1/ Comercial e 2/ Técnico.

Considerações comerciais

Comprar versus Construir

Para integrar a AWS ao SAP, os desenvolvedores podem implementar poucas linhas de código. Embora a execução de código customizado possa ser econômica no início, ela geralmente requer a manutenção deste código customizado. Por outro lado, existem várias soluções da SAP (como SAP Data Services), serviços gerenciados pela AWS (como o Amazon AppFlow) ou outras soluções de negócios prontas para uso (COTS), que são altamente especializadas. Elas vêm com um grande conjunto de recursos pré-construídos para facilidade de uso. Lembre-se de que é sempre importante considerar o custo total de propriedade (TCO).

Plataformas de Software de Middleware versus Nativas em Nuvem

Utilizar as plataformas de middleware para integração entre a SAP e a AWS significa esforço administrativo adicional (instalação, aplicação de patches e atualização), bem como custos de tempo de execução (licença de software). Para resolver isso, a AWS introduziu um serviço gerenciado que elimina o esforço administrativo e os custos de tempo de execução para integrar a SAP e a AWS. O Amazon AppFlow oferece uma opção sem necessidade de código e de provisionar e gerenciar servidores para extrair dados do SAP, bem como reescrever esses dados de volta ao SAP.

Impacto nas licenças SAP

Ao extrair dados do SAP e reescrevê-los de volta para o SAP, você precisará considerar seus requisitos de licenciamento do SAP.
Nota: Antes de implementar a extração de dados ou escrita de/para sistemas SAP, verifique seu contrato de licença.

Preço versus Valor

Ao comprar um software pronto para uso, como o SAP Data Services, você pode obter uma licença perpétua que permite usar o software por um período indefinido pagando uma taxa única. Com uma licença perpétua, pode ser difícil determinar os custos versus o valor comercial de uma determinada iniciativa. Quando você usa serviços nativos da nuvem, como o Amazon Appflow, você paga por uso com base no número de fluxos e no volume de dados necessários para o seu caso de uso. Esse modelo de pagamento conforme o uso, ou utilitário, permite que você entenda o custo real versus o valor comercial de uma determinada iniciativa.

Considerações técnicas

Realizar o Pull versus Push dos Dados

Em um alto nível, existem dois tipos de mecanismos para extrair dados do SAP:

  • Extraia (pull) dados do SAP e envie-os para serviços da AWS, como o Amazon S3. Esse método geralmente é executado em lotes (batch) e requer que um sistema SAP seja acessível por ferramentas de extração. Alguns clientes podem ter preocupações de Segurança em relação a essa abordagem e, portanto, esta pode ser menos preferida por eles.
  • . Esse método é mais adequado para extração “quase” em tempo real (near real-time) usando, por exemplo, o SAP Intermediate Documents (IDOC).

Gestão de Deltas

Para tabelas relativamente pequenas, por exemplo, tabelas de dados mestres, cargas completas repetitivas podem ser aceitáveis no momento da extração dos dados do SAP. Para tabelas grandes, por exemplo, tabelas de dados transacionais, é possível que haja preferência pela transferência de deltas por motivos de desempenho e custos. Com a extração delta, somente os dados que foram alterados desde a última extração são identificados. Os mecanismos SAP mais comuns para delta são Application Link Enabling (ALE) Change Pointers, Operational Data Provisioning (ODP) Delta Queues, Change Data Capture (CDC) e o uso de campos timestamp como marcadores de tempo para consultar a data e hora da última modificação.

Impacto da atualização do SAP

Para os clientes da SAP que usam o SAP ECC 6.0 ou anterior (SAP Business Suite), uma preocupação é o impacto da atualização do mecanismo de extração de dados do SAP que está sendo estabelecido. Esse desafio pode levar a uma solução que evite a extração no nível do banco de dados, devido ao fato de que mudanças significativas no esquema do banco de dados podem ser esperadas quando uma atualização para o S/4HANA é feita.

Árvore de Decisão

Levando em conta as considerações de solução acima e os aspectos práticos dos sistemas SAP, criamos uma árvore de decisão (abaixo) para ajudar a guiar os clientes na escolha de qual método é apropriado para extrair seus dados do SAP.

Uma consideração prática importante é a disponibilidade do SAP Gateway. O SAP Gateway permite que você aproveite o protocolo OData para consumir dados do SAP por meio de APIs RESTful. O OData (Open Data Protocol) é um padrão OASIS aprovado pela ISO/IEC, e roda no protocolo HTTPS. Ele suporta conectividade segura pela Internet e o uso de soluções híbridas  multi-cloud com a capacidade de escalar junto com o volume de dados. O SAP Gateway fornecerá uma ampla variedade de opções para extrair dados do SAP, não se limitando a um protocolo legado, como RFC ou IDOC.

  • Se você tiver o SAP Gateway, a próxima consideração é a versão do SAP ERP que você está executando atualmente:
    • Se você estiver executando a versão mais recente do SAP S/4HANA, terá muitos serviços OData pré-compilados que pode aproveitar para a extração de dados. Na versão mais recente do S/4HANA, existem mais de 2000 serviços OData pré-construídos. A maioria desses serviços OData é criada com a Interface de Usuário Fiori em mente. Para uma extração massiva de dados, é possível aproveitar os extratores SAP BW por meio do ODP, por incluirem mecanismos de gerenciamento de deltas, de monitoramento e de solução de problemas. Os extratores SAP BW fornecem um contexto de aplicação, reduzindo assim o trabalho de transformação no sistema de destino ou no data lake.
    • Se você estiver executando o ECC 6.0 EHP7/8, terá serviços OData pré-compilados limitados, mas ainda poderá aproveitar os extratores SAP BW por meio do ODP para a maioria da extração.
  • Se você não tiver o SAP Gateway, provavelmente está executando o SAP ECC 6.0 EHP8 ou anterior. Você pode estar preocupado com o impacto nos mecanismos de extração após realizar um upgrade do sistema SAP. Para minimizar esse impacto, recomendamos o uso de extratores SAP BW Padrão usando ODP, BAPIs Padrão ou IDocs Padrão.
    • Métodos customizados de extração do BW, BAPIs, IDocs, bancos de dados e arquivos são viáveis. No entanto, eles podem aumentar seu TCO (Total Cost of Ownership), pois você mesmo precisará criar, operar e manter o código personalizado.

Você ainda pode usar RFCS/BAPIs e IDocs no S/4HANA, no entanto, como estes são protocolos legados, suas escolhas de ferramentas de extração e opções de conectividade de rede podem ser restritas devido ao fato de que estes protocolos foram criados para ambientes LAN e WAN. Haverá desafios ao usar conexões de internet e esses protocolos podem não funcionar de forma ideal em um ambiente de nuvem híbrido. Portanto, a recomendação continua sendo considerar o OData como a primeira opção, pois é um protocolo de dados abertos que é flexível de implementar e é compatível com ambientes híbridos multi-cloud.
Decision Tree of SAP Data Extraction

Figura 1. Árvore de Decisão de diretrizes para extrair dados do SAP com os serviços da AWS.

Características do padrão de projeto arquitetônico

Abaixo está um resumo dos Padrões de Design de Arquiteturas e suas características, que são categorizados na árvore de decisão acima. Isso ajudará você a decidir sobre um método de extração para seus dados SAP.

Número Padrão de Arquitetura Método de Extração Gestão de Deltas Serviços de Middleware Prós e contras
S/4HANA ou ECC 6.0 EHP7/8, OData, com SAP Gateway
A1 S/4HANA ou ECC 6.0 EHP7/8 com serviços OData pré-construídos Serviços OData Padrão pré-construídos Considere o campo timestamp

Amazon AppFlow

AWS Glue/Lambda

SAP Data Intelligence

SAP Data Services

  • O Amazon AppFlow é um serviço de integração totalmente gerenciado, no qual não há necessidade de gerenciar servidores e escrever código, e que pode extrair e reescrever dados no SAP.
  • O AWS Glue/Lambda exige que você implemente código, mantenha e atualize quando necessário.
  • A assinatura do SAP Data Intelligence faz parte do SAP BTP (Business Technology Platform) com um modelo de pagamento conforme o uso. O SAP Data Services exige uma licença perpétua.
A2 S/4HANA ou ECC 6.0 EHP7/8 com extratores de dados (extrator BW) via OData Extratores BW padrão (baseados em ODP) Os Deltas são gerenciados dentro do ODP
  • Baixo impacto de atualização porque os extratores BW são padrão.
A3 S/4HANA ou ECC 6.0 EHP7/8 com serviços OData personalizados OData personalizado (ABAP CDS View) Considere o campo timestamp
  • Serão necessárias views personalizadas do ABAP CDS e correções de manutenção personalizadas do OData Services, especialmente durante a atualização.
ECC 6.0 EHP8 ou anterior, RFC, sem SAP Gateway
A4 ECC 6.0 EHP7/8 ou anterior com Extratores de Dados (Extratores BW) via RFC Extratores BW padrão (baseados em ODP) Os Deltas são gerenciados dentro do ODP

AWS Glue/Lambda

SAP Data Services

  • O AWS Glue/Lambda exige que você implemente código, mantenha e atualize quando necessário.
  • O SAP Data Services exige uma licença perpétua.
  • Qualquer extrator personalizado de BW e BAPI exigirá que você desenvolva o código, mantenha e modifique/atualize quando necessário.
Extratores BW personalizados A ser construído dentro de Extratores BW
A5 ECC 6.0 EHP7/8 ou anterior com BAPI via RFC BAPI padrão Considere o campo timestamp
BAPI personalizado Considere o campo timestamp
ECC 6.0 EHP8 ou anterior, HTTP-XML, sem SAP Gateway
A6 Qualquer versão do ECC ou S/4HANA com IDOCs IDOCs padrão Os Deltas são gerenciados dentro do IDOC API Gateway/AWS Lambda
  • A manutenção do IDOC requer conhecimento de SAP. Se o seu sistema for S/4HANA, recomendamos o uso do OData, que oferece melhores opções e limita o impacto da atualização para futuras melhorias.
  • O IDOC é capaz de processar near real-time push de alterações delta, assim como lotes (batches)
  • As funções do AWS Lambda exigem que você desenvolva código, mantenha e atualize quando necessário.
  • Os IDOCs personalizados exigem que você desenvolva código, mantenha e atualize quando necessário.
IDOCs personalizados Os Deltas são gerenciados dentro do IDOC
ECC 6.0 EHP8 ou anterior, JDBC, sem SAP Gateway
A7 Qualquer versão do ECC ou S/4HANA com banco de dados Banco de dados Considere o campo timestamp AWS Glue/Lambda
  • Estruturas de dados no nível de banco de dados têm um contexto de aplicação limitado ou nenhum. O conhecimento da aplicação SAP é necessário para realizar a transformação dos dados extraídos no destino.
  • A licença SAP ECC ou S/4HANA DB é uma licença de execução. Isso limita o acesso direto ao banco de dados. Esse mecanismo pode exigir licenças empresariais de banco de dados adicionais.
  • Grandes mudanças no esquema do banco de dados devem ser esperadas quando ocorrerem atualizações dos sistemas ECC para S/4HANA.
ECC 6.0 EHP8 ou anterior, Arquivos, sem SAP Gateway
A8 ECC 6.0 EHP7/8 ou anterior com BAPI por meio de arquivos Arquivos flat Considere o campo timestamp AWS Glue/Lambda
  • Esse método pode ser usado em muitas versões, como SAP ERP 6.0, S/4HANA, mas requer esforço de desenvolvimento customizado e de manutenção. A atualização também pode ser custosa.
  • Se o seu sistema for S/4HANA ou tiver sido atualizado para S/4HANA, a extração baseada em ODATA é recomendada.

Conclusão

Neste blog, discutimos padrões arquitetônicos para extrair dados do SAP para a AWS. Cada um dos padrões é descrito junto com seus prós e contras com base em considerações importantes, como gerenciamento de deltas, licenças, custos de funcionamento e o impacto de uma atualização. Com a árvore de decisão fornecida, você pode avaliar e decidir qual padrão é adequado para o seu cenário.

Aqui estão algumas referências adicionais que podem ser úteis. Elas descrevem cenários fim a fim que se tornam possíveis quando seus dados SAP são extraídos para a AWS.

Você pode obter mais informações sobre SAP na AWS, Amazon AppFlow, AWS Glue, AWS Lambda, por meio da Documentação da AWS.

Este artigo foi traduzido do Blog de AWS en Inglês

 

Sobre os autores

Ferry Mulyadi é Alliance Partner SA na AWS

 

 

 

 

Thuan Bui Thi é Associate SA na AWS

 

 

 

 

Tradutor

Maximiliano Kretowicz, Senior Solutions Architect.

 

 

 

 

Revisores

Lígia Yamamoto, Data Scaling Solutions Architect
 

Fabricio Hamada, Data Strategy Solutions Architect