Como conecto meu caderno do Amazon SageMaker Studio a um cluster do Amazon Redshift?

Data da última atualização: 15/11/2022

Quero conectar meu caderno do Amazon SageMaker Studio a um cluster do Amazon Redshift.

Resolução

Cluster acessível ao público

Se o cluster do Redshift estiver acessível publicamente, você poderá acessá-lo a partir de uma das seguintes opções:

  • Um domínio do SageMaker executado somente com internet pública e sem acesso à Amazon Virtual Private Cloud (Amazon VPC)
  • Um domínio do SageMaker Studio executado em uma Amazon VPC

Se o cluster Redshift estiver em uma VPC diferente, configure uma conexão de emparelhamento da VPC para garantir que o Studio possa acessar o cluster.

Cluster privado

Se o cluster do Redshift for privado, você poderá acessá-lo somente por meio de um domínio do SageMaker Studio executado em uma Amazon VPC. Se o cluster estiver em uma VPC diferente, configure uma conexão de emparelhamento da VPC para garantir que o Studio possa acessar o cluster.

Requisitos adicionais

Certifique-se de que os seguintes requisitos sejam atendidos para os dois tipos de clusters:

  • O grupo de segurança conectado ao SageMaker Studio permite tráfego de saída para portas efêmeras. Quando um cliente Studio se conecta a um servidor Redshift, uma porta aleatória do intervalo de portas efêmeras (1024-65535) torna-se a porta de origem do cliente.
  • O grupo de segurança conectado ao cluster Redshift permite a conexão de entrada do grupo de segurança vinculado ao domínio do SageMaker Studio na porta 5439.
  • Se você configurou o DNS personalizado, verifique se o servidor DNS usado pela VPC do Studio pode resolver o nome do host do cluster Redshift.