Atributos do Amazon Aurora
O Amazon Aurora é um serviço de banco de dados relacional que combina a velocidade e a disponibilidade de bancos de dados comerciais avançados com a simplicidade e a economia de bancos de dados de código aberto. O Aurora é totalmente compatível com MySQL e PostgreSQL, permitindo que aplicações e ferramentas existentes sejam executadas sem a necessidade de modificação.
Alta performance e escalabilidade
Throughput cinco vezes maior que o MySQL e três vezes maior que o PostgreSQL
Testes em benchmarks padrão, como o SysBench, mostraram um aumento no throughput de até cinco vezes acima do MySQL padrão e de três vezes acima do PostgreSQL padrão em hardware semelhante. O Aurora usa uma variedade de técnicas de software e hardware para garantir que o mecanismo de banco de dados seja capaz de usar integralmente a computação, a memória e as redes disponíveis. As operações de E/S usam técnicas de sistemas distribuídos, como quóruns, para melhorar a consistência da performance.
Configuração de tecnologia sem servidor
O Amazon Aurora Sem Servidor é uma configuração de escalabilidade automática sob demanda para o Aurora, na qual o banco de dados é inicializado, encerrado e aumenta ou diminui a capacidade com base nas necessidades da aplicação. Com o Aurora Sem Servidor, é possível executar bancos de dados na nuvem sem gerenciar instâncias de banco de dados. Também é possível usar instâncias do Aurora Sem Servidor v2 junto com instâncias provisionadas em seus clusters de banco de dados existentes ou novos.
Escalabilidade de computação ao toque de um botão
Você pode usar as APIs do Amazon Relational Database Service (Amazon RDS) ou o Console de Gerenciamento da AWS para aumentar ou reduzir a escala na vertical de instâncias provisionadas de sua implantação. As operações de escalabilidade de computação normalmente são concluídas em alguns minutos.
Ajuste de escala automático de armazenamento
O Aurora ajusta a escala de E/S automaticamente para atender às necessidades de suas aplicações mais exigentes. Também aumenta o tamanho do volume do seu banco de dados à medida que suas necessidades de armazenamento aumentam. O volume crescerá em incrementos de 10 GB até um máximo de 128 TiB. Você não precisa provisionar armazenamento em excesso para o banco de dados a fim de lidar com o crescimento futuro. Ao usar a configuração do Amazon Aurora Otimizado para E/S para os clusters de banco de dados, o Aurora também oferece até 40% de economia de custos quando os gastos com E/S excedem 25% dos gastos com o banco de dados do Aurora. Para saber mais, acesse Armazenamento e confiabilidade do Aurora.
Réplicas de leitura de baixa latência
Você pode aumentar a taxa de throughput de leitura para oferecer suporte a altos volumes de solicitações de aplicações criando até 15 réplicas de banco de dados Amazon Aurora. As réplicas do Aurora compartilham o mesmo armazenamento que a instância de origem, diminuindo os custos e evitando a necessidade de fazer gravações nos nós de réplica. Isso libera mais capacidade de processamento para atender às solicitações de leitura e reduz a defasagem das réplicas para menos de dez milissegundos, na maioria das vezes. O Aurora oferece um endpoint leitor para que a aplicação possa se conectar sem necessidade de acompanhar as réplicas adicionadas e removidas. Ele também oferece suporte ao ajuste de escala automático, adicionando e removendo réplicas automaticamente em resposta às mudanças nas métricas de desempenho que você especificar. Para saber mais, acesse Como usar o Amazon Aurora Auto Scaling com réplicas do Aurora.
O Aurora oferece suporte a réplicas de leitura entre regiões. As réplicas entre regiões fornecem leituras locais rápidas para seus usuários e cada região tem 15 réplicas do Aurora adicionais para escalar ainda mais as leituras locais. Consulte Amazon Aurora Global Database para obter detalhes.
Endpoints de banco de dados personalizados
Os endpoints personalizados permitem distribuir e balancear as cargas em diferentes conjuntos de instâncias de bancos de dados. Por exemplo, você pode provisionar um conjunto de réplicas do Aurora para usar um tipo de instância com maior capacidade de memória para executar uma workload de análises. Um endpoint personalizado pode ajudar a rotear a workload para essas instâncias configuradas adequadamente e isolar as demais instâncias dela.
Aurora Optimized Reads para Aurora PostgreSQL
O Amazon Aurora Optimized Reads é um novo recurso de preço/performance que oferece latência de consulta até 8 vezes maior e economia de custos de até 30% em comparação com instâncias sem ele. Ele é ideal para aplicações com grandes conjuntos de dados que excedem a capacidade de memória de uma instância de banco de dados.
As instâncias do Optimized Reads usam armazenamento SSD local em nível de bloco baseado em NVMe, disponível em instâncias r6gd baseadas em Graviton e r6id baseadas em Intel, para melhorar a latência de consulta de aplicações com conjuntos de dados que excedem a capacidade de memória de uma instância de banco de dados. O Optimized Reads inclui aprimoramentos de performance, como armazenamento em cache hierárquico e objetos temporários, para permitir que você aproveite ao máximo suas instâncias de banco de dados.
Com uma latência de consulta até 8 vezes maior, você pode executar eficientemente workloads com leituras pesadas e uso intenso de E/S, como painéis operacionais, detecção de anomalias e pesquisas de semelhanças com o pgvector. O Amazon Aurora PostgreSQL Optimized Reads com pgvector aumenta as consultas por segundo para pesquisa vetorial em até 9 vezes em workloads que excedem a memória de instância disponível. O Optimized Reads está disponível para o Aurora com compatibilidade com PostgreSQL.
Aurora Parallel Query para Aurora MySQL
O Amazon Aurora Parallel Query oferece consultas analíticas mais rápidas em comparação com os dados atuais. O recurso pode acelerar as consultas em até duas ordens de magnitude, sem afetar a alta taxa de transferência das workloads transacionais essenciais. Com a transferência do processamento de consultas para a camada de armazenamento do Aurora, o recurso obtém uma grande quantidade de capacidade computacional e reduz o tráfego de rede. Use o Parallel Query para executar workloads transacionais e analíticas lado a lado no mesmo banco de dados do Aurora. O Parallel Query está disponível para Aurora com compatibilidade com MySQL.
Diagnosticar e resolver gargalos de performance com o Amazon DevOps Guru para RDS
O Amazon DevOps Guru é um serviço de operações na nuvem alimentado por machine learning (ML) que ajuda a melhorar a disponibilidade da aplicação. Com o Amazon DevOps Guru for RDS, você pode usar insights baseados em ML para ajudar a detectar e diagnosticar facilmente problemas de banco de dados relacional relacionados à performance. Ele foi projetado para resolvê-los em minutos, em vez de dias. Os desenvolvedores e engenheiros de DevOps podem usar o DevOps Guru para RDS para identificar automaticamente a causa raiz dos problemas de performance e obter recomendações inteligentes para ajudar a resolvê-los, sem precisar da ajuda de especialistas em banco de dados.
Para começar a usar, basta acessar o Console de Gerenciamento do Amazon RDS e habilitar o Insights de Performance do Amazon RDS. Com o Performance Insights ativado, acesse o console do Amazon DevOps Guru e habilite-o para seus recursos do Aurora, outros recursos compatíveis ou a conta inteira.
Alta disponibilidade e resiliência
Monitoramento e reparo de instâncias
O Amazon RDS monitora continuamente a integridade do banco de dados do Aurora e instância do Amazon Elastic Compute Cloud (Amazon EC2) adjacente. No caso de falha do banco de dados, o Amazon RDS reiniciará automaticamente o banco de dados e processos associados. Nas recuperações de falha, o Aurora não precisa reproduzir os logs de repetição do banco de dados, o que reduz significativamente os tempos de reinicialização. O serviço também isola o cache do buffer do banco de dados dos processos do banco de dados, o que permite que o cache sobreviva a uma reinicialização do banco de dados.
Implantações Multi-AZ com réplicas do Aurora
Em caso de falha da instância, o Aurora usa a tecnologia Multi-AZ do Amazon RDS para automatizar o failover para uma de até 15 réplicas do Aurora criadas em qualquer uma das três zonas de disponibilidade. Em caso de falha, se nenhuma réplica do Aurora tiver sido provisionada, o Amazon RDS tentará criar automaticamente uma nova instância de banco de dados do Aurora. Minimize o tempo de failover substituindo os drivers MySQL e PostgreSQL da comunidade pelo AWS JDBC Driver for MySQL e AWS JDBC Driver for PostgreSQL compatíveis com código aberto e drop-in. Você também pode usar o RDS Proxy para reduzir os tempos de failover e melhorar a disponibilidade. Quando ocorrem failovers, o Amazon RDS Proxy roteia as solicitações diretamente para a nova instância do banco de dados, reduzindo os tempos de failover em até 66% e preservando as conexões da aplicação.
Aurora Global Database
Para aplicações distribuídas globalmente, é possível usar um Aurora Global Database, em que um único banco de dados do Aurora pode abranger várias regiões da AWS para permitir leituras locais e recuperação de desastres rápidas. Um Aurora Global Database usa a replicação baseada em armazenamento para replicar um banco de dados em várias regiões, com a latência típica de menos de um segundo. Você pode usar uma região secundária como uma opção de backup caso precise se recuperar rapidamente de uma redução regional ou interrupção. Um banco de dados em uma região secundária pode ser promovido para ter os recursos completos de leitura e gravação em menos de 1 minuto. Para saber mais, acesse Como usar bancos de dados globais do Amazon Aurora.
Armazenamento tolerante a falhas e com correção automática
O volume de armazenamento do banco de dados do Aurora é segmentado em partes de 10 GiB e replicado em três zonas de disponibilidade, com cada zona de disponibilidade mantendo duas cópias de cada gravação. O armazenamento do Aurora é tolerante a falhas e trata de forma integrada a perda de até duas cópias de dados sem afetar a disponibilidade de gravação do banco de dados, bem como a perda de até três cópias sem afetar a disponibilidade de leitura. Além disso, o armazenamento do Aurora conta com recuperação automática: os blocos de dados e os discos são verificados continuamente para detecção de erros e substituição automática.
Backup automático, contínuo, incremental e restauração para um ponto no tempo
O recurso de backup do Aurora permite a recuperação para um ponto no tempo da sua instância. Isso permite que você restaure seu banco de dados a qualquer segundo durante o período de retenção, até os últimos cinco minutos. O período de retenção do backup automático pode ser configurado para até 35 dias. Os backups automáticos são armazenados no Amazon Simple Storage Service (Amazon S3), que foi projetado para ter resiliência de 99,999999999%. Os backups do Aurora são automáticos, incrementais e contínuos e não afetam a performance do banco de dados.
Snapshots do banco de dados
Os snapshots do banco de dados são backups iniciados pelo usuário da sua instância armazenada no Amazon S3 que serão mantidos até que você explicitamente os exclua. Eles aproveitam os snapshots incrementais automáticos para diminuir o tempo e o armazenamento necessários. Você pode criar uma nova instância de banco de dados com base em um Snapshot onde desejar.
Backtrack para Aurora MySQL
O Backtrack permite mover rapidamente um banco de dados para um ponto no tempo anterior, sem necessidade de restaurar dados de um backup. Com esse recurso, você pode se recuperar rapidamente de erros de usuário, como excluir a tabela errada ou a linha errada. Quando você habilita o Backtrack, o Aurora retém todos os registros de dados pela duração de Backtrack especificada. Por exemplo, você pode configurar o Backtrack para permitir que o banco de dados volte até 72 horas no tempo. O Backtrack é concluído em segundos, mesmo para bancos de dados grandes, pois elimina a necessidade de cópia de registros de dados. Você pode avançar e recuar para encontrar o ponto logo antes da ocorrência do erro.
O Backtrack também é útil para desenvolvimento e teste, em especial, em situações nas quais o teste exclui ou invalida os dados. Basta voltar o banco de dados ao estado original, e você estará pronto para uma nova execução de teste. É possível criar um script que chama o Backtrack por meio de uma API e executa o teste. Esse script pode ser integrado facilmente ao framework de teste. O Backtrack está disponível para o Aurora com compatibilidade com MySQL.
Altamente seguro
Isolamento da rede
O Aurora é executado na Amazon Virtual Private Cloud (Amazon VPC), que ajuda a isolar o banco de dados em sua própria rede virtual e se conectar à infraestrutura de TI on-premises usando VPNs IPsec criptografadas padrão do setor. Para saber mais sobre o Amazon Relational Database Service (RDS) na Amazon VPC, consulte o Guia do usuário do Amazon RDS. Além disso, ao usar o Amazon RDS, é possível configurar as definições do firewall e controlar o acesso de rede às suas instâncias de banco de dados.
Permissões no nível do recurso
O Aurora é integrado ao AWS Identity and Access Management (IAM) e oferece a capacidade de controlar as ações que seus usuários e grupos do IAM podem realizar em recursos específicos do Amazon Aurora (por exemplo, instâncias de banco de dados, snapshots de banco de dados, grupos de parâmetros de banco de dados, assinaturas de eventos de banco de dados e grupos de opções de banco de dados). Também é possível atribuir tags aos recursos do Aurora e controlar as ações que seus usuários e grupos do IAM podem executar em grupos de recursos que têm a mesma tag (e valor de tag). Para obter mais informações sobre a integração do IAM, consulte a documentação sobre autenticação de banco de dados do IAM.
Criptografia
O Aurora ajuda a criptografar bancos de dados usando chaves criadas e controladas pelo AWS Key Management Service (KMS). Em uma instância de banco de dados em execução com a criptografia do Aurora, os dados ociosos mantidos no armazenamento subjacente são criptografados, bem como os backups automáticos, as réplicas de leitura e os snapshots desses dados no mesmo cluster. O Aurora usa SSL (AES-256) para proteger os dados em trânsito.
Auditoria avançada
O Aurora ajuda a registrar eventos de banco de dados em logs com impacto mínimo na performance do banco de dados. Posteriormente, os logs podem ser analisados para fins de gerenciamento de banco de dados, segurança, governança, conformidade normativa e outras finalidades. Também é possível monitorar a atividade enviando logs de auditoria ao Amazon CloudWatch.
Amazon GuardDuty RDS Protection
O Amazon GuardDuty oferece detecção de ameaças para o Aurora, para ajudar você a identificar possíveis ameaças aos dados armazenados em bancos de dados Aurora. O GuardDuty RDS Protection monitora e cria perfis da atividade de login em bancos de dados novos e existentes na sua conta e usa modelos de ML para detectar logins suspeitos com precisão em bancos de dados do Aurora. Se uma ameaça em potencial for detectada, o GuardDuty gera uma descoberta de segurança que inclui detalhes do banco de dados e informações contextuais avançadas sobre a atividade suspeita. A integração do Aurora com o GuardDuty oferece acesso direto aos logs de eventos do banco de dados sem exigir que você modifique seus bancos de dados e foi projetada para não causar impacto na performance do banco de dados.
Econômico
Pague somente pelo que usar
Não há compromisso inicial com o Aurora. Você paga uma taxa por hora para cada instância executada e, quando terminar de usar uma instância de banco de dados do Aurora, você pode excluí-la. Não é necessário provisionar armazenamento excedente como margem de segurança. Você paga apenas pelo armazenamento realmente consumido. Para ver mais detalhes, acesse a página Definição de preço do Aurora.
Previsibilidade de preços em qualquer escala
O Aurora oferece a flexibilidade de otimizar seus gastos com o banco de dados, escolhendo entre duas opções de configuração com base em suas necessidades de desempenho e previsibilidade de preço, independentemente do consumo de E/S da sua aplicação. As duas opções de configuração são Aurora I/O-Optimized e Aurora Standard. Nenhuma das opções exige provisionamento inicial de E/S ou armazenamento e ambas podem escalar E/S para suportar seus aplicativos mais exigentes.
O Aurora I/O-Optimized é uma configuração de cluster de banco de dados. Ele oferece melhor relação performance/preço para clientes com workloads com uso intensivo de E/S, como sistemas de processamento de pagamentos, sistemas de comércio eletrônico e aplicações financeiras. Se o gasto de E/S exceder 25% do gasto total do banco de dados do Aurora, é possível economizar até 40% nos custos das workloads com uso intensivo de E/S ao usar o Aurora otimizado para E/S. Com o Aurora otimizado para E/S, você paga pelas instâncias e pelo armazenamento do banco de dados. Não há cobranças pelas operações de E/S de leitura e gravação, fornecendo previsibilidade de preço para todas as aplicações, independentemente da variabilidade de E/S.
O Aurora Standard é uma configuração de cluster de banco de dados que oferece preços econômicos para a grande maioria dos aplicativos com uso de E/S baixo a moderado. Com o Aurora Standard, você paga por instâncias de banco de dados, armazenamento e E/S com pagamento por solicitação.
Otimizar custos de E/S
Para uma aplicação que faz muitas análises, os custos de E/S normalmente são os que mais contribuem para o custo do banco de dados. As operações de E/S são executadas pelo mecanismo de banco de dados Aurora na sua camada de armazenamento virtualizado com base em SSDs. Cada operação de leitura de página de banco de dados conta como uma E/S. O mecanismo de banco de dados Aurora emite leituras na camada de armazenamento para obter as páginas de banco de dados que não estão presentes no cache do buffer. Cada página do banco de dados tem 8 KB no Aurora with PostgreSQL compatibility e 16 KB no Aurora with MySQL compatibility.
O Aurora foi projetado para eliminar operações de E/S desnecessárias com o objetivo de reduzir custos e garantir a disponibilidade de recursos para atender ao tráfego de leitura/gravação. As operações de E/S de gravação são consumidas apenas durante o envio de registros de log para a camada de armazenamento com o intuito de tornar as gravações mais duradouras. As operações de E/S de gravação são contadas em unidades de 4 KB. Por exemplo, um registro de log de transação com 1.024 bytes conta como uma operação de E/S. Porém, operações de gravação simultâneas com log de transação inferior a 4 KB poderão ser armazenadas juntas em lotes pelo mecanismo de banco de dados Aurora para otimizar o consumo de E/S. Diferentemente dos mecanismos de banco de dados tradicionais, o Aurora nunca envia páginas de banco de dados modificadas para a camada de armazenamento, o que resulta em economias de consumo de E/S ainda maiores.
Você pode ver quantas operações de E/S a sua instância do Aurora está consumindo acessando o Console de Gerenciamento da AWS. Para localizar o seu consumo de E/S, consulte a seção RDS do console, pesquise na lista de instâncias, selecione as suas instâncias do Aurora e procure pelas métricas “Operações de leitura faturadas” e “Operações de gravação faturadas” na seção de monitoramento.
Você é cobrado pelas operações de E/S de leitura e gravação ao configurar seus clusters de banco de dados com a configuração Aurora Standard. Você não é cobrado pelas operações de E/S de leitura e gravação ao configurar seus clusters de banco de dados para o Aurora Otimizado para E/S. Para obter mais informações sobre os preços das operações de E/S, visite a página Definição de preço do Aurora.
Preço/performance com o Aurora Optimized Reads para Aurora PostgreSQL
O Aurora Optimized Reads para Aurora PostgreSQL oferece aos clientes que possuem aplicações sensíveis à latência e conjuntos de trabalho grandes uma alternativa atraente de preço/performance para atender aos SLAs de seus negócios. Os clientes também têm mais flexibilidade para aumentar seus conjuntos de dados sem a necessidade de aumentar frequentemente suas instâncias de banco de dados para obter maior capacidade de memória. O Optimized Reads incluei aprimoramentos de performance, como armazenamento em cache hierárquico e objetos temporários.
O armazenamento em cache hierárquico oferece latência de consulta até 8 vezes maior e economia de custos de até 30% para aplicações com leituras pesadas e uso intenso de E/S, como painéis operacionais, detecção de anomalias e pesquisas de semelhanças com base em vetores. Esses benefícios são obtidos quando os dados em cache são automaticamente removidos do cache de buffer do banco de dados na memória para o armazenamento local, a fim de acelerar os acessos subsequentes desses dados. O armazenamento em cache hierárquico apenas está disponível para o Aurora PostgreSQL com a configuração otimizada para E/S do Aurora.
Objetos temporários alcançam um processamento de consultas mais rápido ao colocar tabelas temporárias geradas pelo Aurora PostgreSQL no armazenamento local, melhorando a performance de consultas que envolvem classificações, agregações de hash, junções de alta carga e outras operações com uso intenso de dados.
Totalmente gerenciados
Fácil de usar
Começar com o Aurora é fácil. Basta iniciar uma instância de banco de dados do Aurora usando o Console de Gerenciamento do Amazon RDS ou uma única chamada de API ou CLI. As instâncias de banco de dados do Aurora são pré-configuradas com parâmetros e definições apropriados para a classe da instância de banco de dados selecionada. É possível lançar uma instância de banco de dados e conectar sua aplicação em minutos, sem necessidade de configuração adicional. Os grupos de parâmetros de bancos de dados fornecem controle granular e ajuste fino do seu banco de dados.
Monitoramento e métricas
O Aurora oferece métricas do Amazon CloudWatch para suas instâncias de banco de dados sem custo adicional. É possível usar o Console de Gerenciamento da AWS para visualizar mais de 20 métricas operacionais principais para suas instâncias de banco de dados, incluindo computação, memória, armazenamento, throughput de consultas, taxa de acertos do cache e conexões ativas. Além disso, você pode usar o Enhanced Monitoring para coletar métricas da instância do sistema operacional onde o banco de dados é executado. Você pode usar os Insights de Performance do Amazon RDS, uma ferramenta de monitoramento de banco de dados que facilita a detecção de problemas de performance e toma as providências para corrigi-los, com uma painel fácil de entender que visualiza a carga do banco de dados. Por fim, você também pode usar o Amazon DevOps Guru para RDS para detectar facilmente problemas de performance, identificar automaticamente a causa raiz desses problemas e obter recomendações inteligentes para ajudar a resolvê-los sem precisar da ajuda de especialistas em banco de dados..
Implantações azuis/verdes do Amazon RDS
Implantações azuis/verdes do Amazon RDS permitem fazer atualizações de banco de dados mais seguras, simples e rápidas sem perda de dados no Aurora, edição compatível com MySQL e no Aurora, edição compatível com PostgreSQL. Em poucas etapas, as implantações azuis/verdes criam um ambiente de preparação, que faz o espelhamento do ambiente de produção, e mantêm os dois ambientes sincronizados com o uso da replicação lógica. Você pode fazer alterações, como upgrades de versão principal/secundária, modificações de esquema e alterações na configuração de parâmetros, sem afetar a workload de produção.
Durante a promoção do seu ambiente de preparação, as implantações azuis/verdes bloqueiam as gravações em ambos os ambientes, azul e verde, até que a troca seja concluída. As implantações azuis/verdes usam barreiras de proteção integradas de troca que esgotam o tempo limite da promoção quando ela excede o tempo de inatividade máximo tolerável, detecta erros de replicação, verifica a integridade de instâncias etc.
Aplicação automática de patches de software
O Aurora manterá seu banco de dados atualizado com os patches mais recentes. É possível controlar a aplicação de patches na instância de banco de dados por meio do gerenciamento de versão do mecanismo do banco de dados. O Aurora usa a aplicação de patches sem tempo de inatividade sempre que possível. Se ocorrer uma janela de tempo adequada, a instância será atualizada no local, as sessões das aplicações serão preservadas e o mecanismo de banco de dados será reiniciado enquanto a aplicação do patch está em execução, gerando uma queda de taxa de throughput temporária (aproximadamente cinco segundos).
Notificações de eventos de banco de dados
O Aurora pode notificá-lo por e-mail ou SMS sobre eventos de banco de dados importantes, como um failover automatizado. É possível usar o Console de Gerenciamento da AWS ou as APIs do Amazon RDS para assinar mais de 40 eventos de banco de dados diferentes associados às suas implementações do Amazon Aurora.
Clonagem de banco de dados
O Aurora oferece suporte a operações de clonagem rápidas e eficientes que permitem clonar clusters de banco de dados de vários terabytes em alguns minutos. A clonagem é útil para diversas finalidades, incluindo desenvolvimento de aplicações, testes, atualizações de banco de dados e execução de consultas analíticas. A disponibilidade imediata de dados pode acelerar consideravelmente projetos de desenvolvimento e atualização de software, bem como aumentar a precisão das análises de dados.
É possível clonar um banco dados do Aurora em apenas algumas etapas, e isso não incorrerá em cobranças de armazenamento, exceto se você usar espaço adicional para armazenar as alterações de dados.
Iniciar/parar o banco de dados
É possível parar e iniciar manualmente um banco de dados do Aurora em apenas algumas etapas. Isso torna fácil e acessível o uso do Aurora para fins de desenvolvimento e testes, atividades que não exigem a execução contínua do banco de dados. Parar o banco de dados não exclui seus dados. Consulte a documentação sobre parar/iniciar para obter mais detalhes.
Integrações ETL zero NOVIDADE
Integração ETL zero do Aurora com o Amazon Redshift
A Integração ETL zero do Amazon Aurora com o Amazon Redshift permite análises e ML quase em tempo real usando o Amazon Redshift em petabytes de dados transacionais do Aurora, eliminando a necessidade de criar e manter pipelines de dados complexos que realizam operações de extração, transformação e carregamento (ETL). Dados transacionais são replicados de maneira automática e contínua em segundos depois de serem escritos no Aurora e disponibilizados diretamente no Amazon Redshift.
Quando os dados estiverem disponíveis no Amazon Redshift, você poderá começar a analisá-los imediatamente e aplicar atributos avançados, como compartilhamento de dados, visões materializadas e Amazon Redshift ML para obter insights holísticos e preditivos. Você pode consolidar várias tabelas de vários clusters de banco de dados do Aurora e replicar seus dados em um data warehouse do Amazon Redshift para executar análises unificadas em várias aplicações e fontes de dados. Ao usar o Aurora Sem Servidor e o Amazon Redshift sem servidor, você pode gerar análises quase em tempo real sobre dados transacionais sem precisar gerenciar infraestruturas de pipelines de dados. Leia nossa documentação sobre como trabalhar com integrações ETL zero do Aurora com o Amazon Redshift.
IA generativa
O Aurora oferece recursos para permitir que modelos de machine learning (ML) e inteligência artificial (IA) generativa funcionem com dados armazenados no Aurora em tempo real e sem migrá-los. Com o Amazon Aurora edição compatível com PostgreSQL, é possível acessar recursos de banco de dados de vetores para armazenar, pesquisar, indexar e consultar incorporações de ML com a extensão pgvector.
Uma incorporação de vetor é uma representação numérica que representa o significado semântico do conteúdo, como texto, imagens e vídeo. A IA generativa e outros sistemas de IA/ML usam incorporações para capturar o significado semântico da entrada desse conteúdo em um grande modelo de linguagem (LLM). É possível armazenar incorporações de modelos de ML e de IA, como os do Amazon Bedrock e do Amazon SageMaker, em seus bancos de dados do Aurora. Leia nossa documentação sobre versões de extensões para o Aurora PostgreSQL.
O Amazon Aurora PostgreSQL está disponível como base de conhecimento para o Amazon Bedrock conectar as fontes de dados privadas da sua organização aos modelos de base (FM) e permitir fluxos de trabalho de geração aumentada de recuperação automatizada (RAG) neles. Isso faz com que seus FMs tenham mais conhecimento sobre seu domínio e organização específicos. Leia nossa documentação sobre como usar o Aurora PostgreSQL como base de conhecimento para o Amazon Bedrock.
O machine learning do Aurora (Aurora ML) também simplifica a adição de previsões e modelos de IA generativa ao banco de dados Aurora. O Aurora ML expõe modelos de ML como funções SQL, permitindo usar SQL padrão para chamar modelos de ML, passar dados para eles e retornar previsões, resumos de texto ou sentimentos como resultados de consulta. Com o Aurora ML, você pode tornar o processo de adição de novas incorporações ao seu banco de dados Aurora PostgreSQL com a extensão pgvector em tempo real por meio de chamadas periódicas para um modelo SageMaker ou Amazon Bedrock, que retorna as incorporações mais recentes e atualizadas.
Suporte à migração
Migrações de banco de dados MySQL
As ferramentas padrão de importação e exportação do MySQL funcionam com o Aurora. Também é possível criar facilmente um novo banco de dados do Aurora a partir de um snapshot de banco de dados do Amazon RDS para MySQL. As operações de migração baseadas em snapshots de banco de dados normalmente são concluídas em menos de uma hora, mas variam com base na quantidade e no formato dos dados que estão sendo migrados.
Como alternativa, o AWS Database Migration Service (AWS DMS) oferece ferramentas nativas integradas de dentro do console do DMS para uma migração perfeita. Sem instâncias de replicação para provisionar ou escalar, você pode iniciar uma migração de banco de dados com apenas alguns cliques e pagar somente por hora pelo tempo usado.
Também é possível configurar uma replicação baseada em log binário entre um banco de dados Aurora edição compatível com MySQL e um banco de dados MySQL externo executado dentro ou fora da AWS.
Migrações de banco de dados PostgreSQL
As ferramentas padrão de importação e exportação do PostgreSQL funcionam com o Aurora, incluindo pg_dump e pg_restore. O Aurora também oferece suporte à importação de snapshots do Amazon RDS para PostgreSQL e à replicação com o AWS Database Migration Service (AWS DMS).
Migrações de banco de dados comerciais
O Aurora oferece um ambiente ideal para mover workloads de bancos de dados comerciais. O Aurora tem recursos funcionais que são semelhantes aos dos mecanismos de banco de dados comerciais e oferece o desempenho, a resiliência e a alta disponibilidade de nível empresarial exigidas pela maioria das workloads de banco de dados das empresas. O AWS Database Migration Service (AWS DMS) pode ajudar a acelerar as migrações de banco de dados para o Aurora com atributos gerenciados, como o DMS Schema Conversion e DMS Sem Servidor. O DMS Schema Conversion avaliará e converterá automaticamente esquemas e objetos de origem para serem compatíveis com o cluster do Aurora de destino. Enquanto isso, o DMS Sem Servidor automatizará o provisionamento, o monitoramento e a escalabilidade dos recursos de migração.
Babelfish para Aurora PostgreSQL
O Babelfish para Aurora PostgreSQL é um novo recurso do Aurora edição compatível com PostgreSQL que permite que o Aurora entenda comandos de aplicações escritas para o Microsoft SQL Server. Agora, com o Babelfish, o Aurora PostgreSQL entende T-SQL, o dialeto SQL exclusivo do Microsoft SQL Server, e oferece suporte ao mesmo protocolo de comunicações. Assim, as aplicações escritas originalmente para o SQL Server funcionarão com o Aurora após poucas alterações no código. Dessa forma, o esforço necessário para modificar e migrar aplicações executadas no SQL Server 2005 ou em uma versão mais recente para o Aurora diminui, possibilitando migrações mais rápidas, menos arriscadas e mais econômicas. O Babelfish é um recurso integrado do Aurora e não exige nenhum custo adicional. É possível habilitar o Babelfish em seu cluster Aurora em apenas algumas etapas no console do RDS.
Produtividade do desenvolvedor
Extensões de linguagem confiáveis para PostgreSQL
O Trusted Language Extensions (TLE) para PostgreSQL é um kit de desenvolvimento e um projeto de código aberto que permite criar rapidamente extensões de alta performance e executá-las com segurança no Aurora sem precisar que a AWS certifique códigos. Os desenvolvedores podem usar linguagens conhecidas, como JavaScript, PL/pgSQL, Perl e SQL, para escrever extensões com segurança. O TLE foi criado para impedir o acesso a recursos não seguros e limita os defeitos da extensão a uma única conexão de banco de dados. Os administradores de banco de dados têm controle detalhado e online sobre quem pode instalar as extensões e podem criar um modelo de permissões para executá-las. O TLE está disponível para clientes do Aurora sem custo adicional.
Machine Learning no Aurora
O Aurora oferece recursos de machine learning diretamente do banco de dados, permitindo adicionar previsões baseadas em ML às suas aplicações por meio da linguagem de programação SQL familiar. Com uma integração simples, otimizada e segura entre os serviços de machine learning do Aurora e da AWS, você tem acesso a uma ampla seleção de algoritmos de ML sem precisar criar integrações personalizadas ou mover dados. Saiba mais sobre o Aurora machine learning.
Amazon RDS Proxy
O Aurora trabalha em conjunto com o Amazon RDS Proxy, um proxy de banco de dados totalmente gerenciado e altamente disponível, que torna as aplicações mais escaláveis, resistentes a falhas do banco de dados e seguras. O RDS Proxy permite que as aplicações agrupem e compartilhem conexões estabelecidas com o banco de dados, melhorando a eficiência e a escalabilidade da aplicação. Reduz os períodos de failover, conectando-se automaticamente a uma nova instância de banco de dados, preservando as conexões de aplicativos. Aumenta a segurança por meio de integrações com o AWS IAM e o AWS Secrets Manager.
API de dados
A API de dados é uma API de HTTPS segura e fácil de usar para executar consultas SQL em bancos de dados Aurora, acelerando o desenvolvimento de aplicações modernas. A API de dados elimina as tarefas de configuração de rede e aplicações necessárias para se conectar com segurança a um banco de dados do Aurora, o que torna o acesso ao Aurora tão simples quanto fazer uma chamada de API. A API de dados elimina o uso de drivers de banco de dados e software de pool de conexões do lado do cliente. Ele também melhora a escalabilidade da aplicação ao agrupar e compartilhar automaticamente as conexões do banco de dados. A API de dados aumenta a segurança por meio de integrações com o AWS IAM e o AWS Secrets Manager.
Os desenvolvedores podem chamar a API de dados por meio de aplicações criadas com um SDK da AWS. A API de dados também fornece acesso aos bancos de dados do Aurora para as APIs do AWS AppSync GraphQL.