O que é um esquema de banco de dados?

Um esquema de banco de dados é uma estrutura lógica que define como os dados são organizados em um banco de dados. Bancos de dados relacionais e alguns bancos de dados não relacionais usam esquemas para descrever a estrutura de seus dados, suas interconexões e processos internos. Os esquemas de banco de dados fornecem um esquema lógico para armazenamento e organização de dados, para maior acessibilidade do usuário, escalabilidade e integridade dos dados.

Quais são os benefícios de um esquema de banco de dados?

Como um esquema de banco de dados define como uma empresa organiza seus dados, há vários benefícios em usar um.

Melhorar a organização

As empresas podem organizar suas informações em estruturas de dados claras para melhorar a organização e garantir que as relações entre os conjuntos de dados sejam claras e consistentes. Um esquema bem definido também permite que as empresas escalem seu sistema de gerenciamento de banco de dados com mais facilidade.

Melhorar a integridade dos dados

Ao implementar regras sobre como sua empresa armazena dados com um esquema, você garante um alto nível de integridade, mesmo em sistemas de armazenamento complexos. Manter regras consistentes ajuda a garantir a validade dos dados e atender aos requisitos de conformidade.

Aumentar a acessibilidade

Um esquema de banco de dados oferece várias visualizações das estruturas gerais de dados que você usa. Usando esses vários níveis, os designers, os administradores e as partes interessadas podem discutir a estrutura mesmo sem ter um conhecimento técnico.

Quais são as etapas para criar um esquema de banco de dados?

Há três etapas para criar esquemas de banco de dados comumente usados em um sistema de gerenciamento de banco de dados.

1. Esquema conceitual do banco de dados

Um design conceitual de esquema de banco de dados é a visualização de mais alto nível de um banco de dados, fornecendo uma visão geral do banco de dados sem os pormenores. Um design conceitual de esquema de banco de dados geralmente é um desenho rápido feito à mão.

Por exemplo, bancos de dados relacionais armazenam dados em tabelas, com cada tabela contendo um conjunto de dados relacionados. Um esquema conceitual de banco de dados pode descrever uma tabela de produtos e seus atributos, uma tabela de clientes e uma relação de um para muitos entre tabelas. No entanto, um esquema conceitual de banco de dados pode não conter detalhes de implementação mais precisos, como tipos de dados ou restrições de acesso.

Um esquema conceitual é útil para mapear o fluxo geral de dados em uma organização, sem oferecer muitos detalhes.

2. Esquema lógico do banco de dados

Um design de esquema lógico de banco de dados fornece um resumo de como os dados em um banco de dados são estruturados. Ele descreve a relação entre entidades e mostra mais detalhes sobre como os dados são organizados. Um design de esquema lógico de banco de dados geralmente é um exercício de modelagem digital de dados.

Cada entidade no esquema de dados é definida em relação a informações, tais como:

Nomes de tabelas
Relacionamentos entre entidades
Nomes de atributos
Valores padrão
Tipos de dados
Restrições de segurança
Procedimentos
Visualizações
Índices
Metadados

Um design de esquema lógico completo garante a integridade e a consistência de dados, fornecendo restrições para dados novos e existentes.

Os esquemas lógicos de banco de dados normalmente não incluem nenhum requisito técnico.

3. Esquema de banco de dados físico

Um esquema de banco de dados físico descreve exatamente onde os dados podem ser encontrados em uma estrutura de banco de dados mais ampla. Ele inclui detalhes técnicos de armazenamento, identificando os locais dos arquivos, formatos específicos de armazenamento e estratégias de indexação usadas por cada tabela para armazenar seus dados. Um design de esquema físico geralmente é uma combinação de padrões de design técnico de banco de dados fixos e especificações do usuário.

O esquema físico é a forma menos conceitual de esquema de banco de dados e oferece um insight real da localização dos dados. Esquemas lógicos e físicos são necessários para a instanciação do banco de dados.

Quais são as formas de modelar esquemas de banco de dados?

Diferentes tipos de estilos de esquema de banco de dados atendem a diferentes necessidades de negócios e tipos de dados. Bancos de dados de processamento de transações on-line (OLTP), como sistemas de pedidos de produtos, usam a técnica de modelagem do esquema Entidade-Relacionamento. Bancos de dados de processamento analítico on-line (OLAP), como consultas de negócios complexas, podem exigir diferentes técnicas de modelagem, como o esquema star e o esquema snowflake.

Confira abaixo alguns dos estilos de esquema de banco de dados mais conhecidos.

Esquema Entidade-Relacionamento (ER)

Um esquema de entidade-relacionamento atribui cada entidade a uma tabela e, em seguida, mapeia as conexões entre as tabelas. Os esquemas E-R têm várias relações de bridging entre todos os dados; 1:1. 1:muitos e muitos:muitos. Esse tipo de esquema de banco de dados relacional utiliza tabelas, colunas e linhas para construir sistemas de dados, que eles conectam por meio de relacionamentos e restrições.

Esquema star

As empresas podem utilizar um esquema star para gerenciar e organizar grandes conjuntos de dados com base em dois princípios principais: fatos e dimensões. No contexto de um esquema star, os fatos são o centro da estrutura e fornecem dados baseados em medições. Exemplos desses fatos centrais são o número de transações, cliques no site ou total de compras. As dimensões então fornecem informações adicionais sobre o fato, como qual cliente fez a compra, onde ela foi feita e qual produto comprou.

Esquema snowflake

Um esquema snowflake, assim como um esquema star, usa uma tabela de fatos central que então se conecta a tabelas de várias dimensões. No entanto, diferentemente do esquema star, as tabelas de dimensões do esquema snowflake terão uma variedade de tabelas de banco de dados adicionais que se ramificam delas, oferecendo mais detalhes sobre essas dimensões. Usar um esquema snowflake é útil para dados que têm um grande número de dimensões e subdimensões. Os esquemas star e snowflake são frequentemente usados em business intelligence. Essas duas abordagens permitem que os usuários do banco de dados organizem sua visão dos dados organizada por dimensões de negócios específicas.

Esquema hierárquico

Um esquema de banco de dados hierárquico emprega uma estrutura em forma de árvore, com um nó raiz na parte superior que se ramifica em outras ramificações do nó. Em um modelo hierárquico, cada dado “principal” pode ter vários nós secundários, enquanto cada nó secundário só pode ter um principal. Por exemplo, um modelo hierárquico pode começar com uma empresa, ramificar-se para cada departamento e, então, ramificar-se para funcionários individuais dentro de cada departamento.

Qual é o processo de criação de um esquema de banco de dados OLTP?

O processo de criação de um esquema de banco de dados é chamado de modelagem de dados.

Aqui estão as principais etapas para produzir um modelo de dados de um sistema OLTP.

Reunir os requisitos

Antes de criar um banco de dados, você deve identificar sua finalidade e descrever as principais informações, como os dados que você deseja que ele contenha e como planeja usar o banco de dados. O melhor banco de dados para você vai variar de acordo com:

Os dados específicos que você usa
As consultas de que você precisa para interagir com o banco de dados
Os relatórios que você deseja gerar

Esta etapa descreve seus objetivos, orientando seu processo de design de esquema de banco de dados.

Criar diagramas de entidade-relacionamento

Um diagrama de entidade-relacionamento (ERD) mapeia como as tabelas, os objetos de banco de dados e as entidades individuais em um banco de dados se conectam. A criação de uma visualização do esquema conceitual do seu banco de dados permite que você visualize como o banco de dados funciona e obtenha insights sobre os dados que ele armazena.

Nesse estágio, você também pode definir as convenções de nomenclatura que tabelas, colunas, objetos de banco de dados e índices usam em seu banco de dados. As convenções ajudam todos a ter uma abordagem padrão ao inserir dados.

Organizar entidades de dados em tabelas

Com base no seu mapa ERD, agora você pode organizar todos os seus dados em tabelas específicas. Cada entidade em sua estrutura de banco de dados deve ter sua própria tabela, com colunas individuais contendo os atributos relacionados. Defina a chave primária que permitirá identificar e recuperar facilmente valores de dados específicos.

Normalizar estruturas de dados

A normalização é um processo no design de esquema de banco de dados que visa reduzir a redundância de dados e melhorar a integridade dos dados. Envolve organizar os dados em tabelas de forma que as relações entre eles sejam bem estruturadas e as anomalias sejam minimizadas.

Existem vários formulários normais, cada um com requisitos específicos. Cada formulário normal sucessivo aborda um tipo diferente de redundância ou dependência para melhorar a consistência de dados e tornar o esquema mais robusto.

1NF

O 1NF exige que cada coluna contenha valores atômicos (indivisíveis) e que cada registro seja exclusivo. Ele remove grupos repetidos e campos com vários valores.

2NF

O 2NF baseia-se no 1NF garantindo que todos os atributos que não são chave sejam totalmente dependentes funcionalmente de toda a chave primária (ou seja, elimina as dependências parciais).

3NF

O 3NF acrescenta que todos os atributos não chave devem depender somente da chave primária, e não de outros atributos que não sejam chave (ou seja, ele remove dependências transitivas).

Implementar medidas de segurança

Crie uma estrutura de permissões para garantir que somente usuários autorizados possam acessar seu banco de dados e visualizar as informações que ele contém. Você pode atribuir privilégios distintos a diferentes grupos de usuários no banco de dados, como a capacidade de ler, gravar ou excluir informações, o que ajuda a manter seus dados sensíveis seguros. Defina controles de acesso baseados em perfis para garantir que somente usuários autorizados possam visualizar ou modificar dados sensíveis.

Teste

Testar o design do esquema do banco de dados com algumas consultas básicas e outras interações garante que tudo funcione conforme o esperado. A coleta de dados sobre como o banco de dados funciona nesse estágio informará quaisquer alterações adicionais que você precise fazer para garantir que seu esquema seja eficaz e livre de problemas de performance.

Qual é a diferença entre um esquema de banco de dados e uma instância de banco de dados?

Um esquema de banco de dados refere-se ao design geral de um banco de dados, fornecendo informações sobre sua estrutura, o que ele pode incluir e as relações entre os conjuntos de dados. No entanto, um esquema de dados é apenas o esquema para a organização de dados; o esquema não contém nenhum dado.

Uma instância de banco de dados é a sessão ativa que um esquema de banco de dados descreve e mantém os dados a qualquer momento. Uma instância é onde os valores reais dos dados estão, e eles mudarão constantemente à medida que novos dados forem adicionados, excluídos ou atualizados. Diferentemente dos esquemas de banco de dados, as instâncias de banco de dados contêm todos os dados.

O que é conversão de esquema de banco de dados?

Uma conversão de esquema de banco de dados é o processo de adaptação de um esquema de banco de dados existente a um novo formato. Isso pode envolver a adição ou modificação de tabelas, colunas, índices, restrições ou relações entre tabelas.

O objetivo geralmente é oferecer suporte a novos requisitos de aplicações, melhorar a performance ou migrar para um sistema de banco de dados diferente. A conversão de esquemas permite uma organização de dados mais eficiente ou oferece suporte a recursos de um novo sistema.

A migração de dados pode ou não exigir conversão de esquema, dependendo dos bancos de dados de origem e destino.

Como a AWS pode apoiar seus requisitos de esquema de banco de dados?

O processo de modelagem de dados normalmente é feito fora do banco de dados. Depois que o modelo é criado, o Amazon Relational Database Service (RDS) oferece suporte à criação e ao gerenciamento de esquemas por meio do SQL padrão. O Amazon RDS fornece sistemas de gerenciamento de banco de dados relacional gerenciado, como PostgreSQL, MySQL e Amazon Aurora.

Para migrações de bancos de dados, o AWS Database Migration Service (DMS) é um serviço gerenciado de migração que ajuda a mover suas workloads de bancos de dados e de analytics para a AWS com rapidez e segurança. O banco de dados de origem permanece totalmente operacional durante a migração, minimizando o tempo de inatividade das aplicações que dependem dele.

A conversão do esquema DMS no AWS DMS torna as migrações de banco de dados entre diferentes tipos de bancos de dados mais previsíveis. Ele pode avaliar a complexidade de sua migração para seu provedor de dados de origem e converter esquemas de banco de dados e objetos de código. Você pode então aplicar o código convertido ao seu banco de dados de destino.

O novo recurso de IA generativa no AWS DMS Schema Conversion automatiza algumas das tarefas de conversão de esquemas mais demoradas. O recurso converte automaticamente até 90% dos objetos do esquema de bancos de dados comerciais em migrações do PostgreSQL.

Você também pode usar o AWS Schema Conversion Tool (SCT) para converter seu esquema existente de banco de dados de um mecanismo de banco de dados para outro.

Comece com a conversão de esquema de banco de dados na AWS criando uma conta gratuita hoje mesmo.

O que é um esquema de banco de dados?