O que é compartilhamento de dados?

O compartilhamento de dados é o processo de disponibilizar os mesmos recursos de dados para várias aplicações, usuários ou organizações. Inclui tecnologias, práticas, estruturas legais e elementos culturais que facilitam o acesso seguro aos dados para várias entidades sem comprometer a integridade dos dados. O compartilhamento de dados melhora a eficiência dentro de uma organização e promove a colaboração com fornecedores e parceiros. A consciência dos riscos e oportunidades de dados compartilhados é parte integrante do processo.

Por que o compartilhamento de dados é importante para as empresas?

As organizações têm compartilhado dados desde antes do advento da internet. No entanto, o progresso na alfabetização digital, tecnologia e adoção da nuvem resultou em compartilhamento de dados em uma escala sem precedentes. Aqui estão três fatores principais que contribuíram para o crescimento do compartilhamento de dados:

  • As tecnologias de armazenamento, processamento e transferência de dados estão cada vez mais disponíveis e acessíveis
  • Uma nova mentalidade da indústria trata os dados como um recurso e um ativo
  • Políticas e regulamentos mudaram e visam reduzir os riscos de compartilhamento de dados

As empresas modernas entendem que o compartilhamento de dados é vital para melhorar as relações com a comunidade e novas oportunidades de negócios. Descrevemos alguns dos benefícios abaixo.

Melhor valor para os clientes

A combinação de informações de diferentes fontes de dados tem o potencial de aumentar o valor e a performance dos serviços. Essa abordagem promove uma melhor pesquisa e desenvolvimento de produtos. Por exemplo, a WB Games, divisão de videogames da Warner Bros., utiliza compartilhamento de dados para ajudar a embasar o processo criativo de desenvolvimento de seus jogos. Ele captura, ingere, analisa e ações para ajudar seus desenvolvedores a se tornarem mais oportunistas e ágeis com suas narrativas.

Leia como a WB Games usa a AWS »

Decisões orientadas por dados

Ao compartilhar informações de forma transparente, as equipes quebram os silos de dados e contribuem para análises aprimoradas. A business intelligence melhora e as partes interessadas tomam decisões impactantes de longo prazo. Por exemplo, a GE Renewable Energy tem mais de 49 mil turbinas eólicas instaladas e gerando eletricidade eólica em todo o mundo. As turbinas da GE são equipadas com sensores e conectadas a redes avançadas que coletam dados sobre temperatura, velocidade do vento, eletricidade e outros fatores relacionados à performance da turbina. O sistema de análise de dados da GE facilita a tomada de decisões para manutenção e produtividade de turbinas.

Leia como a GE usa a AWS »

Impacto social positivo

Autoridades e organizações públicas podem compartilhar mais dados de maneira segura, legal e respeitosa. Isso cria novas oportunidades de colaboração que beneficiam a comunidade em geral. Por exemplo, os esforços de compartilhamento de dados no setor de saúde contribuem positivamente para a pesquisa médica, levando a coisas como um tremendo progresso no campo da pesquisa genômica.

Leia como o setor de genômica usa a AWS »

Quais os riscos do compartilhamento de dados?

A divulgação de dados tem potenciais riscos regulatórios, competitivos, financeiros e de segurança. Descrevemos algumas ameaças críticas abaixo.

Divulgação de privacidade

Cada organização tem obrigações legais e éticas para proteger a privacidade dos dados do cliente que possuem. Eles precisam tomar as medidas apropriadas para compartilhar dados sem comprometer a privacidade. As tecnologias de preservação da privacidade, como criptografia e redação, permitem o compartilhamento seguro de dados.

Interpretação incorreta de dados

A falta de comunicação entre produtores e consumidores de dados pode resultar em má interpretação analítica. Os analistas podem fazer suposições incorretas ao explicar relatórios e resultados. Por exemplo, uma redução nos pedidos de clientes em um determinado mês pode ser atribuída a um orçamento de marketing mais baixo, embora o motivo real possa ser um atraso na disponibilidade do produto.

Baixa qualidade dos dados

Os consumidores de dados podem ter controle limitado sobre a qualidade e disponibilidade dos dados. Eles podem ter que lidar com dados ausentes ou duplicados, questões sobre validade, falta de documentação de dados e problemas semelhantes. Preconceitos ocultos contra um determinado gênero, raça, religião ou grupo étnico também podem estar presentes no conjunto de dados.

Quais são algumas tecnologias de compartilhamento de dados?

Existem muitas tecnologias que reduzem o atrito entre produtores e consumidores, mitigam riscos e aumentam o valor do compartilhamento de dados. Veja alguns exemplos a seguir.

Data warehousing

Um data warehouse é um repositório central para armazenar dados de várias unidades de negócios. A arquitetura de data warehouses é composta de camadas. A camada superior é o cliente de front-end, que apresenta os resultados por meio de ferramentas de relatórios, análises e mineração de dados. A camada intermediária consiste no mecanismo de análises, usado para acessar e analisar os dados. A camada inferior da arquitetura é o servidor de banco de dados, onde os dados são carregados e armazenados. As aplicações de camada superior e intermediária podem compartilhar conjuntos de dados comuns armazenados na camada inferior.

Os data warehouses são úteis para o compartilhamento interno de dados. As workloads que acessam dados compartilhados podem ser isoladas umas das outras.

APIs

Uma API é um mecanismo que permite que dois componentes de software se comuniquem usando um conjunto de definições e protocolos. A interface pode ser considerada como um contrato de serviço entre duas aplicações. Esse contrato define como as duas se comunicam usando solicitações e respostas. As APIs de compartilhamento de dados oferecem suporte a controles de acesso refinados e especificam exatamente quais dados os consumidores podem solicitar.

Leia sobre APIs »

Aprendizagem federada

Aprendizagem federada é a tecnologia de machine learning (ML) que permite que sistemas de inteligência artificial treinem em conjuntos de dados distribuídos. Os produtores de dados mantêm o controle enquanto contribuem para avanços tecnológicos colaborativos. Por exemplo, os algoritmos de ML que detectam o câncer são treinados em imagens de tecidos cancerígenos de várias instituições médicas.

Leia sobre machine learning »

Tecnologia blockchain

A tecnologia blockchain é um mecanismo de banco de dados avançado que permite o compartilhamento transparente de informações na rede de uma empresa. Um banco de dados blockchain armazena dados em blocos interligados em uma cadeia. Os dados são cronologicamente consistentes porque não é possível excluir nem modificar a cadeia sem o consenso da rede. Como resultado, você pode usar a tecnologia blockchain para criar um ledger inalterável ou imutável para monitorar pedidos, pagamentos, contas e outras transações. Além disso, o sistema tem mecanismos integrados que impedem entradas de transações não autorizadas e criam consistência na visualização compartilhada dessas transações.

Leia sobre blockchain »

Plataformas de troca de dados

As plataformas de dados abertos permitem que diferentes entidades registrem seus conjuntos de dados para consumo público; você só tem que preparar e enviar os dados. A plataforma fornece a infraestrutura para armazenamento e acesso. Qualquer pessoa pode acessar seus dados.

Como a AWS pode oferecer suporte ao seu esforço de compartilhamento de dados?

Quando os dados são compartilhados na AWS, qualquer pessoa pode analisá-los e criar serviços com sua utilização com uma ampla gama de produtos analíticos de computação e dados. Esses produtos incluem o Amazon Cloud Compute (Amazon EC2), o Amazon Athena, o AWS Lambda e o Amazon EMR. O compartilhamento de dados em nuvem permite que seus usuários gastem mais tempo na análise de dados do que na aquisição de dados. Veja alguns exemplos de tecnologia a seguir.

  • O Amazon Redshift é uma tecnologia de armazenamento de dados que permite acesso instantâneo, granular e rápido aos dados sem a necessidade de copiá-los ou movê-los. Seus usuários sempre veem as informações mais atualizadas e consistentes à medida que são atualizadas no data warehouse.
  • O Amazon Managed Blockchain é um serviço totalmente gerenciado que facilita a criação e o gerenciamento de redes de blockchain escaláveis e da tecnologia de livros contáveis distribuídos.
  • O AWS Data Exchange permite localizar facilmente conjuntos de dados que estão publicamente disponíveis por meio de serviços da AWS.

Comece a usar o compartilhamento de dados na AWS criando uma conta gratuita hoje mesmo.

Próximas etapas para compartilhamento de dados

Confira recursos adicionais relacionados a produtos
Confira os serviços do Analytics 
Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS.

Cadastre-se 
Comece a criar no console

Comece a criar no Console de Gerenciamento da AWS.

Faça login