Conjuntos de dados públicos na AWS

Os conjuntos de dados públicos na AWS oferecem um repositório centralizado de conjuntos de dados públicos que pode ser integrado de modo fácil nos aplicativos baseados em nuvem da AWS. AWS está hospedando os conjuntos de dados públicos gratuitamente para a comunidade e, como todos os serviços da AWS, os usuários pagam somente pela computação e pelo armazenamento que utilizam para seus próprios aplicativos.

Anteriormente, os grandes conjuntos de dados, como o mapeamento do Genôma Humano e os dados do Censo norte-americano, necessitaram de horas ou dias para localização, download, personalização e análise. Atualmente, qualquer pessoa pode acessar esses conjuntos de dados das suas instâncias do Amazon Elastic Compute Cloud (Amazon EC2) e iniciar a entrada dos dados em minutos. Os usuários podem utilizar todo o ecossistema da AWS e colaborar de modo fácil com outros usuários da AWS. Por exemplo, os usuários podem produzir ou utilizar imagens de servidor pré-criadas com ferramentas e aplicativos para análise dos conjuntos de dados. Os usuários também podem discutir as melhores práticas e soluções no fórum dedicado Conjunto de dados públicos.

Ao hospedar esses dados úteis e importantes com serviços econômicos, como o Amazon EC2, a AWS espera oferecer aos pesquisadores de diversas disciplinas e setores as ferramentas para uma maior inovação e de modo mais rápido.

Cadastrar-se no Amazon EC2




Esta página contém as seguintes categorias de informações. Clique para rolar para baixo:

Conjuntos de dados públicos disponíveis na AWS

No decorrer do tempo, a AWS continuará a complementar a coleção de domínio público disponível e os conjuntos de dados não proprietários. Os conjuntos de dados atualmente disponíveis são mostrados a seguir. Os snapshots do Linux/UNIX estão em formato ISO9660 ou EXT3 e os snapshots do Windows estão em formato NTFS.

Você pode obter uma lista completa de conjuntos de dados em nosso Centro de recursos de Conjuntos de dados públicos.

Alguns exemplos de Conjuntos de dados públicos populares são:

  • Cópia de dados do Freebase Freebase.com
    Uma cópia de dados de todos os fatos atuais e asserções no sistema Freebase. Freebase é um banco de dados aberto contendo as informações mundiais, incluindo milhões de tópicos em centenas de categorias. Com coleta de grandes conjuntos de dados abertos como Wikipedia, MusicBrainz e arquivos SEC, ele contém informações sobre muitos tópicos populares, incluindo filmes, música, pessoas e locais – todos compatíveis e disponíveis gratuitamente.

Início


Como ele funciona

Os conjuntos de dados selecionados estão hospedados gratuitamente no Amazon EC2 como snapshots de Amazon Elastic Block Store (Amazon EBS). Os clientes do Amazon EC2 podem acessar esses dados ao criarem seus próprios volumes do Amazon EBS, usando os snapshots do conjunto de dados público como ponto de partida. Eles podem acessar, modificar e realizar a computação desses volumes diretamente usando as instâncias do Amazon EC2 e somente pagam pelos recursos de armazenamento e computação usados. Se disponíveis, os pesquisadores também podem usar as Amazon Machine Images (AMIs) com ferramentas como a Inquiry by BioTeam para realizarem suas análises.

Para iniciar usando os Conjuntos de dados públicos na AWS, apenas realize essas três etapas fáceis:

  1. Cadastre uma conta do Amazon EC2.
  2. Inicie uma instância do Amazon EC2.
  3. Crie um volume do Amazon EBS usando uma ID de Snapshot listada no catálogo acima para o seu snapshot escolhido.

O Guia de Conceitos Básicos do ElasticFox fornece uma descrição simples de como iniciar uma instância e criar um volume do Amazon EBS usando o ElasticFox, um plugin prático do FireFox. Ou, veja o Guia de Conceitos Básicos do Amazon EC2.

Se você tiver qualquer dúvida ou se deseja participar da comunidade de Conjuntos de dados públicos, visite o nosso fórum de Conjuntos de dados públicos.

Início


Como compartilhar um conjunto de dados públicos na AWS

Se você tiver um domínio público ou um conjunto de dados não proprietário que imagine ser útil e interessante para a comunidade da AWS, envie uma solicitação abaixo e a equipe da AWS analisará a sua solicitação e retornará com a resposta. Normalmente, os conjuntos de dados no repositório estão entre 1 GB a 1 TB de tamanho (com base no limite de volume do Amazon EBS), mas podemos trabalhar em conjunto com você para também hospedar os conjuntos de dados. Você deve ter o direito de disponibilizar os dados gratuitamente.

Para iniciar, preencha o formulário de envio neste link e um membro da nossa equipe irá entrar em contato com você em relação ao seu conjunto de dados público. Nós o orientaremos em relação à publicação do seu conjunto de dados para o repositório de dados.




Reduce Your EC2 Bill

Veja como os clientes, como a Numerate, reduziram pela metade a sua conta do Amazon EC2, em apenas 5 dias usando as Instâncias Spot.




©2011, Amazon Web Services LLC ou suas afiliadas. Todos os direitos reservados.