Publicado: Jan 14, 2021
Dezoito conjuntos de dados novos ou atualizados da Illumina, da University of Alaska Fairbanks, da IntelinAir e de outros estão disponíveis no Registry of Open Data nas categorias a seguir.
Ciências biológicas:
- 1000 Genomes Phase 3 Reanalysis with DRAGEN 3.5 da Illumina, Inc.
- BindingDB gerenciado pela Amazon Web Services (AWS)
- Sounds of Central African Landscapes do Center for Conservation Bioacoustics, Cornell University
- Atualizado: Genome In A Bottle do National Institute of Standards and Technology
Dados geoespaciais:
- AgricultureVision da IntelinAir
- Copernicus Digital Elevation Model gerenciado pela Singerise
- Dados climáticos em escala reduzida e de alta resolução para o sudeste do Alasca, da University of Alaska Fairbanks
Clima e tempo:
- IDEAM Colombian Radar Network da IDEAM
- Global Forecast System Warm Start Initial Conditions da National Oceanic and Atmospheric Administration (NOAA)
- Unified Forecast System Subseasonal to Seasonal prototype 5 da NOAA
- WRF Downscaled Coupled Model Intercomparison Project 6 (CMIP6) da UCLA
- Atualizado: High-Resolution Rapid Refresh Archive da NOAA e, no formato Zarr, gerenciado pela University of Utah
- Atualizado: Coupled Model Intercomparison Project 6 (CMIP6) em formato NetCDF gerenciado pela Earth Science Grid Federation (ESGF)
- Atualizado: National Water Model Reanalysis em formato Zarr da NOAA
Machine learning:
- DialogLUE da AWS
- Natural Scenes Dataset da University of Minnesota
- Sophos/ReversingLabs 20 Million Malware Detection Dataset da Sophos AI
- CoversBR - A Large Dataset for Cover Song Identification de Dirceu G Silva
O Programa de patrocínio de dados abertos da AWS cobre o custo de armazenamento de conjuntos de dados de alto valor otimizados para a nuvem e disponíveis para o público. Trabalhamos com provedores de dados que buscam:
- Democratizar o acesso aos dados, disponibilizando-os para análise na AWS
- Desenvolver novas técnicas, ferramentas e formatos nativos da nuvem que diminuam o custo de trabalhar com dados
- Incentivar o desenvolvimento de comunidades que se beneficiem do acesso a bancos de dados compartilhados
Saiba como sugerir seu conjunto de dados para o Programa de patrocínio de dados abertos da AWS.