Publié le: Jan 14, 2021
Dix-huit jeux de données nouveaux ou mis à jour provenant d'Illumina, de l' l'Université d'Alaska de Fairbanks, d'IntelinAir et d'autres sont disponibles sur le registre des données ouvertes dans les catégories suivantes.
Sciences de la vie :
- 1000 Genomes Phase 3 Reanalysis with DRAGEN 3.5 d’Illumina, Inc.
- BindingDB géré par Amazon Web Services (AWS)
- Sounds of Central African Landscapes du Center for Conservation Bioacoustics, Université de Cornell
- Mis à jour :Genome In A Bottle de l’agence gouvernementale américaine National Institute of Standards and Technology
Sciences géospatiales :
- AgricultureVision d’IntelinAir
- Copernicus Digital Elevation Model géré par Singerise
- High Resolution Downscaled Climate Data pour l’Alaska du Sud-Est de l’université d’Alaska de Fairbanks
Climat et météorologie :
- IDEAM Colombian Radar Network d’IDEAM
- Global Forecast System Warm Start Initial Conditions de l’agence américaine de la National Oceanic and Atmospheric Administration (NOAA)
- Unified Forecast System Subseasonal to Seasonal prototype 5 de la NOAA
- WRF Downscaled Coupled Model Intercomparison Project 6 (CMIP6) de l’université californienne UCLA
- Mis à jour : High-Resolution Rapid Refresh Archive de la NOAA et en format Zarr géré par l’université de l’Utah
- Mis à jour : Coupled Model Intercomparison Project 6 (CMIP6) format NetCDF géré par la Earth Science Grid Federation (ESGF)
- Mis à jour : National Water Model Reanalysis en format Zarr de la NOAA
Machine learning :
- DialogLUE d’AWS
- Natural Scenes Dataset de l’université du Minnesota
- Sophos/ReversingLabs 20 Million Malware Detection Dataset de Sophos AI
- CoversBR - A Large Dataset for Cover Song Identification de Dirceu G Silva
Le programme de sponsoring des données ouvertes AWS couvre les frais de stockage des ensembles de données optimisés pour le cloud à forte valeur accessibles au public. Nous collaborons avec les fournisseurs de données qui souhaitent :
- Démocratiser l'accès aux données en les rendant disponibles à l'analyse sous AWS ;
- Développer de nouvelles techniques, formats et outils natifs cloud pour réduire le coût des travaux avec les données ;
- Encourager le développement des communautés qui bénéficient de l'accès aux ensembles de données partagés.