Publié le: Oct 8, 2020
Trente-deux ensembles de données nouveaux ou mis à jour du Massachusetts Institute of Technology, the First Street Foundation, Ookla, et d'autres sont disponibles dans le Registry de Open Data dans les catégories suivantes.
COVID-19 :
- Folding@home COVID19 Datasets du Folding@home Consortium
- COVID Hiring Data: US Hiring Rates de Greenwich.HR
Sciences de la vie :
- Genome Aggregation Database (gnomAD) et UK Biobank Panancestry GWAS Summary Statistics du Broad Institute
- Ohio State Cardiac MRI Raw Data de l'Ohio State University
- Medical Decathlon Segmentation Datasets de la Medical Decathlon Team
- Distributed Archives for Neurophysiology Data Integration (DANDI) du Massachusetts Institute of Technology
- Oxford Nanopore Technologies Benchmark Datasets d'Oxford Nanopore Technologies
- ChEMBL 25 and 27 et Open Targets 2020-06 gérés par Amazon Web Services (AWS)
- Mis à jour : Human PanGenomics Project du Human PanGenomics References Consortium
Sciences géospatiales :
- Low Altitude Disaster Imagery (LADI) de MIT Lincoln Lab
- Données National Aerial Imagery Program (NAIP) 2019 gérées par Esri
- Analysis Ready Sentinel-1 Backscatter Imagery géré par Indigo Ag
- Sentinel-2 Cloud-Optimized GeoTIFFs géré par Element 84
- S-111 Surface Water Currents Data de NOAA
- ISS SERVIR Environmental Research and Visualization System (ISERV) géré par la Radiant Earth Foundation
- PoroTomo Distributed Acoustic Sensing (DAS) du National Renewable Energy Laboratory
Climat et météorologie :
- Ozone Monitoring Instrument (OMI) / Aura NO2 Tropospheric Column Density de la NASA
- World Ocean Database de NOAA
- Global Ensemble Forecast System Re-forecasts de NOAA
- Space Weather Forecast and Observation Data de NOAA
- Coupled Model Intercomparison Project 6 géré par Pangeo
- Flood Risk Summary Statistics de la First Street Foundation
- Department of Energy's Open Energy Data Initiative (OEDI) géré par le National Renewable Energy Laboratory
- Weather Radar Data du Finnish Meteorological Institute
Machine learning :
- Radiant MLHub de la Radiant Earth Foundation
- Japanese Tokenizer Dictionaries de Cotonoha
- Dictionnaires japonais et intégration des mots pour le traitement du langage naturel de Works Application
- Automatic Speech Recognition (ASR) Error Robustness d'Amazon
- Enriched Topical-Chat Dataset for Knowledge-Grounded Dialogue Systems d'Amazon
Mise en réseau :
Le programme AWS Public Dataset couvre les frais de stockage des ensembles de données optimisés pour le cloud accessibles au public. Nous collaborons avec les fournisseurs de données qui souhaitent :
- Démocratiser l'accès aux données en les rendant disponibles à l'analyse sous AWS ;
- Développer de nouvelles techniques, formats et outils natifs cloud pour réduire le coût des travaux avec les données ;
- Encourager le développement des communautés qui bénéficient de l'accès aux ensembles de données partagés
Découvrir comment proposer votre ensemble de données au programme AWS Open Data Sponsorship
En savoir plus sur Open Data sur AWS