Nouveaux ensembles de données publiques AWS disponibles auprès du Massachusetts Institute of Technology, the Street Foundation, d'Ookla, et d'autres

Publié le: Oct 8, 2020

Trente-deux ensembles de données nouveaux ou mis à jour du Massachusetts Institute of Technology, the First Street Foundation, Ookla, et d'autres sont disponibles dans le Registry de Open Data dans les catégories suivantes.

COVID-19 :

Folding@home COVID19 Datasets du Folding@home Consortium
COVID Hiring Data: US Hiring Rates de Greenwich.HR

Sciences de la vie :

Genome Aggregation Database (gnomAD) et UK Biobank Panancestry GWAS Summary Statistics du Broad Institute
Ohio State Cardiac MRI Raw Data de l'Ohio State University
Medical Decathlon Segmentation Datasets de la Medical Decathlon Team
Distributed Archives for Neurophysiology Data Integration (DANDI) du Massachusetts Institute of Technology
Oxford Nanopore Technologies Benchmark Datasets d'Oxford Nanopore Technologies
ChEMBL 25 and 27 et Open Targets 2020-06 gérés par Amazon Web Services (AWS)
Mis à jour : Human PanGenomics Project du Human PanGenomics References Consortium

Sciences géospatiales :

Low Altitude Disaster Imagery (LADI) de MIT Lincoln Lab
Données National Aerial Imagery Program (NAIP) 2019 gérées par Esri
Analysis Ready Sentinel-1 Backscatter Imagery géré par Indigo Ag
Sentinel-2 Cloud-Optimized GeoTIFFs géré par Element 84
S-111 Surface Water Currents Data de NOAA
ISS SERVIR Environmental Research and Visualization System (ISERV) géré par la Radiant Earth Foundation
PoroTomo Distributed Acoustic Sensing (DAS) du National Renewable Energy Laboratory

Climat et météorologie :

Ozone Monitoring Instrument (OMI) / Aura NO2 Tropospheric Column Density de la NASA
World Ocean Database de NOAA
Global Ensemble Forecast System Re-forecasts de NOAA
Space Weather Forecast and Observation Data de NOAA
Coupled Model Intercomparison Project 6 géré par Pangeo
Flood Risk Summary Statistics de la First Street Foundation
Department of Energy's Open Energy Data Initiative (OEDI) géré par le National Renewable Energy Laboratory
Weather Radar Data du Finnish Meteorological Institute

Machine learning :

Radiant MLHub de la Radiant Earth Foundation
Japanese Tokenizer Dictionaries de Cotonoha
Dictionnaires japonais et intégration des mots pour le traitement du langage naturel de Works Application
Automatic Speech Recognition (ASR) Error Robustness d'Amazon
Enriched Topical-Chat Dataset for Knowledge-Grounded Dialogue Systems d'Amazon

Mise en réseau :

Speedtest by Ookla Global Fixed and Mobile Network Performance Maps d'Ookla.com

Le programme AWS Public Dataset couvre les frais de stockage des ensembles de données optimisés pour le cloud accessibles au public. Nous collaborons avec les fournisseurs de données qui souhaitent :

Démocratiser l'accès aux données en les rendant disponibles à l'analyse sous AWS ;
Développer de nouvelles techniques, formats et outils natifs cloud pour réduire le coût des travaux avec les données ;
Encourager le développement des communautés qui bénéficient de l'accès aux ensembles de données partagés

Découvrir comment proposer votre ensemble de données au programme AWS Open Data Sponsorship
En savoir plus sur Open Data sur AWS

Nouveaux ensembles de données publiques AWS disponibles auprès du Massachusetts Institute of Technology, the Street Foundation, d'Ookla, et d'autres

Fin de la prise en charge d'Internet Explorer