Publié le: Jul 15, 2020
Vingt-trois nouveaux ensembles de données publiques, ou mis à jour, Amazon Web Services (AWS) provenant du National Center for Bioinformatics, de l’université Johns Hopkins, de l’université du Texas à Southwestern, de la National Oceanic and Atmospheric Administration (NOAA), du National Cancer Institute, du National Herbarium de Nouvelle-Galles du Sud, et d’autres sont désormais disponibles dans les catégories suivantes :
Réponse à la COVID-19 :
- COVID-19 Molecular Structure and Therapeutics Hub du Molecular Sciences Software Institute
- COVID-19 Genome Sequence Dataset du National Center for Biotechnology Information
Sciences de la vie :
- Cloud Genomic Indexes de l’université Johns Hopkins et de l’université du Texas à Southwestern
- Refgenie Genomic Assets de l’université de Virginie
- Gabriella Miller Kids First Pediatric Research Program du National Cancer Institute
- The Cancer Genome Atlas du National Cancer Institute
- Basic Local Alignment Sequence Tool (BLAST) Databases de la National Library of Medicine
- National Herbarium de Nouvelle-Galles du Sud du Royal Botanic Gardens and Domain Trust
Sciences météorologiques :
- National Blend of Models de la NOAA
- National Digital Forecast Database de la National Oceanic and Atmospheric Administration
- NEXRAD Level 3 du NOAA géré par Unidata
- Storm EVent ImageRy (SEVIR) du Massachusetts Institute of Technology
- Cartes d’inondation RAPID NRT de l’Eversource Energy Center, de l’université du Connecticut
- Tracking the Sun du National Renewable Energy Laboratory
- Ensemble de données US Wave du National Renewable Energy Laboratory
Sciences géospatiales :
- Digital Aerial Imagery Catalog couvrant l’État du New Jersey et donnéesLiDAR du New Jersey Office of Information Technology
- Crowd Sourced Bathymetry (CSB) de la NOAA
- Prefeitura Municipal de São Paulo (PMSP) LiDAR Point Cloud de GeoSampa
- Sentinel-3 de la société Meteorological Environmental Earth Observation
Machine learning :
- RarePlanes de CosmiQ Works
- Multilingual Amazon Reviews Corpus d’Amazon
- Answer Reformulation par Alexa Shopping
- Humor Detection from Product Question Answering Systems par Alexa Shopping
Le programme AWS Public Dataset couvre les frais de stockage des ensembles de données de grande valeur optimisés pour le cloud et accessibles au public. Nous travaillons avec les fournisseurs de données qui souhaitent :
- Démocratiser l'accès aux données en les rendant disponibles à l'analyse sous AWS ;
- Développer de nouvelles techniques, formats et outils natifs cloud pour réduire le coût des travaux avec les données ;
- Encourager le développement de communautés à même de tirer avantage des accès à des ensembles de données partagés.
Découvrez comment proposer votre ensemble de données au programme AWS Public Dataset