Publié le: Apr 11, 2019
18 nouveaux ensembles de données publiques AWS, qui sont totalement nouveaux ou simplement mis à jour, sont disponibles dans les catégories suivantes :
Astronomie :
- Jeu de données de radioastronomie Epoch of Reionization de l'université de Washington
- Jeu de données de radioastronomie LOFAR ELAIS-N1 Cycle 2 Observations de l'institut d'astronomie de l'université d'Édimbourg
Biologie :
- Modèles d'amarrage moléculaire 3D ZINC15 de John Irwin
- Genome Ark du projet Vertebrate Genomes
- Jeu de données Encyclopedia of DNA Elements (ENCODE) du Centre de coordination des données ENCODE
- Projet Human PanGenomics de l'université de Santa Cruz en Californie
Réponse aux catastrophes :
- Jeu de données S1 SLC (Sentinel-1 Single Look Complex) sur l'Asie du Sud et du Sud-Est, Taiwan et le Japon de l'université technologique de Nanyang à Singapour
- Open Earthquake Early-Warnings (OpenEEW) de Grillo
Savoir encyclopédique :
- Jeu de données Software Heritage Graph de Software Heritage
Sciences de l'environnement :
- Jeu de données Wind Integration National Dataset (WIND) du National Renewable Energy Laboratory (NREL) américain
- Base de données nationale des radiations solaires du National Renewable Energy Laboratory (NREL) américain
- Résultats du modèle de tendances et d'état eBird du Cornell Lab of Ornithology
- Africa Soil Information Service (AfSIS) Soil Chemistry de Quantitative Engineering Design
Machine Learning :
- Le jeu de données Massively Multilingual Image Dataset de l'université de Pennsylvanie a été étendu de manière à y inclure des données dans 98 langues.
- Paracrawl du Broader Web-Scale Provision of Parallel Corpora for European Languages
Sciences météorologiques :
- Système de prévision météorologique Global Forecast System (GFS 2.0 et v3.0) de NOAA
- Modèles Météo-France d'OpenMeteoData
Réglementation :
- Archivages IRS 990 des feuilles de calcul d'Applied Nonprofit Research
Le programme AWS Public Dataset couvre les frais de stockage pour les ensembles de données de grande valeur optimisés pour le cloud et rendus accessibles au public. Nous travaillons avec les fournisseurs de données qui souhaitent :
- Démocratiser l'accès aux données en les rendant disponibles à l'analyse sous AWS.
- Développer de nouvelles techniques, formats et outils natifs cloud pour réduire le coût des travaux avec les données.
- Encourager le développement de communautés à même de tirer avantage de l’accès à des ensembles de données partagés.
Modifié le 9/12/2021 – Dans le but de garantir une expérience agréable, les liens expirés dans cet article ont été mis à jour ou supprimés de l'article d'origine.