Publié le: Jul 12, 2019
De nouveaux ensembles de données publiques AWS provenant de Facebook, de Yale, de l’institut Allen Institute for Brain Science, de la NOAA et d'autres sources sont désormais disponibles.
9 nouveaux ensembles de données publiques AWS, qui sont totalement nouveaux ou simplement mis à jour, sont disponibles dans les catégories suivantes :
Biologie :
- Le projet Allen Brain Observatory a été étendu afin d'inclure 100 To de données neurophysiologiques représentant dix des milliers de neurones du système visuel d'une souris provenant de l'institut Allen Institute for Brain Science.
Sciences de l'environnement :
- Données de détection et de caractérisation des satellites 16 et 17 de la série Geostationary Operational Environmental Satellite (GOES) de la National Oceanic and Atmospheric Administration (NOAA).
- Produit du taux de pluie instantané selon le Global Hydro Estimator (GHE) de la NOAA.
Sciences géospatiales :
- 2018 Classified Point Cloud LiDAR de Washington, DC du bureau du district de Columbia du directeur de la technologie.
- Cartes de densité de la population en haute résolution + estimations démographiques établies par le Center for International Earth Science Information Network (CIESIN) de l'Université de Columbia et Facebook.
Sciences météorologiques :
- Base de données Integrated Surface Database (ISD) de la NOAA.
- Global Historical Climatology Network Hourly (GHCN-H) de la NOAA.
- National Water Model Short Range Forecast et Reanalysis version 2.0 de la NOAA.
Robotique :
Le programme AWS Public Dataset couvre les frais de stockage pour les ensembles de données de grande valeur optimisés pour le cloud et rendus accessibles au public. Nous travaillons avec les fournisseurs de données qui souhaitent :
- Démocratiser l'accès aux données en les rendant disponibles à l'analyse sous AWS.
- Développer de nouvelles techniques, formats et outils natifs cloud pour réduire le coût des travaux avec les données.
- Encourager le développement de communautés à même de tirer avantage des accès à des ensembles de données partagés.