Publié le: Oct 16, 2018
19 nouveaux ensembles de données publics AWS Public Dataset sont désormais disponibles pour les chercheurs et les développeurs qui s'intéressent aux sciences de la vie, aux sciences de l'environnement, au machine learning, aux multimédias, aux technologies civiques et à la cybersécurité.
Sciences de la vie :
- Tabula Muris du Chan Zuckerberg Biohub
- Cell Painting Image Collection, GATK Test Data et Broad Genome References du Broad Institute
Machine learning :
- Jeux de données de classification d'images, de localisation d'images, de traitement automatique du langage naturel et de COCO de fast.ai
- KITTI Vision Benchmark Suite du Karlsruhe Institute of Technology
Sciences de l'environnement :
- Modèles numériques de prévisions météorologiques DWD ICON Global, DWD ICON-EU et DWD COSMO-D2 du Deutscher Wetterdienst (German National Meteorological Service)
- NOAA Global Ensemble Forecast System via le NOAA Big Data Project
- NOAA Operational Forecast System via le NOAA Big Data Project
- Downscaled Climate Data for Alaska de l'International Arctic Research Center, Université de l'Alaska de Fairbanks
Technologies civiques :
- IChangeMyCity Complaints Data du Janaagraha Centre for Citizenship and Democracy
Cybersécurité :
- Forward DNS ANY Dataset de Rapid7
- A Realistic Cyber Defense Dataset du Centre de la sécurité des télécommunications Canada et de l'Institut canadien sur la cybersécurité
Multimédia :
- Xiph.Org Test Media de Xiph.Org
Le programme AWS Public Dataset couvre les frais de stockage pour les ensembles de données de grande valeur optimisés pour le Cloud et rendus accessibles au public. Nous travaillons avec des fournisseurs de données qui cherchent à :
- Démocratiser l'accès aux données en les rendant disponibles à l'analyse sous AWS.
- Développer de nouvelles techniques, formats et outils natifs cloud pour réduire le coût des travaux avec les données.
- Encourager le développement de communautés à même de tirer avantage des accès à des ensembles de données partagés.
Savoir comment proposer votre ensemble de données au programme AWS Public Dataset.