Publicado en: Oct 16, 2018
19 conjuntos de datos públicos de AWS nuevos se encuentran disponibles para los investigadores y desarrolladores que estén interesados en las ciencia biológicas, las ciencias del medio ambiente, el aprendizaje automático, el contenido multimedia, la tecnología cívica y la ciberseguridad.
Ciencias biológicas:
- Tabula Muris de Chan Zuckerberg Biohub
- Cell Painting Image Collection, GATK Test Data y Broad Genome References del instituto Broad
Aprendizaje automático:
- Conjuntos de datos de clasificación de imágenes, localización de imágenes, procesamiento de lenguaje natural y COCO de fast.ai
- KITTI Vision Benchmark Suite del Instituto de Tecnología Karlsruhe
Medio ambiente:
- Modelos climáticos DWD ICON Global, DWD ICON-EU y DWD COSMO-D2 del Deutscher Wetterdienst (Servicio Meteorológico Nacional Alemán)
- NOAA Global Ensemble Forecast System suministrado a través de NOAA Big Data Project
- NOAA Operational Forecast System suministrado a través de NOAA Big Data Project
- Downscaled Climate Data for Alaska del Centro de Investigación Internacional del Ártico de la Universidad de Alaska
Tecnología cívica:
- IChangeMyCity Complaints Data del Centro para la Ciudadanía y la Democracia de Janaagraha
Ciberseguridad:
- Forward DNS ANY Dataset de Rapid7
- A Realistic Cyber Defense Dataset del Establecimiento de Seguridad de Comunicaciones de Canadá y el Instituto Canadiense de Ciberseguridad
Contenido multimedia:
- Xiph.Org Test Media de Xiph.Org
El Programa de Conjuntos de Datos Públicos de AWS cubre el costo de almacenamiento de conjuntos de datos de alto valor optimizados para la nube que están disponibles públicamente. Trabajamos con proveedores de datos cuyo objetivo sea:
- Democratizar el acceso a los datos al ponerlos a disposición para su análisis en AWS.
- Desarrollar técnicas, herramientas y formatos nuevos nativos en la nube que reduzcan el costo de trabajar con datos.
- Fomentar el desarrollo de las comunidades que se benefician del acceso a conjuntos de datos compartidos.
Averigüe de qué manera puede proponer la incorporación de su conjunto de datos para el Programa de Conjuntos de Datos Públicos de AWS.