Publicado en: Jan 14, 2021
Dieciocho conjuntos de datos, nuevos o actualizados, de Illumina, la Universidad de Alaska Fairbanks o IntelinAir, entre otras instituciones, están disponibles ahora en el registro de datos públicos en las siguientes categorías.
Ciencias biológicas:
- Reanálisis de fase 3 de mil genomas con DRAGEN 3.5 de Illumina, Inc.
- BindingDB administrado por Amazon Web Services (AWS)
- Sonidos de paisajes de África Central del Centro de Conservación Bioacústica de la Universidad de Cornell
- Actualizado: Genoma en una botella del Instituto Nacional de Normalización y Tecnología
Análisis geoespacial:
- AgricultureVision de IntelinAir
- Modelo de elevación digital Copernicus administrado por Singerise
- Datos de clima a escala reducida de alta resolución para el sudeste de Alaska de la Universidad de Alaska Fairbanks
Clima y meteorología:
- Red de radares colombianos IDEAM de IDEAM
- Condiciones iniciales de arranque en caliente del sistema de predicción global de la Administración Nacional Oceánica y Atmosférica (NOAA)
- Prototipo 5 del sistema de predicción unificado de subestacional a estacional de la NOAA
- Proyecto 6 de intercomparación de modelos acoplados (CMIP6) WRF a escala reducida de la UCLA
- Actualizado: Archivo de actualización rápida en alta resolución de la NOAA y en formato Zarr administrado por la Universidad de Utah
- Actualizado: Proyecto 6 de intercomparación de modelos acoplados (CMIP6) en formato NETCDF administrado por la Federación de Redes del Sistema Terrestre (ESGF)
- Actualizado: Reánalisis del modelo de agua nacional en formato Zarr de la NOAA
Aprendizaje automático:
- DialogLUE de AWS
- Conjunto de datos de escenas naturales de la Universidad de Minnesota
- Conjunto de datos de 20 millones de muestras de detección de malware de Sophos y Reversing Labs del grupo de IA de Sophos
- CoversBR: Un extenso conjunto de datos para la identificación de versiones de canciones de Dirceu G. Silva
El Programa de Patrocinio de Datos Abiertos de AWS cubre el costo de almacenamiento de conjuntos de datos de alto valor optimizados para la nube que están disponibles públicamente. Trabajamos con proveedores de datos cuyo objetivo sea:
- Democratizar el acceso a los datos al ponerlos a disposición para su análisis en AWS
- Desarrollar técnicas, herramientas y formatos nuevos nativos en la nube que reduzcan el costo de trabajar con datos
- Fomentar el desarrollo de las comunidades que se benefician del acceso a conjuntos de datos compartidos