Publicado en: Apr 11, 2019
Ya están disponibles en AWS 18 conjuntos de datos públicos nuevos o actualizados pertenecientes a las siguientes categorías:
Astronomía:
- Epoch of Reionization Radio Astronomy Dataset (Conjunto de datos de radioastronomía del proyecto Época de reionización), de la Universidad de Washington
- LOFAR ELAIS-N1 Cycle 2 Observations Radio Astronomy Dataset (Conjunto de datos de radioastronomía de las observaciones del ciclo 2 de LOFAR ELAIS-N1), del Instituto de Astronomía de la Universidad de Edimburgo
Biología:
- ZINC15 3D Molecular Docking Models (Modelos 3D de acoplamiento molecular de ZINC15), de John Irwin
- Genome Ark (Arca de genomas), del Vertebrate Genomes Project (proyecto Genoma de Vertebrados)
- Encyclopedia of DNA Elements (ENCODE) Dataset (Conjunto de datos de la Enciclopedia de elementos de ADN), del Centro de Coordinación de Datos de ENCODE
- Human PanGenomics Project (proyecto Pangenoma Humano), de la Universidad de California, Santa Cruz
Respuesta ante catástrofes:
- Sentinel-1 Single Look Complex (S1 SLC) dataset for South Asia, Southeast Asia, Taiwan, and Japan (Conjunto de datos de Sentinel-1 Single Look Complex, S1 SLC, para Asia del Sur, el Sudeste Asiático, Taiwán y Japón), de la Universidad Tecnológica de Nanyang, Singapur
- Open Earthquake Early-Warnings (OpenEEW) (Sistema abierto de alerta temprana de terremotos), de Grillo
Contenido enciclopédico:
- Software Heritage Graph Dataset (Conjunto de datos de grafos de Software Heritage), de Software Heritage
Medio ambiente:
- Wind Integration National Dataset (WIND) (Conjunto de datos de integración eólica) de EE. UU. Laboratorio Nacional de Energías Renovables (NREL) de EE.UU.
- National Solar Radiation Data Base (Base de datos nacional sobre radiación solar) de EE. UU. Laboratorio Nacional de Energías Renovables (NREL) de EE.UU.
- eBird Status and Trends Model Results (Resultados del modelo de situación y tendencias de eBird), del Laboratorio de Ornitología de Cornell
- Africa Soil Information Service (AfSIS) Soil Chemistry (Química del suelo del Servicio Africano de Información sobre el Suelo), de Quantitative Engineering Design
Aprendizaje automático:
- El conjunto de datos Massively Multilingual Image Dataset, de la Universidad de Pensilvania, se amplió y ahora incluye datos de 98 idiomas.
- Paracrawl, de la herramienta Broader Web-Scale Provision of Parallel Corpora for European Languages
Contenido sobre meteorología:
- Global Forecast System (GFS v2.0 & v3.0) (Sistema de pronóstico global), de la Oficina Nacional de Administración Oceánica y Atmosférica de EE. UU. (NOAA)
- Météo-France Models (Modelos de Météo-France), de OpenMeteoData
Asuntos normativos:
- IRS 990 Filings in Spreadsheets (Archivos de los formularios 990 de la IRS en formato de hojas de cálculo), de Applied Nonprofit Research
El Programa de Conjuntos de Datos Públicos de AWS cubre el costo de almacenamiento de conjuntos de datos de alto valor optimizados para la nube que están disponibles públicamente. Trabajamos con proveedores de datos cuyo objetivo sea:
- Democratizar el acceso a los datos al ponerlos a disposición para su análisis en AWS.
- Desarrollar técnicas, herramientas y formatos nuevos nativos en la nube que reduzcan el costo de trabajar con datos.
- Fomentar el desarrollo de las comunidades que se benefician del acceso a conjuntos de datos compartidos.
Modificado el 9/12/2021: Con el fin de garantizar una buena experiencia, los enlaces caducados de esta publicación se han actualizado o eliminado de la publicación original.