AWS hospeda distintos conjuntos de datos públicos a los que cualquiera puede obtener acceso de forma gratuita.

Anteriormente, la búsqueda, la descarga, la personalización y el análisis de conjuntos de datos de gran tamaño como las imágenes satelitales o los datos genómicos llevaba horas o días. Cuando los datos se ponen a disposición del público en AWS, cualquiera puede analizar cualquier volumen de datos sin la necesidad de tener que descargarlos ni almacenarlos ellos mismos. Estos conjuntos de datos se pueden analizar con los productos de análisis de datos y cómputo de AWS, incluidos Amazon EC2, Amazon Athena, AWS Lambda y Amazon EMR.

Obtenga más información acerca de cómo trabajar con datos geoespaciales en AWS en El planeta Tierra en AWS.

  • Landsat en AWS: una recopilación continua de imágenes satelitales de toda la superficie de la Tierra realizadas por el satélite Landsat 8.
  • Sentinel-2 en AWS: una recopilación continua de imágenes satelitales de toda la superficie de la Tierra realizadas por el satélite Sentinel-2.
  • SpaceNet en AWS: un corpus de imágenes satelitales comerciales y datos de capacitación etiquetados para fomentar la innovación en el desarrollo de algoritmos de visión informática.
  • MODIS en AWS: seleccione productos del espectroradiómetro de formación de imágenes de resolución moderada (MODIS) administrado por el Servicio de estudios geológicos de los Estados Unidos y la NASA.
  • Mosaicos de la superficie terrestre: un conjunto de datos global que proporciona alturas del suelo de la tierra, en mosaico para un uso sencillo y provisto en S3.
  • NAIP: imágenes aéreas a 1 metro capturadas durante las temporadas de cultivo en EE.UU. continental.
  • NEXRAD en AWS: datos en tiempo real y de archivo de la red radar meteorológico de próxima generación (NEXRAD).
  • NEX de la NASA: recopilación de conjuntos de datos de geociencia mantenida por la NASA, que incluye proyecciones de cambios climáticos e imágenes satelitales de la superficie de la Tierra.
  • LiDAR del Distrito de Columbia : datos de la nube de punto de LiDAR para Washington, DC.
  • Indicadores medioambientales de evaluación de riesgos de la EPA: resultados de modelos aéreos detallados del modelo de indicadores medioambientales de evaluación de riesgos de la EPA (RSEI).
  • Modelo meteorológico de HIRLAM: HIRLAM (modelo de área limitada de alta resolución) es un modelo de pronóstico meteorológico a mesoescala y sinóptico operativo que administra el Instituto Meteorológico Finlandés.

Más información sobre genómica en la nube.

  • Proyecto 1 000 genomas: mapa detallado de la variación genética humana.
  • TCGA en AWS: datos genómicos, transcriptónicos y epigenómicos (procesados y sin procesar) de The Cancer Genome Atlas (TCGA), disponibles para investigadores cualificados a través de Cancer Genomics Cloud.
  • ICGC en AWS: datos de secuencias completas de genoma, disponibles para investigadores cualificados a través de The International Cancer Genome Consortium (ICGC).
  • 3 000 Rice Genome en AWS: secuencia del genoma de 3 024 variedades de arroz.
  • Genome in a Bottle (GIAB): varios genomas de referencia que facilitan la traducción de toda la secuencia del genoma humano a la práctica clínica.

Obtenga más información sobre inteligencia artificial y aprendizaje automático en AWS.

  • Rastreo común: un corpus de datos de rastreo web formado por más de 5 000 millones de páginas web.
  • Conjunto de imágenes BIN de Amazon: más de 500 000 imágenes JPEG BIN y los correspondientes archivos de metadatos JSON describen productos en un centro de distribución de Amazon.
  • GDELT: más de 250 millones de registros que monitorizan las noticias transmitidas, impresas y publicadas en la web de todos los rincones del mundo y se actualizan todos los días.
  • Multimedia Commons: recopilación de casi 100 millones de imágenes y vídeos con características visuales, de audio y anotaciones.
  • Ngrams de Google Books: conjunto de datos que contiene corpus de n-grams de Google Books.
  • SpaceNet en AWS: un corpus de imágenes satelitales comerciales y datos de capacitación etiquetados para fomentar la innovación en el desarrollo de algoritmos de visión informática.
  • Registros 990 de IRS en AWS: datos de lectura automática de ciertos formularios 990 electrónicos registrados con IRS de 2011 a la actualidad
  • PUMS de ACS en AWS: la muestra de microdatos de uso público (PUMS) de la encuesta sobre la comunidad estadounidense (ACS) del censo de EE.UU. está disponible en un formato de datos vinculado con el modelo de datos del marco de descripción de recursos (RDF)
  • USAspending.gov en AWS: la base de datos USAspending.gov incluye datos de todos los gastos del gobierno federal, incluidos contratos, subvenciones, préstamos, salarios de empleados, entre otros.