- Amazon SageMaker›
- Arquitectura de lake house›
- Precios
Precios de Lakehouse
Información general
La próxima generación de Amazon SageMaker se basa en una arquitectura de lake house abierto que unifica todos los datos en los lagos de datos de Amazon Simple Storage Service (Amazon S3), incluidas Tablas de S3, y los almacenes de datos de Amazon Redshift, lo que ayuda a crear potentes aplicaciones de análisis e IA/ML en una sola copia de los datos. Solo pagará por los recursos que use en el lake house. El almacenamiento de metadatos y las solicitudes de API siguen los precios del Catálogo de datos de AWS Glue, incluido el nivel gratuito de AWS. Los costos de almacenamiento y computación de los datos dependen de la elección de Amazon S3 o Amazon Redshift Managed Storage (RMS). Los precios de los recursos subyacentes se describen a continuación.
Precios
Metadatos
Las definiciones de datos se organizan en una jerarquía lógica de catálogos, bases de datos y tablas mediante el Catálogo de datos de AWS Glue.
- Catálogo: contenedor lógico que incluye objetos de un almacén de datos, como esquemas, tablas, vistas o vistas materializadas de Amazon Redshift. Puede anidar catálogos bajo un catálogo de modo que coincidan con los niveles de jerarquías del origen de datos que utiliza en el lake house.
- Base de datos: las bases de datos se pueden utilizar para organizar los objetos de datos, como tablas y vistas, en el lake house.
- Tablas y vistas: las tablas y las vistas son objetos de datos en una base de datos que describen cómo acceder a los datos subyacentes, como el esquema, las particiones, la ubicación de almacenamiento, el formato de almacenamiento y la consulta SQL para acceder a los datos.
Se puede acceder a los metadatos del lake house desde las API de AWS Glue. El almacenamiento de metadatos y las solicitudes de API siguen los precios del Catálogo de datos de AWS Glue, incluido el nivel gratuito de AWS. Para obtener más información, visite Precios de AWS Glue.
Almacenamiento de datos y acceso
Al acceder a los datos del lake house, puede leer y escribir datos en Amazon S3 o RMS. Según el tipo de almacenamiento que elija para almacenar los datos en el lake house, incurrirá en costos adicionales de almacenamiento y computación para acceder al almacenamiento subyacente. Visite Precios de AWS Glue para obtener más información sobre los precios de almacenamiento y computación para los tipos de almacenamiento.
Estadísticas y mantenimiento de tablas de Apache Iceberg
Puede automatizar la recopilación de estadísticas en tablas de lagos de datos en Amazon S3 para una ejecución más rápida de las consultas y el mantenimiento de las tablas de Apache Iceberg, como la compactación, para optimizar el diseño de almacenamiento de las tablas de Apache Iceberg. Incurrirá en cargos adicionales cuando habilite estas características. Para obtener más información, visite Precios de AWS Glue.
Permisos
Los permisos detallados se basan en AWS Lake Formation y se proporcionan sin costo adicional. Para obtener más información, visita Precios de Lake Formation.
Costos de la integración sin ETL
SageMaker tiene integraciones sin ETL con las aplicaciones, lo que elimina la necesidad de crear y administrar canalizaciones de extracción, transformación y carga (ETL). Las aplicaciones compatibles incluyen Salesforce, ServiceNow, Zendesk y más.
Estas integraciones le proporcionan flexibilidad, por lo que puede elegir tablas de datos específicas en una aplicación para replicarlas automáticamente en Amazon Redshift. Esta flexibilidad le permite ejecutar análisis unificados en varias aplicaciones y orígenes de datos. AWS no cobra ninguna tarifa adicional por la integración sin ETL. Debe pagar por los recursos existentes que se utilizan para crear y procesar los datos de cambios creados como parte de una integración sin ETL. Esto incluye el almacenamiento adicional de Amazon Redshift para almacenar datos replicados, recursos de computación para procesar la replicación de datos (o las RPU en Amazon Redshift sin servidor) y los costos de transferencia de datos entre zonas de disponibilidad para trasladar los datos del origen al destino. El procesamiento continuo de los cambios de datos mediante la integración sin ETL se ofrece sin costo adicional. Para obtener más información, consulte los precios de Amazon Aurora, los precios de la base de datos relacional de Amazon (Amazon RDS) para MySQL, los precios de Amazon DynamoDB, y los precios de AWS Glue.