Servicio de Machine Learning - Precios de Amazon SageMaker

Amazon SageMaker ayuda a los científicos de datos y a los desarrolladores a preparar, crear, entrenar e implementar con rapidez modelos de machine learning (ML) de alta calidad al poner a disposición un amplio conjunto de capacidades especialmente creadas para ML. SageMaker admite los principales marcos, kits de herramientas y lenguajes de programación de ML.

Con SageMaker, solo paga por lo que utiliza. Tiene dos opciones para pagar: los precios bajo demanda que no ofrecen tarifas mínimas ni compromisos iniciales y SageMaker Savings Plans, que ofrece un modelo de precios flexible, basado en el uso, a cambio de comprometerse a una cantidad constante de uso.

Nivel gratuito de Amazon SageMaker

Probar Amazon SageMaker Studio es gratis. Como parte del nivel gratuito de AWS, puede comenzar a utilizar Amazon SageMaker de forma gratuita. La capa gratuita comienza el primer mes, al crear el primer recurso de SageMaker. Encuentre información detallada sobre el nivel gratuito de Amazon SageMaker en la tabla que aparece a continuación.

Capacidad de Amazon SageMaker	Uso del nivel gratuito al mes durante los primeros dos meses
Cuadernos de Studio e instancias de cuaderno	250 horas de la instancia ml.t3.medium en los cuadernos de Studio o 250 horas de la instancia ml.t2.medium o la instancia ml.t3.medium en instancias de cuaderno
RStudio en SageMaker	250 horas de la instancia ml.t3.medium en la aplicación RSession y la instancia ml.t3.medium gratuita para la aplicación RStudioServerPro
Data Wrangler	25 horas de la instancia ml.m5.4xlarge
Almacén de características	10 millones de unidades de escritura, 10 millones de unidades de lectura, 25 GB de almacenamiento (tienda en línea estándar)
Formación	50 horas de instancias m4.xlarge o m5.xlarge
Amazon SageMaker con TensorBoard	300 horas de instancias ml.r5.large
Inferencia en tiempo real	125 horas de las instancias m4.xlarge o m5.xlarge
Inferencia sin servidor	150 000 segundos de duración de inferencia bajo demanda
Canvas	160 horas al mes por sesión
HyperPod	50 horas de instancia m5.xlarge
	Uso del nivel gratuito al mes durante los seis primeros meses
Experimentos	100 000 registros de métrica incorporados al mes, 1 millón de registros de métrica recuperados al mes y 100 000 registros de métrica almacenados al mes

Calculadora de precios de AWS

Calcule el costo de Amazon SageMaker y el de su arquitectura en una sola cotización.

Cree su cotización personalizada ahora »

Precios de la modalidad bajo demanda

Studio Classic
Amazon SageMaker Studio Classic
Studio Classic ofrece cuadernos de Jupyter de un solo paso en nuestra experiencia de IDE heredada. Los recursos de computación subyacentes son completamente elásticos y los blocs de notas se pueden compartir fácilmente con otros, lo que permite que haya una colaboración fluida. Se cobra en función del tipo de instancia que elija, con base en la duración del uso.
JupyterLab
Amazon SageMaker JupyterLab
Inicie JupyterLab totalmente gestionado en cuestión de segundos. Utilice el entorno de desarrollo interactivo basado en la web más reciente para cuadernos, código y datos. Se cobra en función del tipo de instancia que elija, con base en la duración del uso.
Editor de código
Editor de código de Amazon SageMaker
El editor de código, basado en Code-OSS (Visual Studio Code – Open Source), le permite escribir, probar, depurar y ejecutar su código de análisis y machine learning. Está totalmente integrado con SageMaker Studio y es compatible con las extensiones para IDE disponibles en el registro de extensiones Open VSX.
RStudio
RStudio
RStudio ofrece recursos de computación en la nube bajo demanda para acelerar el desarrollo del modelo y mejorar la productividad. Se le cobrará por los tipos de instancias que elija para ejecutar la aplicación RStudio Session y la aplicación RStudio Server Pro.

Aplicación RStudioServerPro
Instancias de cuaderno
Instancia de cuaderno
Las instancias de cuaderno son instancias de computación que ejecutan la aplicación de cuaderno de Jupyter. Se cobra en función del tipo de instancia que elija, con base en la duración del uso.
Procesamiento
Procesamiento de Amazon SageMaker
El procesamiento mediante Amazon SageMaker permite ejecutar fácilmente las cargas de trabajo previas al procesamiento, posteriores al procesamiento y de evaluación del modelo en una infraestructura completamente administrada. Se cobra en función del tipo de instancia que elija, con base en la duración del uso.
TensorBoard
Amazon SageMaker con TensorBoard
Amazon SageMaker con TensorBoard proporciona una experiencia TensorBoard alojada para visualizar y depurar problemas de convergencia de modelos para trabajos de capacitación de Amazon SageMaker.
Data Wrangler
Amazon SageMaker Data Wrangler

Amazon SageMaker Data Wrangler reduce el tiempo que tarda agregar y preparar los datos para el aprendizaje automático de semanas a minutos. Paga por el tiempo que utiliza para limpiar, explorar y visualizar datos. Los clientes que ejecuten instancias de SageMaker Data Wrangler están sujetos a los precios que se indican a continuación.* Los clientes que ejecuten SageMaker Data Wrangler en instancias de espacio de trabajo de SageMaker Canvas están sujetos a los precios de SageMaker Canvas. Consulte la página de precios de SageMaker Canvas para obtener más información.

Trabajos de Amazon SageMaker Data Wrangler

Un trabajo de Amazon SageMaker Data Wrangler se crea al exportar un flujo de datos de SageMaker Data Wrangler. Con los trabajos de SageMaker Data Wrangler, puede automatizar los flujos de trabajo de preparación de datos. Los trabajos de SageMaker Data Wrangler ayudan a volver a aplicar los flujos de trabajos de preparación de datos en nuevos conjuntos de datos para ahorrar tiempo. Los trabajos se facturan por segundo.
Almacén de características
Almacén de características de Amazon SageMaker
El almacén de características de Amazon SageMaker es un repositorio central para incorporar, almacenar y proporcionar características para el machine learning. Se le cobrará por las escrituras, las lecturas y el almacenamiento de datos del grupo de características en el Almacén de características de SageMaker, con precios diferentes para el almacenamiento en línea estándar y el almacenamiento en línea en memoria.

Para el almacenamiento en línea estándar, el almacenamiento de datos se cobra por GB al mes. En cuanto al rendimiento, puede elegir entre el modo de capacidad aprovisionada o bajo demanda. Para el modo bajo demanda, las escrituras se cobran como unidades de solicitud de escritura por KB y las lecturas se cobran como unidades de solicitud de lectura por 4 KB. Para el modo de capacidad aprovisionada, especifica la capacidad de lectura y escritura que espera que requiera su aplicación. El Almacén de características de Sagemaker cobra una WCU por cada escritura por segundo (hasta 1 KB) y una RCU por cada lectura por segundo (hasta 4 KB). Se le cobrará la capacidad de rendimiento (lecturas y escrituras) que aprovisione en su grupo de características, incluso en los casos donde no utilice toda la capacidad aprovisionada.

Para el almacenamiento en línea en memoria, las escrituras se cobran como unidades de solicitud de escritura por KB con un mínimo de 1 unidad por escritura, las lecturas se cobran como unidades de solicitud de lectura por KB con un mínimo de 1 unidad por lectura, y el almacenamiento de datos se cobra por GB por hora. Hay un cargo mínimo de almacenamiento de datos de 5 GiB (5,37 GB) por hora para la tienda en línea integrada en memoria.
Formación
Entrenamiento mediante Amazon SageMaker
Amazon SageMaker facilita el entrenamiento de modelos de aprendizaje automático (ML), ya que proporciona todo lo que se necesita para entrenar, ajustar y depurar modelos. Se cobra por el uso del tipo de instancia que elija. Al utilizar Amazon SageMaker Debugger para depurar problemas y monitorear recursos durante el entrenamiento, puede usar reglas integradas para depurar los trabajos de entrenamiento, o bien puede escribir sus propias personalizadas. No se aplican cargos al uso de reglas integradas para depurar los trabajos de entrenamiento. Con respecto a las reglas personalizadas, se cobra en función del tipo de instancia que elija, con base en la duración del uso.
Experimentos

Experimentos de Amazon SageMaker
Experimentos de Amazon SageMaker le permite organizar, supervisar y comparar sus experimentos de ML. Solo se le cobrará por la incorporación, recuperación y almacenamiento de los registros de métrica. Un registro de métrica es un par formado por una clave y un valor de datos de métrica. La incorporación y recuperación se cobran en función del número de registros de métrica. El almacenamiento se cobra en función del número de registros de métrica almacenados al mes. Puede usar SageMaker Studio para visualizar los experimentos sin cargo adicional.

Tipo de cargo	Precio
Incorporación	1,25 USD por cada millón de registros de métrica
Recuperación	0,25 USD por cada millón de registros de métrica
Almacenamiento	0,25 USD por cada millón de registros de métrica al mes

Inferencia en tiempo real
Alojamiento de Amazon SageMaker: inferencia en tiempo real
Amazon SageMaker proporciona inferencia en tiempo real para sus casos de uso que necesitan predicciones en tiempo real. Se cobra por el uso del tipo de instancia que elija. Al utilizar Amazon SageMaker Model Monitor para mantener modelos con un alto nivel de precisión que proporcionan inferencia en tiempo real, puede utilizar reglas integradas para monitorear los modelos, o bien puede escribir sus propias reglas personalizadas. Para las reglas integradas, obtiene hasta 30 horas de monitoreo sin cargos. Se aplican cargos adicionales con base en la duración del uso. Se cobra por separado si utiliza sus propias reglas personalizadas.
Inferencia asíncrona
Inferencia asíncrona de Amazon SageMaker:
El servicio de inferencia asíncrona de Amazon SageMaker es una opción de inferencia casi en tiempo real que pone en cola las solicitudes entrantes y las procesa de forma asíncrona. Utilice esta opción cuando necesite procesar grandes cargas útiles a medida que llegan los datos o ejecutar modelos que tienen largos tiempos de procesamiento de inferencia y no tienen requisitos de latencia de menos de un segundo. Se le cobra por el tipo de instancia que elija.
Transformación por lotes
Transformación por lotes de Amazon SageMaker
Al utilizar la transformación por lotes de Amazon SageMaker, no es necesario desglosar el conjunto de datos en varios fragmentos ni administrar puntos de enlace en tiempo real. La transformación por lotes de SageMaker permite ejecutar predicciones en conjuntos de datos de lotes grandes o pequeños. Se cobra en función del tipo de instancia que elija, con base en la duración del uso.
Inferencia sin servidor
Amazon SageMaker Serverless Inference
La inferencia sin servidor de Amazon SageMaker permite desplegar modelos de machine learning para inferencias sin configurar o administrar las infraestructuras subyacentes. Puede utilizar la inferencia sin servidor bajo demanda o agregar la simultaneidad aprovisionada a su punto de conexión para obtener un rendimiento predecible.

Con la inferencia sin servidor bajo demanda, solo paga por la capacidad de cálculo utilizada para procesar las solicitudes de inferencia, facturada por milisegundos y por la cantidad de datos procesados. El cargo de computación depende de la configuración de la memoria que elija.

Simultaneidad aprovisionada

Si lo desea, también puede habilitar la simultaneidad aprovisionada para sus puntos de conexión sin servidor. La simultaneidad aprovisionada permite implementar modelos en puntos de conexión sin servidor con un rendimiento predecible y una alta escalabilidad, ya que mantiene los puntos de conexión activos para un número específico de solicitudes simultáneas y un tiempo específico. Al igual que ocurre con la inferencia sin servidor bajo demanda, cuando la simultaneidad aprovisionada está habilitada, paga por la capacidad de cálculo utilizada para procesar las solicitudes de inferencia, facturada por milisegundos y por la cantidad de datos procesados. También paga por el uso de la simultaneidad aprovisionada, en función de la memoria configurada, la duración aprovisionada y la cantidad de simultaneidad habilitada.
JumpStart
Amazon SageMaker JumpStart
Amazon SageMaker JumpStart le ayuda a iniciarse en el machine learning de forma rápida y sencilla con acceso a colecciones de modelos populares (también conocidas como “zoos de modelos”) con un solo clic. Jumpstart también ofrece soluciones integrales que resuelven casos de uso comunes de ML que se pueden personalizar en función de sus necesidades. El uso de modelos o soluciones JumpStart no conlleva ningún costo adicional. Se le cobrará por las horas subyacentes de las instancias de formación e inferencia utilizadas igual que si las hubiera creado manualmente.
Generador de perfiles
Generador de perfiles de Amazon SageMaker recopila datos del sistema para la visualización de gráficos de rastros de CPU y GPU de alta resolución. Esta herramienta está diseñada para ayudar a los científicos e ingenieros de datos a identificar los cuellos de botella en el rendimiento relacionados con el hardware en sus modelos de aprendizaje profundo, lo que ahorra tiempo y costos en el entrenamiento integral. Actualmente, Generador de perfiles de Amazon SageMaker solo admite la creación de perfiles de trabajos de entrenamiento utilizando los tipos de instancias de computación de entrenamiento ml.g4dn.12xlarge, ml.p3dn.24xlarge y ml.p4d.24xlarge.

Regiones: Este de EE. UU. (Ohio), Este de EE. UU. (Norte de Virginia), Oeste de EE. UU. (Oregón), Europa (Fráncfort), Europa (Irlanda) e Israel (Tel Aviv).

Generador de perfiles de Amazon SageMaker se encuentra actualmente en versión preliminar y está disponible sin costo alguno para los clientes de las regiones compatibles.
HyperPod
Amazon SageMaker HyperPod
Amazon SageMaker HyperPod está diseñado específicamente para acelerar el desarrollo de modelos fundacionales (FM). Para que el entrenamiento de FM sea más resistente, HyperPod supervisa continuamente el estado del clúster, repara y reemplaza los nodos defectuosos sobre la marcha y guarda los puntos de control frecuentes para reanudar de manera automática el entrenamiento sin perder el progreso. SageMaker HyperPod viene preconfigurado con bibliotecas de entrenamiento distribuidas de SageMaker que le permiten mejorar el rendimiento del entrenamiento de FM y, al mismo tiempo, utilizar al máximo la infraestructura de computación y de red del clúster

Detalles de la instancia

Detalles del producto de la instancia P5 de Amazon SageMaker

Tamaño de la instancia	vCPU	Memoria de la instancia (TiB)	Modelo de GPU	GPU	Memoria total de la GPU (GB)	Memoria por GPU (GB)	Ancho de banda de la red (Gbps)	GPUDirect RDMA	GPU de pares	Almacenamiento de la instancia (TB)	Ancho de banda de EBS (Gbps)
ml.p5.48xlarge	192	2	NVIDIA H100	8	640 HBM3	80	3200 EFAv2	Sí	900 GB/s NVSwitch	8 x 3,84 NVMe SSD	80

Detalles del producto de la instancia Amazon SageMaker P4d

Tamaño de la instancia	vCPU	Memoria de la instancia (GiB)	Modelo de GPU	GPU	Memoria total de la GPU (GB)	Memoria por GPU (GB)	Ancho de banda de la red (Gbps)	GPUDirect RDMA	GPU de pares	Almacenamiento de instancia (GB)	Ancho de banda de EBS (Gbps)
ml.p4d.24xlarge	96	1152	NVIDIA A100	8	320 HBM 2	40	400 ENA y EFA	Sí	600 GB/s NVSwitch	8 x 1000 NVMe SSD	19
ml.p4de.24xlarge	96	1152	NVIDIA A100	8	640 HNM2e	80	400 ENA y EFA	Sí	600 GB/s NVSwitch	8 X 1000 NVMe SSD	19

Detalles del producto de la instancia P3 de Amazon SageMaker

Tamaño de la instancia	vCPU	Memoria de la instancia (GiB)	Modelo de GPU	GPU	Memoria total de la GPU (GB)	Memoria por GPU (GB)	Ancho de banda de la red (Gbps)	GPU de pares	Almacenamiento de instancia (GB)	Ancho de banda de EBS (Gbps)
ml.p3.2xlarge	8	61	NVIDIA V100	1	16	16	Hasta 10	N/D	Solo EBS	1,5
ml.p3.8xlarge	32	244	NVIDIA V100	4	64	16	10	NVLink	Solo EBS	7
ml.p3.16xlarge	64	488	NVIDIA V100	8	128	16	25	NVLink	Solo EBS	14
ml.p3dn.24xlarge	96	768	NVIDIA V100	8	256	32	100	NVLink	2 x 900 NVMeSSD	19

Detalles del producto de la instancia P2 de Amazon SageMaker

Tamaño de la instancia	vCPU	Memoria de la instancia (GiB)	Modelo de GPU	GPU	Memoria total de la GPU (GB)	Memoria por GPU (GB)	Ancho de banda de la red (Gbps)	Ancho de banda de EBS (Gbps)
ml.p2.xlarge	4	61	NVIDIA K80	1	12	12	Hasta 10	Alta
ml.p2.8xlarge	32	488	NVIDIA K80	8	96	12	10	10
ml.p2.16xlarge	64	732	NVIDIA K80	16	192	12	25	20

Detalles del producto de la instancia G4 de Amazon SageMaker

Tamaño de la instancia	vCPU	Memoria de la instancia (GiB)	Modelo de GPU	GPU	Memoria total de la GPU (GB)	Memoria por GPU (GB)	Ancho de banda de la red (Gbps)	Almacenamiento de instancia (GB)	Ancho de banda de EBS (Gbps)
ml.g4dn.xlarge	4	16	NVIDIA T4	1	16	16	Hasta 25	1 x 125 SSD NVMe	Hasta 3,5
ml.g4dn.2xlarge	8	32	NVIDIA T4	1	16	16	Hasta 25	1 x 125 SSD NVMe	Hasta 3,5
ml.g4dn.4xlarge	16	64	NVIDIA T4	1	16	16	Hasta 25	1 x 125 SSD NVMe	4,75
ml.g4dn.8xlarge	32	128	NVIDIA T4	1	16	16	50	1 x 900 SSD NVMe	9,5
ml.g4dn.16xlarge	64	256	NVIDIA T4	1	16	16	50	1 x 900 SSD NVMe	9,5
ml.g4dn.12xlarge	48	192	NVIDIA T4	4	64	16	50	1 x 900 SSD NVMe	9,5

Detalles del producto de la instancia G5 de Amazon SageMaker

Tamaño de la instancia	vCPU	Memoria de la instancia (GiB)	Modelo de GPU	GPU	Memoria total de la GPU (GB)	Memoria por GPU (GB)	Ancho de banda de la red (Gbps)	Ancho de banda de EBS (Gbps)	Almacenamiento de instancia (GB)
ml.g5n.xlarge	4	16	NVIDIA A10G	1	24	24	Hasta 10	Hasta 3,5	1 x 250
ml.g5.2xlarge	8	32	NVIDIA A10G	1	24	24	Hasta 10	Hasta 3,5	1 x 450
ml.g5.4xlarge	16	64	NVIDIA A10G	1	24	24	Hasta 25	8	1 x 600
ml.g5.8xlarge	32	128	NVIDIA A10G	1	24	24	25	16	1 x 900
ml.g5.16xlarge	64	256	NVIDIA A10G	1	24	24	25	16	1 x 1900
ml.g5.12xlarge	48	192	NVIDIA A10G	4	96	24	40	16	1 x 3800
ml.g5.24xlarge	96	384	NVIDIA A10G	4	96	24	50	19	1 x 3800
ml.g5.48xlarge	192	768	NVIDIA A10G	8	192	24	100	19	2 x 3800

Detalles del producto de la instancia Trn1 de Amazon SageMaker

Tamaño de la instancia	vCPU	Memoria (GiB)	Aceleradores Trainium	Memoria de acelerador total (GB)	Memoria por acelerador (GB)	Almacenamiento de instancia (GB)	Ancho de banda de red (Gbps)	Ancho de banda de EBS (Gbps)
ml.trn1.2xlarge	8	32	1	32	32	1 x 500 SSD NVMe	Hasta 12,5	Hasta 20
ml.trn1.32xlarge	128	512	16	512	32	4 x 2000 SSD NVMe	800	80

Detalles del producto de la instancia Inf1 de Amazon SageMaker

Tamaño de la instancia	vCPU	Memoria (GiB)	Aceleradores de Inferentia	Memoria de acelerador total (GB)	Memoria por acelerador (GB)	Almacenamiento de la instancia	Interconexión entre aceleradores	Ancho de banda de la red (Gbps)	Ancho de banda de EBS (Gbps)
ml.inf1.xlarge	4	8	1	8	8	Solo EBS	N/D	Hasta 25	Hasta 4,75
ml.inf1.2xlarge	8	16	1	8	8	Solo EBS	N/D	Hasta 25	Hasta 4,75
ml.inf1.6xlarge	24	48	4	32	8	Solo EBS	Sí	25	4,75
ml.inf1.24xlarge	96	192	16	128	8	Solo EBS	Sí	100	19

Detalles del producto de la instancia Inf2 de Amazon SageMaker

Tamaño de la instancia	vCPU	Memoria (GiB)	Aceleradores de Inferentia	Memoria de acelerador total (GB)	Memoria por acelerador (GB)	Almacenamiento de la instancia	Interconexión entre aceleradores	Ancho de banda de la red (Gbps)	Ancho de banda de EBS (Gbps)
ml.inf2.xlarge	4	16	1	32	32	Solo EBS	N/D	Hasta 25	Hasta 10
ml.inf2.8xlarge	32	128	1	32	32	Solo EBS	N/D	Hasta 25	10
ml.inf2.24xlarge	96	384	6	196	32	Solo EBS	Sí	50	30
ml.inf2.48xlarge	192	768	12	384	32	Solo EBS	Sí	100	60

Amazon SageMaker Studio

Amazon SageMaker Studio es una interfaz web única para el desarrollo completo de machine learning, que ofrece una selección de entornos de desarrollo integrados (IDE) totalmente administrados y herramientas diseñadas específicamente. Puede acceder a SageMaker Studio de forma gratuita. Solo se le cobrará por el procesamiento y el almacenamiento subyacentes que utilice para los diferentes IDE y herramientas de machine learning de SageMaker Studio.

Puede usar muchos servicios de SageMaker Studio, AWS SDK para Python (Boto3) o la interfaz de la línea de comandos de AWS (AWS CLI), incluidos los siguientes:

Entornos de desarrollo en SageMaker Studio para realizar un desarrollo completo de machine learning con un amplio conjunto de IDE totalmente gestionados, incluidos JupyterLab, un editor de código basado en Code-OSS (Visual Studio Code, código abierto) y RStudio
SageMaker Pipelines para automatizar y administrar los flujos de trabajo de ML
SageMaker Autopilot para crear de forma automática modelos de ML con visibilidad completa
SageMaker Experiments para organizar los trabajos de entrenamiento y las versiones, y hacer un seguimiento de estos
SageMaker Debugger para depurar anomalías durante la formación
SageMaker Model Monitor para mantener modelos de alta calidad
SageMaker Clarify para explicar mejor los modelos de ML y detectar sesgos
SageMaker JumpStart para implementar de manera fácil soluciones de ML para muchos casos de uso. Es posible que incurra en cargos de otros servicios de AWS utilizados en la solución por las llamadas a la API subyacentes realizadas por Amazon SageMaker en su nombre.
Recomendador de inferencias de SageMaker para obtener recomendaciones para la configuración adecuada de los puntos de conexión

Solo paga por los recursos subyacentes de almacenamiento y computación dentro de SageMaker u otros servicios de AWS, en función del uso.

Evaluaciones de modelos fundacionales

SageMaker Clarify es compatible con las evaluaciones de los modelos básicos con métodos de evaluación automáticos y realizadas por humanos. Cada una de ellas tiene un precio diferente. Si evalúa un modelo básico de Amazon SageMaker JumpStart que aún no está desplegado en su cuenta, SageMaker desplegará el modelo JumpStart de manera temporal en una instancia de SageMaker mientras dure la inferencia. La instancia específica se ajustará a la recomendación de instancia brindada por JumpStart para ese modelo.

Evaluación automática:
Las evaluaciones del modelo básico se ejecutan como un trabajo de procesamiento de SageMaker. El trabajo de evaluación invocará SageMaker Inference. A los clientes se les cobra por la inferencia y por el trabajo de evaluación. A los clientes solo se les cobra por la duración del trabajo de evaluación. El costo del trabajo de evaluación sería la suma del costo por hora de la instancia de evaluación y la suma del costo por hora de la instancia de alojamiento.

Evaluaciones realizadas por humanos:
Cuando utiliza la característica de evaluación realizada por humanos, en la que trae su propio personal, se le cobran tres elementos: 1) la instancia de SageMaker utilizada para la inferencia, 2) la instancia utilizada para ejecutar el trabajo de procesamiento de SageMaker que aloja la evaluación humana y 3) un cargo de 0,21 USD por tarea de evaluación humana completada. Una tarea humana se define como la ocurrencia en la que un trabajador humano envía una evaluación de una sola solicitud y las respuestas de inferencia asociadas en la interfaz de usuario de la evaluación humana. El precio es el mismo sin importar si tiene uno o dos modelos en el trabajo de evaluación o si aporta sus propias conclusiones; también es el mismo sin importar el número de dimensiones de la evaluación y los métodos de calificación que incluya. El precio de 0,21 USD por tarea es el mismo para todas las regiones de AWS. No hay ningún cargo adicional por el personal, ya que lo suministra usted.

Evaluación administrada por AWS:
En el caso de una evaluación de expertos administrada por AWS, los precios varían según las necesidades de evaluación en un contrato privado mientras trabaja con el equipo de evaluaciones de expertos de AWS.

Amazon SageMaker Studio Lab

Puede crear y entrenar modelos de ML con Amazon SageMaker Studio Lab de forma gratuita. SageMaker Studio Lab ofrece a los desarrolladores, los académicos y los científicos de datos un entorno de desarrollo sin configuración para aprender y experimentar con ML sin cargos adicionales.

Amazon SageMaker Canvas

Amazon SageMaker Canvas amplía el acceso a ML al brindar a los analistas de negocios la capacidad de generar predicciones precisas de ML mediante una interfaz visual e interactiva, sin necesidad de tener experiencia en codificación o en ML.

Etiquetado de datos de Amazon SageMaker

El etiquetado de datos Amazon SageMaker tiene dos ofertas de etiquetado de datos: Amazon SageMaker Ground Truth Plus y Amazon SageMaker Ground Truth. Obtenga más información acerca del etiquetado de datos de Amazon SageMaker, un servicio de etiquetado de datos completamente administrado que facilita la creación de conjuntos de datos de formación de alta precisión para ML.

Pruebas de sombras de Amazon SageMaker

SageMaker le permite ejecutar pruebas de sombras para evaluar un nuevo modelo de ML antes del lanzamiento a producción. Para ello, prueba su rendimiento frente al modelo implementado actualmente. No hay cargos adicionales por las pruebas de sombras de SageMaker aparte de los cargos por uso de las instancias de ML y el almacenamiento de ML aprovisionado para alojar el modelo de sombras. El precio de las instancias de ML y de las dimensiones de almacenamiento de ML es el mismo que el de la opción de inferencia en tiempo real especificada en la tabla de precios anterior. No hay ningún cargo adicional por los datos procesados dentro y fuera de las implementaciones de sombras.

Amazon SageMaker Edge

Obtenga más información acerca de los precios de Amazon SageMaker Edge para optimizar, ejecutar y monitorear modelos de ML en flotas de dispositivos de borde.

Savings Plans de Amazon SageMaker

Amazon SageMaker Savings Plans ayuda a reducir los costos en hasta un 64 %. Los planes se aplican automáticamente al uso de instancias de ML de SageMaker elegibles, incluidos cuadernos de SageMaker Studio, instancias de cuaderno de SageMaker, SageMaker Processing, SageMaker Data Wrangler, SageMaker Training, SageMaker Real-Time Inference y SageMaker Batch Transform, independientemente de la familia de instancias, el tamaño o la región. Por ejemplo, puede cambiar el uso de una instancia de CPU ml.c5.xlarge en funcionamiento en la región Este de EE. UU. (Ohio) a una instancia ml.Inf1 en la región Oeste de EE. UU. (Oregón) para cargas de trabajo de inferencia en cualquier momento y pagar de manera automática el precio de Savings Plans.

Obtenga más información »

Costo total de propiedad con Amazon SageMaker

Amazon SageMaker ofrece un costo total de propiedad por lo menos 54 % más bajo en un periodo de 3 años en comparación con otras soluciones autoadministradas basadas en la nube. Obtenga más información en el análisis completo del TCO correspondiente a Amazon SageMaker.

Ejemplos de precios

Ejemplo de precios N.° 1: JupyterLab

Como científico de datos, dedica 20 días a usar JupyterLab para experimentar rápidamente con cuadernos, código y datos durante 6 horas al día en una instancia ml.g4dn.xlarge. Crea y luego ejecuta un espacio de JupyterLab para acceder al IDE de JupyterLab. La computación solo se cobra por la instancia utilizada cuando se ejecuta el espacio de JupyterLab. Los gastos de almacenamiento de un espacio de JupyterLab se acumulan hasta que se elimina.

Computación

Instancia	Duración	Días	Duración total	Costo por hora	Total
ml.g4dn.xlarge	6 horas	20	6 * 20 = 120 horas	0,7364 USD	88,368 USD

Almacenamiento

Utilizará el almacenamiento SSD de uso general durante 480 horas (24 horas* 20 días). En una región que cobra 0,1125 USD por GB al mes:
0,112 USD por GB-mes * 5 GB * 480/(24 horas/día * 30 días al mes) = 0,373 USD

Ejemplo de precios N.° 2: Editor de código

Como ingeniero de ML, dedica 20 días a usar el editor de código para editar, ejecutar y depurar código de producción de ML durante 6 horas al día en una instancia ml.g4dn.xlarge. Cree y, a continuación, ejecute un espacio de editor de código para acceder al IDE del editor de código. La computación solo se cobra por la instancia utilizada cuando se ejecuta el espacio del editor de código. Los gastos de almacenamiento de un espacio del editor de código se acumulan hasta que se elimina.

Computación

Instancia	Duración	Días	Duración total	Costo por hora	Total
ml.g4dn.xlarge	6 horas	20	6 * 20 = 120 horas	0,7364 USD	88,368 USD

Almacenamiento

Ejemplo de precios N.° 3: Studio Classic

Un científico de datos experimenta la siguiente secuencia de acciones mientras utiliza los cuadernos de Amazon SageMaker Studio.

Abre el cuaderno 1 en un kernel de TensorFlow en una instancia ml.c5.xlarge y, luego, trabaja en este cuaderno durante una hora.
Abre el cuaderno 2 en una instancia ml.c5.xlarge. Este se abre automáticamente en la misma instancia ml.c5.xlarge que ejecuta el bloc de notas 1.
Trabaja en los blocs de notas 1 y 2 de forma simultánea durante una hora.
El científico de datos recibirá una factura por un total de 2 horas de uso de la instancia ml.c5.xlarge. Por la hora en la que trabajó simultáneamente en el cuaderno 1 y 2, cada aplicación de kernel contará como media hora y se le cobrará una hora.

Aplicación de kernel	Instancia de cuaderno	Horas	Costo por hora	Total
TensorFlow	ml.c5.xlarge	1	0,204 USD	0,204 USD
TensorFlow	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
Ciencia de datos	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
				0,408 USD

Ejemplo de precios N.° 4: RStudio

Un científico de datos experimenta la siguiente secuencia de acciones mientras utiliza RStudio:

Lanza RSession 1 en una instancia ml.c5.xlarge y, luego, trabaja en este cuaderno durante una hora.
Lanza RSession 2 en una instancia ml.c5.xlarge. Este se abre automáticamente en la misma instancia ml.c5.xlarge que ejecuta RSession 1.
Funciona con RSession 1 y RSession 2 de forma simultánea durante una hora.
El científico de datos recibirá una factura por un total de dos (2) horas de uso de la instancia ml.c5.xlarge. Por la hora en la que trabajó de forma simultánea en RSession 1 y RSession 2, cada aplicación de RSession contará como media hora y se le cobrará 1 hora.

Mientras tanto, RServer funciona ininterrumpidamente sin importar si hay RSessions en marcha o no. Si el administrador elige Small (Pequeño) (ml.t3.medium), entonces es gratuito. Si el administrador elige “Medium” (Mediano) (ml.c5.4xlarge) o “Large” (Grande) (ml.c5.9xlarge), entonces se cobra por hora mientras RStudio esté habilitado para el dominio de SageMaker.

Aplicación RSession	Instancia de RSession	Horas	Costo por hora	Total
Base R	ml.c5.xlarge	1	0,204 USD	0,204 USD
Base R	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
Base R	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
				0,408 USD

Ejemplo de precios N.° 5: procesamiento

Con el procesamiento de Amazon SageMaker, solo se cobran las instancias utilizadas mientras los trabajos están en marcha. Cuando proporciona los datos entrantes para su procesamiento en Amazon S3, Amazon SageMaker descarga los datos desde Amazon S3 al almacenamiento de archivos local al comienzo de un trabajo de procesamiento.

El analista de datos pone en marcha un trabajo de procesamiento para preprocesar y validar los datos en dos instancias ml.m5.4xlarge para la duración de un trabajo de 10 minutos. Carga un conjunto de datos de 100 GB en S3 como entrada para el trabajo de procesamiento. Los datos de salida, que suelen tener el mismo tamaño, se almacenan nuevamente en S3.

Horas	Instancias de procesamiento	Costo por hora	Total
1 * 2 *0,167 = 0,334	ml.m5.4xlarge	0,922 USD	0,308 USD

Almacenamiento (SSD) de uso general (GB)	Costo por hora	Total
100 GB * 2 = 200	0,14 USD	0,0032 USD

El subtotal correspondiente al trabajo de procesamiento de Amazon SageMaker = 0,308 USD.
El subtotal correspondiente a 200 GB de almacenamiento (SSD) de uso general = 0,0032 USD.
El precio total de este ejemplo sería 0,3112 USD

Ejemplo de precios N.° 6: Data Wrangler

Según la tabla, utiliza Amazon SageMaker Data Wrangler durante 18 horas en total durante un periodo de 3 días para preparar los datos. Además, crea un trabajo de SageMaker Data Wrangler para preparar datos actualizado semanalmente. Cada trabajo dura 40 minutos y este se ejecuta una vez por semana durante un mes.

Cargos totales mensuales correspondientes al uso de Data Wrangler = 16,596 USD + 2,461 USD = 19,097 USD

Aplicación	Instancia de SageMaker Studio	Días	Duración	Duración total	Costo por hora	Costo subtotal
SageMaker Data Wrangler	ml.m5.4xlarge	3	6 horas	18 horas	0,922 USD	16,596 USD
Trabajo de SageMaker Data Wrangler	ml.m5.4xlarge	-	40 minutos	2,67 horas	0,922 USD	2,461 USD

Como científico de datos, utiliza Amazon SageMaker Data Wrangler 6 horas al día durante 3 días para limpiar, explorar y visualizar datos. Tras ello, para ejecutar la canalización de preparación de datos, inicia un trabajo de SageMaker Data Wrangler programado para ejecutarse semanalmente.

La tabla que aparece a continuación resume el uso total durante el mes y los cargos correspondientes al uso de Amazon SageMaker Data Wrangler.

Ejemplo de precios N.° 7: almacén de características

++ Todas las unidades de lectura fraccionarias se redondean al siguiente número entero

Almacenamiento de datos
Total de datos almacenados = 31,5 GB
Cargos mensuales correspondientes a los datos almacenados = 31,5 GB * 0,45 USD = 14,175 USD

Cargos mensuales totales correspondientes al almacén de características de Amazon SageMaker = 56,875 USD + 3,185 USD + 14,175 USD = 74,235 USD

Día del mes	Total de escrituras	Total de unidades de escritura	Total de lecturas	Total de unidades de lectura
Del día 1 al día 10	100 000 escrituras (10 000 escrituras * 10 días)	2 500 000 (100 000 * 25 KB)	100 000 (10 000 * 10 días)	700 000++ (100 000 * 25/4 KB )

Día 11	200 000 escrituras	5 000 000 (200 000 * 25KB)	200 000 lecturas	1 400 000++ (200 000 * 25/4 KB)

Del día 12 al día 30	1 520 000 escrituras (80 000 * 19 días)	38 000 000 (1 520 000 * 25 KB)	1 520 000 escrituras (80 000 * 19 días)	10 640 000++ (1 520 000 * 25/4 KB)

Total de unidades facturables		45 500 000 unidades de escritura		12 740 000 unidades de lectura
Cargos mensuales por escrituras y lecturas		56,875 USD (45,5 millones de unidades de escritura * 1,25 USD por millón de escrituras)		3,185 USD (12,74 millones de unidades de lectura * 0,25 USD por millón de lecturas)

Tiene una aplicación web que emite lecturas y escrituras de 25 KB cada una al almacén de características de Amazon SageMaker. Durante los primeros diez días del mes, la aplicación recibe poco tráfico, lo que resulta en 10 000 escrituras y 10 000 lecturas diarias para el almacén de características de SageMaker. El día 11 del mes, la aplicación logra atención en las redes sociales, y el tráfico aumenta a 200 000 escrituras y 200 000 lecturas ese día. Tras ello, la aplicación se establece en un patrón de tráfico más regular, con un promedio de 80 000 escrituras y 80 000 lecturas por día hasta el final del mes.

La tabla que aparece a continuación resume el uso total durante el mes y los cargos correspondientes al uso del almacén de características de Amazon SageMaker.

Ejemplo de precios N.° 8: entrenamiento

Los cargos totales por el entrenamiento y la depuración en este ejemplo son 2,38 USD. Las instancias de informática y los volúmenes de almacenamiento de uso general que utilizan las reglas integradas del depurador de Amazon SageMaker no generan cargos adicionales.

	Almacenamiento (SSD) de uso general para entrenamiento (GB)	Almacenamiento (SSD) de uso general para las reglas integradas del depurador (GB)	Almacenamiento (SSD) de uso general para las reglas personalizadas del depurador (GB)	Costo por GB al mes	Subtotal
Capacidad utilizada	3	2	1
Costo	0 USD	No se aplican cargos adicionales por los volúmenes de la regla integrada	0 USD	0,10 USD	0 USD

Horas	Instancia de entrenamiento	Instancia de depuración	Costo por hora	Subtotal
4 * 0,5 = 2,00	ml.m4.4xlarge	n/d	0,96 USD	1,92 USD
4 * 0,5 * 2 = 4	n/d	No se aplican cargos adicionales por las instancias de la regla integrada	0 USD	0 USD
4 * 0,5 = 2	ml.m5.xlarge	n/d	0,23 USD	0,46 USD
				-------
				2,38 USD

Una científica de datos dedicó una semana a trabajar en un modelo para una nueva idea. Entrenó el modelo 4 veces en una ml.m4.4xlarge durante 30 minutos por ejecución de entrenamiento con el depurador de Amazon SageMaker habilitado con 2 reglas integradas y 1 regla personalizada que ella escribió. Para la regla personalizada, especificó la instancia ml.m5.xlarge. Entrena usando 3 GB de datos de entrenamiento en Amazon S3 y envía una salida modelo de 1 GB a Amazon S3. SageMaker crea volúmenes de SSD de uso general (gp2) para cada instancia de entrenamiento. SageMaker también crea volúmenes de SSD de uso general (gp2) para cada regla especificada. En este ejemplo, se creará un total de 4 volúmenes de SSD de uso general (gp2). El depurador de SageMaker emite 1 GB de datos depurados al bucket de Amazon S3 del cliente.

Ejemplo de precios N.° 9: experimentos

	Costo	Unidades totales	Cargo mensual
Incorporación	1,25 USD por cada millón de registros de métrica	1 millón (= 1000 analistas de datos * 10 veces * 20 sesiones * 5 métricas) de registros de métrica incorporados	1,25 USD (= 1,25 * 1)
Uso de SageMaker Studio	0 USD		0 USD
Recuperación	0,25 USD por cada millón de registros de métrica	10 millones (= 1 millón de métricas incorporadas * 10 recuperaciones por métrica incorporada) de registros de métrica recuperados	2,5 USD (= 0,25 * 10)
Almacenamiento	0,25 USD por cada millón de registros de métrica al mes	1 millón de registros de métrica almacenados	0,25 USD (= 0,25 * 1)
Cargo mensual total			4 USD

Dispone de un banco de trabajo de ML utilizado por 1000 analistas de datos. Realizan experimentos entrenando sus modelos con distintos parámetros y conjuntos de datos. Cada analista de datos entrena un modelo diez veces al mes a lo largo de 20 sesiones y obtiene cinco métricas personalizadas. El banco de trabajo utiliza las API de recuperación para obtener datos de experimentos de SageMaker Experiments y crear análisis personalizados. Los analistas de datos comparan los datos registrados en diez iteraciones de entrenamiento diferentes para encontrar el mejor modelo candidato. En este ejemplo, los cargos serían los siguientes:

	Costo	Unidades totales	Cargo mensual
Incorporación	1,25 USD por cada millón de registros de métrica	100 000 (= 100 analistas de datos * 10 veces * 20 sesiones * 5 métricas) registros de métrica incorporados	0,125 USD (= 1,25 * 100 000/1 000 000)
Uso de SageMaker Studio	0 USD		0 USD
Recuperación	0,25 USD por cada millón de registros de métrica	0	0 USD
Almacenamiento	0,25 USD por cada millón de registros de métrica al mes	100 000 registros de métrica almacenados	0,025 USD (= 0,25 * 100 000/1 000 000)
Cargo mensual total			0,15 USD

Un equipo de 100 analistas de datos trabaja en un proyecto para una nueva idea. Realizan experimentos entrenando sus modelos con distintos parámetros y conjuntos de datos. De media, cada analista de datos entrena un modelo diez veces al mes a lo largo de 20 sesiones y obtiene cinco métricas personalizadas. Los analistas de datos utilizan SageMaker Studio para analizar sus experimentos. En este ejemplo, los cargos serían los siguientes:

Ejemplo de precios N.° 10: inferencia en tiempo real

El subtotal correspondiente al entrenamiento, el alojamiento y la supervisión: 305 827 USD. El subtotal correspondiente a 3100 MB de datos precesados entrantes y 310 MB de datos procesados salientes para alojamiento al mes = 0,054 USD. El total de cargos para este ejemplo sería de 305,881 USD por mes.

Nota: Para las reglas integradas con la instancia ml.m5.xlarge, obtiene hasta 30 horas de supervisión agregada en todos los puntos de conexión por mes, sin costo.

Datos entrantes al mes: alojamiento	Datos salientes al mes: alojamiento	Costo por GB entrante o saliente	Total
100 MB * 31 = 3100 MB		0,016 USD	0,0496 USD
	10 MB * 31 = 310 MB	0,016 USD	0,00496 USD

Horas al mes	Instancias para alojamiento	Instancias de Model Monitor	Costo por hora	Total
24 * 31 *2 = 1488	ml.c5.xlarge		0,204 USD	303,522 USD
31*0,08 = 2,5		ml.m5.4xlarge	0,922 USD	2,305 USD

El modelo del ejemplo N.° 5 se implementa después en la fase de producción en dos (2) instancias ml.c5.xlarge para un alojamiento Multi-AZ fiable. Amazon SageMaker Model Monitor está habilitado con una (1) instancia ml.m5.4xlarge y los trabajos de supervisión se programan una vez por día. Cada trabajo de supervisión tarda 5 minutos en completarse. El modelo recibe diariamente 100 MB de datos y las inferencias tienen una décima parte del tamaño de los datos entrantes.

Ejemplo de precios N.° 11: inferencia asíncrona

El subtotal correspondiente a la inferencia asíncrona de SageMaker = 15,81 USD + 0,56 USD+ 2 * 0,0048 = 16,38 USD. El total de cargos de la inferencia asíncrona para este ejemplo sería de 16,38 USD al mes.

Datos entrantes al mes	Datos salientes al mes	Costo por GB entrante o saliente	Total
10 KB * 1024 * 31 = 310 MB	10 KB * 1024 * 31 = 310 MB	0,02 USD	0,0048
	10 KB * 1024 * 31 = 310 MB	0,02 USD	0,0048

Almacenamiento de uso general (SSD) (GB)	Costo por GB al mes	Total
4	0,14 USD	0,56 USD

Horas al mes	Instancias para alojamiento	Costo por hora	Total
2,5 * 31 * 1 = 77,5	ml.c5.xlarge	0,20 USD	15,81 USD

El servicio de inferencia asíncrona de Amazon SageMaker le cobra por las instancias utilizadas por el punto de conexión. Cuando no se procesan activamente las solicitudes, puede configurar el escalado automático para escalar el recuento de instancias a cero para ahorrar costos. En el caso de las cargas de entrada en Amazon S3, no hay ningún costo por leer los datos de entrada de Amazon S3 y escribir los datos de salida en S3 en la misma región.

El modelo del ejemplo 5 se utiliza para ejecutar un punto de conexión de inferencia asíncrona de SageMaker. El punto de conexión se configura para que se ejecute en una instancia ml.c5.xlarge y se reduzca verticalmente el número de instancias a cero cuando no se procesen las solicitudes activamente. La instancia ml.c5.xlarge del punto de conexión tiene un almacenamiento de uso general (SSD) de 4 GB adjunto. En este ejemplo, el punto de conexión mantiene un recuento de instancias de 1 durante 2 horas al día y tiene un periodo de recuperación de 30 minutos, tras el cual se reduce verticalmente a un recuento de instancias de 0 durante el resto del día. Por lo tanto, se cobra por 2 horas y media de uso al día.

El punto de conexión procesa 1024 solicitudes al día. El tamaño de cada cuerpo de solicitud o respuesta de invocación es de 10 KB y cada carga de solicitud de inferencia en Amazon S3 es de 100 MB. Las salidas de inferencia tienen la décima parte del tamaño de los datos de entrada, que se almacenan de nuevo en Amazon S3 en la misma región. En este ejemplo, los cargos por procesamiento de datos se aplican al cuerpo de la solicitud y la respuesta, pero no a los datos transferidos a o desde Amazon S3.

Ejemplo de precios N.° 12: transformación por lotes

Los cargos totales por inferencia en este ejemplo serían de 2,88 USD.

Horas	Instancias para alojamiento	Costo por hora	Total
3 * 0,25 * 4 = 3 horas	ml.m4.4xlarge	0,96 USD	2,88 USD

El modelo del ejemplo 5 se utiliza para ejecutar la transformación por lotes de SageMaker. El científico de datos pone en marcha cuatro trabajos de transformación por lotes de SageMaker diferentes en 3 instancias ml.m4.4xlarge durante 15 minutos por trabajo en funcionamiento. Carga un conjunto de datos de evaluación de 1 GB en S3 para cada puesta en marcha. Las inferencias tienen una décima parte del tamaño de los datos de entrada, que se almacenan nuevamente en S3.

Ejemplo de precios N.° 13: inferencia sin servidor bajo demanda

Cargos mensuales por el procesamiento de datos

Procesamiento de datos (GB)	Costo por GB entrante o saliente	Cargo mensual por el procesamiento de datos
10 GB	0,016 USD	0,16 USD

El subtotal correspondiente al cargo por la duración de la inferencia sin servidor de SageMaker bajo demanda = 40 USD. El subtotal correspondiente al cargo por el procesamiento de datos de 10 GB = 0,16 USD. Los cargos totales de este ejemplo serían 40,16 USD.

Cargos de computación mensuales

Número de solicitudes	Duración de cada solicitud	Duración total de la inferencia (segundos)	Costo por segundo	Cargo mensual por la duración de la inferencia
10 M	100 ms	1 M	0,00004 USD	40 USD

Con la inferencia sin servidor bajo demanda, solo paga por la capacidad de cálculo utilizada para procesar las solicitudes de inferencia, facturada por milisegundos y por la cantidad de datos procesados. El cargo de cálculo depende de la configuración de la memoria que elija.

Si asignó 2 GB de memoria a su punto de conexión, lo puso en marcha 10 millones de veces en un mes durante 100 ms cada vez y se procesaron 10 GB de datos de entrada o de salida en total, los cargos se calcularían de la siguiente manera:

Ejemplo de precios N.° 14: simultaneidad aprovisionada en una inferencia sin servidor

Supongamos que dirige un servicio de chatbot para una empresa de procesamiento de nóminas. Espera un aumento de las consultas de los clientes a finales de marzo, antes de la fecha límite para la declaración de la renta. Sin embargo, para el resto del mes, se espera que el tráfico sea escaso. Por lo tanto, implementa un punto de conexión sin servidor con 2 GB de memoria y agrega una simultaneidad aprovisionada de 100 para los últimos 5 días del mes de 9:00 h a 17:00 h (8 horas), durante los cuales su punto de conexión procesa 10 millones de solicitudes y 10 GB de datos de entrada/salida de datos en total. El resto del mes, el chatbot se ejecuta mediante inferencia sin servidor bajo demanda y procesa 3 millones de solicitudes y 3 GB de entrada/salida de datos. Supongamos que la duración de cada solicitud es de 100 ms.

Cargos por simultaneidad aprovisionada (PC)
El precio por PC es de 0,000010 USD/segundo
Duración del uso de los PC = 5 días * 100 PC * 8 horas * 3600 segundos = 14 400 000 segundos
Cargo por uso de PC = 14 400 000 s * 0,000010 USD/segundo = 144 USD.

Cargos por duración de inferencia para el tráfico servido por simultaneidad aprovisionada
El precio de la duración de la inferencia es de 0,000023 USD/segundo
Duración total de la inferencia para PC (segundos)= 10 millones * (100 ms) / 1000 = 1 millón de segundos.
Cargos por duración de inferencia por PC = 1 000 000 segundos * 0,000023 USD/segundo = 23 USD

Cargos por duración de inferencia bajo demanda
El precio mensual del cálculo es de 0,00004 USD/segundo y el nivel gratuito ofrece 150 000 segundos.
Cálculo total (segundos) = (3) millones * (100 ms) / 1000 = 0,3 millones de segundos.
Cálculo total - Cálculo gratuito = Cálculo mensual facturable en segundos
0,3 millones de segundos - 150 000 segundos = 150 000 segundos
Cargos mensuales por computación = 150 000 * 0,00004 USD = 6 USD

Procesamiento de datos
Costo/GB de datos procesados de entrada/salida = 0,016 USD
Total de GB procesados: 10 + 3 = 13
Costo total: 0,016 USD * 13 USD = 0,208 USD

Cargos totales de marzo
Cargos totales = cargos de la simultaneidad aprovisionada + duración de la inferencia para capacidad disponible + duración de la inferencia para computación bajo demanda + costos de procesamiento de datos
= 144 USD + 23 USD + 6 USD + 0,208 USD = 173,2 USD

Ejemplo de precios N.° 15: JumpStart

El cliente utiliza JumpStart para implementar un modelo BERT Base Uncased previamente entrenado para clasificar la valoración de los clientes como positiva o negativa.

El cliente implementa el modelo en dos (2) instancias ml.c5.xlarge para un alojamiento Multi-AZ fiable. El modelo recibe diariamente 100 MB de datos y las inferencias tienen una décima parte del tamaño de los datos entrantes.

Horas al mes	Instancias para alojamiento	Costo por hora	Total
24 * 31 *2 = 1488	ml.c5.xlarge	0,204 USD	303,55 USD

Datos entrantes al mes – Alojamiento	Datos salientes al mes – Alojamiento	Costo por GB entrante o saliente	Total
100 MB * 31 = 3100 MB		0,02 USD	0,06 USD
	10 MB * 31 = 310 MB	0,02 USD	0,01 USD

El subtotal correspondiente al entrenamiento, el alojamiento y la supervisión: 305 827 USD. EEl subtotal correspondiente a 3100 MB de datos precesados entrantes y 310 MB de datos procesados salientes para alojamiento al mes = 0,06 USD. El total de cargos para este ejemplo sería de 305 887 USD por mes.

Ejemplo de precios N.° 16: HyperPod

Supongamos que desea un clúster de 64 p5 durante 3 meses de uso continuo para respaldar la implementación integral del modelo.

Horas	Instancia de entrenamiento	Costo por hora
3 meses * 30 días * 24 horas = 2160 horas	ml.p5.48xlarge	113,07 USD

Los cargos totales del clúster en este ejemplo son de 244 321,20 USD

Ejemplo de precios N.° 17: Evaluaciones del modelo fundacional (evaluación automática)

Las evaluaciones del modelo fundacional con SageMaker Clarify solo le cobran por las instancias utilizadas mientras se ejecutan los trabajos de evaluación automática. Al seleccionar una tarea de evaluación automática y un conjunto de datos, SageMaker carga el conjunto de datos de solicitudes de Amazon S3 en una instancia de evaluaciones de SageMaker.

En el siguiente ejemplo, un ingeniero de machine learning ejecuta una evaluación del modelo Llama2 7B en el Este de EE. UU. (Norte de Virginia) para obtener un resumen preciso de la tarea. El tipo de instancia recomendado para la inferencia para Llama 2 7B es ml.g5.2xlarge. La instancia mínima recomendada para una evaluación es ml.m5.2xlarge. En este ejemplo, el trabajo se ejecuta durante 45 minutos, según el tamaño del conjunto de datos. En este ejemplo, el coste del trabajo de evaluación y los resultados detallados es de 1,48 USD.

Procesamiento de las horas de trabajo (ejemplo)	Región	Tipo de instancia	Instancia	Costo por hora	Costo
0,45	US-east-1	Alojamiento del modelo de lenguaje de gran tamaño (LLM)	ml.g5.2xlarge	1,52 USD	1,14 USD
0,45	US-east-1	evaluación	ml.m5.2xlarge	0,46 USD	0,35 USD
Total					1,48 USD

En el siguiente ejemplo, el mismo ingeniero de Virginia ejecuta otro trabajo de evaluación para resumir la precisión de las tareas, pero utiliza una versión personalizada de Llama 2 7B desplegada en su cuenta y en funcionamiento. En este caso, dado que el modelo ya está desplegado en la cuenta, el único costo incremental sería el de la instancia de evaluación.

Procesamiento de las horas de trabajo	Región	Tipo de instancia	Instancia	Costo por hora	Costo
0,45	US-east-1	evaluación	ml.m5.2xlarge	0,46 USD	0,35 USD
Total					0,35 USD

Ejemplo de precios N.° 18: Evaluaciones del modelo fundacional (evaluación realizada por humanos)

En el siguiente ejemplo, un ingeniero de machine learning del Este de EE. UU. (Norte de Virginia) realiza una evaluación humana de Llama-2-7B para resumir la precisión de las tareas y utiliza su propio personal privado para la evaluación. El tipo de instancia recomendado para Llama-2-7B es ml.g5.2xlarge. La instancia mínima recomendada para un trabajo de procesamiento de evaluación realizado por humanos es ml.t3.medium. La inferencia en Llama-2-7B dura 45 minutos, según el tamaño del conjunto de datos. El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que dos trabajadores califiquen cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”). Este trabajo de evaluación constará de 100 tareas (una por cada par de respuesta rápida por cada trabajador: dos trabajadores x 50 conjuntos de respuesta rápida = 100 tareas humanas). El personal humano tarda un día (24 horas) en completar las 100 tareas de evaluación humana del trabajo de evaluación (depende del número y del nivel de habilidad de los trabajadores y de la longitud y la complejidad de las indicaciones y las respuestas de inferencia).

Horas de computación	Tareas humanas	Región	Tipo de instancia	Instancia	Costo por hora	Costo por tarea humana	Costo total
0,45		Este de EE. UU. (Norte de Virginia)	Alojamiento del modelo de lenguaje de gran tamaño (LLM)	ml.g5.2xlarge	1,52 USD		1,14 USD
24		Este de EE. UU. (Norte de Virginia)	Trabajo de procesamiento	ml.t3.medium	0,05 USD		1,20 USD
	100	Cualquiera				0,21 USD	21,00 USD
Total							23,34 USD

En el siguiente ejemplo, el mismo ingeniero del Este de EE. UU. (Norte de Virginia) ejecuta el mismo trabajo de evaluación, pero utiliza Llama-2-7B ya desplegado en su cuenta y en funcionamiento. En este caso, el único costo incremental sería el del trabajo de procesamiento de la evaluación y las tareas humanas.

Horas de computación	Tareas humanas	Región	Tipo de instancia	Instancia	Costo por hora	Costo por tarea humana	Costo total
24		Este de EE. UU. (Norte de Virginia)	Trabajo de procesamiento	ml.t3.medium	0,05 USD		1,20 USD
	100	Cualquiera				0,21 USD	21,00 USD
Total							22,20 USD

Pasos siguientes

Feature Page

Descubra una amplia gama de características de SageMaker

Más información

Console

Comenzar a crear con SageMaker en la Consola de administración de AWS

Regístrese ya

Precios de Amazon SageMaker