Amazon SageMaker ayuda a los científicos de datos y a los desarrolladores a preparar, crear, entrenar e implementar con rapidez modelos de machine learning (ML) de alta calidad al poner a disposición un amplio conjunto de capacidades especialmente creadas para ML. SageMaker admite los principales marcos, kits de herramientas y lenguajes de programación de ML.

Con SageMaker, solo paga por lo que utiliza. Tiene dos opciones para pagar: los precios bajo demanda que no ofrecen tarifas mínimas ni compromisos iniciales y SageMaker Savings Plans, que ofrece un modelo de precios flexible, basado en el uso, a cambio de comprometerse a una cantidad constante de uso.

Nivel gratuito de Amazon SageMaker

Probar Amazon SageMaker Studio es gratis. Como parte del nivel gratuito de AWS, puede comenzar a utilizar Amazon SageMaker de forma gratuita. La capa gratuita comienza el primer mes, al crear el primer recurso de SageMaker. Encuentre información detallada sobre el nivel gratuito de Amazon SageMaker en la tabla que aparece a continuación.

Capacidad de Amazon SageMaker Uso del nivel gratuito al mes durante los primeros dos meses
Cuadernos de Studio e instancias de cuaderno 250 horas de la instancia ml.t3.medium en los cuadernos de Studio o 250 horas de la instancia ml.t2.medium o la instancia ml.t3.medium en instancias de cuaderno
RStudio en SageMaker 250 horas de la instancia ml.t3.medium en la aplicación RSession y la instancia ml.t3.medium gratuita para la aplicación RStudioServerPro
Data Wrangler 25 horas de la instancia ml.m5.4xlarge
Almacén de características 10 millones de unidades de escritura, 10 millones de unidades de lectura, 25 GB de almacenamiento (tienda en línea estándar)
Formación 50 horas de instancias m4.xlarge o m5.xlarge
Amazon SageMaker con TensorBoard 300 horas de instancias ml.r5.large
Inferencia en tiempo real 125 horas de las instancias m4.xlarge o m5.xlarge
Inferencia sin servidor 150 000 segundos de duración de inferencia bajo demanda
Canvas 160 horas al mes por sesión
HyperPod 50 horas de instancia m5.xlarge

Precios de la modalidad bajo demanda

  • Studio Classic
  • Amazon SageMaker Studio Classic
    Studio Classic ofrece cuadernos de Jupyter de un solo paso en nuestra experiencia de IDE heredada. Los recursos de computación subyacentes son completamente elásticos y los blocs de notas se pueden compartir fácilmente con otros, lo que permite que haya una colaboración fluida. Se cobra en función del tipo de instancia que elija, con base en la duración del uso.

  • JupyterLab
  • Amazon SageMaker JupyterLab
    Inicie JupyterLab totalmente gestionado en cuestión de segundos. Utilice el entorno de desarrollo interactivo basado en la web más reciente para cuadernos, código y datos. Se cobra en función del tipo de instancia que elija, con base en la duración del uso.

  • Editor de código
  • Editor de código de Amazon SageMaker
    El editor de código, basado en Code-OSS (Visual Studio Code – Open Source), le permite escribir, probar, depurar y ejecutar su código de análisis y machine learning. Está totalmente integrado con SageMaker Studio y es compatible con las extensiones para IDE disponibles en el registro de extensiones Open VSX.

  • RStudio
  • RStudio
    RStudio ofrece recursos de computación en la nube bajo demanda para acelerar el desarrollo del modelo y mejorar la productividad. Se le cobrará por los tipos de instancias que elija para ejecutar la aplicación RStudio Session y la aplicación RStudio Server Pro.

    Aplicación RStudioServerPro

  • Instancias de cuaderno
  • Instancia de cuaderno
    Las instancias de cuaderno son instancias de computación que ejecutan la aplicación de cuaderno de Jupyter. Se cobra en función del tipo de instancia que elija, con base en la duración del uso.

  • Procesamiento
  • Procesamiento de Amazon SageMaker
    El procesamiento mediante Amazon SageMaker permite ejecutar fácilmente las cargas de trabajo previas al procesamiento, posteriores al procesamiento y de evaluación del modelo en una infraestructura completamente administrada. Se cobra en función del tipo de instancia que elija, con base en la duración del uso.

  • TensorBoard
  • Amazon SageMaker con TensorBoard
    Amazon SageMaker con TensorBoard proporciona una experiencia TensorBoard alojada para visualizar y depurar problemas de convergencia de modelos para trabajos de capacitación de Amazon SageMaker.

  • Data Wrangler
  • Amazon SageMaker Data Wrangler

    Amazon SageMaker Data Wrangler reduce el tiempo que tarda agregar y preparar los datos para el aprendizaje automático de semanas a minutos. Paga por el tiempo que utiliza para limpiar, explorar y visualizar datos. Los clientes que ejecuten instancias de SageMaker Data Wrangler están sujetos a los precios que se indican a continuación.* Los clientes que ejecuten SageMaker Data Wrangler en instancias de espacio de trabajo de SageMaker Canvas están sujetos a los precios de SageMaker Canvas. Consulte la página de precios de SageMaker Canvas para obtener más información.

    Trabajos de Amazon SageMaker Data Wrangler

    Un trabajo de Amazon SageMaker Data Wrangler se crea al exportar un flujo de datos de SageMaker Data Wrangler. Con los trabajos de SageMaker Data Wrangler, puede automatizar los flujos de trabajo de preparación de datos. Los trabajos de SageMaker Data Wrangler ayudan a volver a aplicar los flujos de trabajos de preparación de datos en nuevos conjuntos de datos para ahorrar tiempo. Los trabajos se facturan por segundo.

  • Almacén de características
  • Almacén de características de Amazon SageMaker
    El almacén de características de Amazon SageMaker es un repositorio central para incorporar, almacenar y proporcionar características para el machine learning. Se le cobrará por las escrituras, las lecturas y el almacenamiento de datos del grupo de características en el Almacén de características de SageMaker, con precios diferentes para el almacenamiento en línea estándar y el almacenamiento en línea en memoria.

     Para el almacenamiento en línea estándar, el almacenamiento de datos se cobra por GB al mes. En cuanto al rendimiento, puede elegir entre el modo de capacidad aprovisionada o bajo demanda. Para el modo bajo demanda, las escrituras se cobran como unidades de solicitud de escritura por KB y las lecturas se cobran como unidades de solicitud de lectura por 4 KB. Para el modo de capacidad aprovisionada, especifica la capacidad de lectura y escritura que espera que requiera su aplicación. El Almacén de características de Sagemaker cobra una WCU por cada escritura por segundo (hasta 1 KB) y una RCU por cada lectura por segundo (hasta 4 KB). Se le cobrará la capacidad de rendimiento (lecturas y escrituras) que aprovisione en su grupo de características, incluso en los casos donde no utilice toda la capacidad aprovisionada.

    Para el almacenamiento en línea en memoria, las escrituras se cobran como unidades de solicitud de escritura por KB con un mínimo de 1 unidad por escritura, las lecturas se cobran como unidades de solicitud de lectura por KB con un mínimo de 1 unidad por lectura, y el almacenamiento de datos se cobra por GB por hora. Hay un cargo mínimo de almacenamiento de datos de 5 GiB (5,37 GB) por hora para la tienda en línea integrada en memoria.

  • Formación
  • Entrenamiento mediante Amazon SageMaker
    Amazon SageMaker facilita el entrenamiento de modelos de aprendizaje automático (ML), ya que proporciona todo lo que se necesita para entrenar, ajustar y depurar modelos. Se cobra por el uso del tipo de instancia que elija. Al utilizar Amazon SageMaker Debugger para depurar problemas y monitorear recursos durante el entrenamiento, puede usar reglas integradas para depurar los trabajos de entrenamiento, o bien puede escribir sus propias personalizadas. No se aplican cargos al uso de reglas integradas para depurar los trabajos de entrenamiento. Con respecto a las reglas personalizadas, se cobra en función del tipo de instancia que elija, con base en la duración del uso.

  • MLflow
  • Amazon SageMaker con MLflow
    Amazon SageMaker con MLflow permite a los clientes pagar solo por lo que utilizan. Los clientes pagan por los servidores de seguimiento de MLflow en función de los costes de procesamiento y almacenamiento.

    Los clientes pagan por el procesamiento en función del tamaño del servidor de seguimiento y la cantidad de horas de funcionamiento. Además, los clientes pagan por los metadatos almacenados en el servidor de seguimiento de MLflow.

  • Inferencia en tiempo real
  • Alojamiento de Amazon SageMaker: inferencia en tiempo real
    Amazon SageMaker proporciona inferencia en tiempo real para sus casos de uso que necesitan predicciones en tiempo real. Se cobra por el uso del tipo de instancia que elija. Al utilizar Amazon SageMaker Model Monitor para mantener modelos con un alto nivel de precisión que proporcionan inferencia en tiempo real, puede utilizar reglas integradas para monitorear los modelos, o bien puede escribir sus propias reglas personalizadas. Para las reglas integradas, obtiene hasta 30 horas de monitoreo sin cargos. Se aplican cargos adicionales con base en la duración del uso. Se cobra por separado si utiliza sus propias reglas personalizadas.

  • Inferencia asíncrona
  • Inferencia asíncrona de Amazon SageMaker:
    El servicio de inferencia asíncrona de Amazon SageMaker es una opción de inferencia casi en tiempo real que pone en cola las solicitudes entrantes y las procesa de forma asíncrona. Utilice esta opción cuando necesite procesar grandes cargas útiles a medida que llegan los datos o ejecutar modelos que tienen largos tiempos de procesamiento de inferencia y no tienen requisitos de latencia de menos de un segundo. Se le cobra por el tipo de instancia que elija.

  • Transformación por lotes
  • Transformación por lotes de Amazon SageMaker
    Al utilizar la transformación por lotes de Amazon SageMaker, no es necesario desglosar el conjunto de datos en varios fragmentos ni administrar puntos de enlace en tiempo real. La transformación por lotes de SageMaker permite ejecutar predicciones en conjuntos de datos de lotes grandes o pequeños. Se cobra en función del tipo de instancia que elija, con base en la duración del uso.

  • Inferencia sin servidor
  • Amazon SageMaker Serverless Inference
    La inferencia sin servidor de Amazon SageMaker permite desplegar modelos de machine learning para inferencias sin configurar o administrar las infraestructuras subyacentes. Puede utilizar la inferencia sin servidor bajo demanda o agregar la simultaneidad aprovisionada a su punto de conexión para obtener un rendimiento predecible.

    Con la inferencia sin servidor bajo demanda, solo paga por la capacidad de cálculo utilizada para procesar las solicitudes de inferencia, facturada por milisegundos y por la cantidad de datos procesados. El cargo de computación depende de la configuración de la memoria que elija.

    Simultaneidad aprovisionada

    Si lo desea, también puede habilitar la simultaneidad aprovisionada para sus puntos de conexión sin servidor. La simultaneidad aprovisionada permite implementar modelos en puntos de conexión sin servidor con un rendimiento predecible y una alta escalabilidad, ya que mantiene los puntos de conexión activos para un número específico de solicitudes simultáneas y un tiempo específico. Al igual que ocurre con la inferencia sin servidor bajo demanda, cuando la simultaneidad aprovisionada está habilitada, paga por la capacidad de cálculo utilizada para procesar las solicitudes de inferencia, facturada por milisegundos y por la cantidad de datos procesados. También paga por el uso de la simultaneidad aprovisionada, en función de la memoria configurada, la duración aprovisionada y la cantidad de simultaneidad habilitada.

  • JumpStart
  • Amazon SageMaker JumpStart
    Amazon SageMaker JumpStart le ayuda a iniciarse en el machine learning de forma rápida y sencilla con acceso a colecciones de modelos populares (también conocidas como “zoos de modelos”) con un solo clic. Jumpstart también ofrece soluciones integrales que resuelven casos de uso comunes de ML que se pueden personalizar en función de sus necesidades. El uso de modelos o soluciones JumpStart no conlleva ningún costo adicional. Se le cobrará por las horas subyacentes de las instancias de formación e inferencia utilizadas igual que si las hubiera creado manualmente.

  • Generador de perfiles
  • Generador de perfiles de Amazon SageMaker recopila datos del sistema para la visualización de gráficos de rastros de CPU y GPU de alta resolución. Esta herramienta está diseñada para ayudar a los científicos e ingenieros de datos a identificar los cuellos de botella en el rendimiento relacionados con el hardware en sus modelos de aprendizaje profundo, lo que ahorra tiempo y costos en el entrenamiento integral. Actualmente, Generador de perfiles de Amazon SageMaker solo admite la creación de perfiles de trabajos de entrenamiento utilizando los tipos de instancias de computación de entrenamiento ml.g4dn.12xlarge, ml.p3dn.24xlarge y ml.p4d.24xlarge.

    Regiones: Este de EE. UU. (Ohio), Este de EE. UU. (Norte de Virginia), Oeste de EE. UU. (Oregón), Europa (Fráncfort), Europa (Irlanda) e Israel (Tel Aviv).

    Generador de perfiles de Amazon SageMaker se encuentra actualmente en versión preliminar y está disponible sin costo alguno para los clientes de las regiones compatibles. 

  • HyperPod
  • Amazon SageMaker HyperPod
    Amazon SageMaker HyperPod está diseñado específicamente para acelerar el desarrollo de modelos fundacionales (FM). Para que el entrenamiento de FM sea más resistente, HyperPod supervisa continuamente el estado del clúster, repara y reemplaza los nodos defectuosos sobre la marcha y guarda los puntos de control frecuentes para reanudar de manera automática el entrenamiento sin perder el progreso. SageMaker HyperPod viene preconfigurado con bibliotecas de entrenamiento distribuidas de SageMaker que le permiten mejorar el rendimiento del entrenamiento de FM y, al mismo tiempo, utilizar al máximo la infraestructura de computación y de red del clúster

    Nota: Los precios de SageMaker HyperPod no cubren los cargos por los servicios conectados a clústeres de HyperPod, como Amazon EKS, Amazon FSx para Lustre y Amazon Simple Storage Service (Amazon S3).

  • Optimización de inferencias
  • El kit de herramientas de optimización de inferencias facilita la implementación de las técnicas de optimización de inferencias más recientes para lograr un rendimiento de costos de última generación (SOTA) en Amazon SageMaker y, al mismo tiempo, ahorrar meses de tiempo para los desarrolladores. Puede elegir entre un menú de técnicas de optimización populares que ofrece SageMaker y ejecutar los trabajos de optimización con antelación, comparar el modelo para determinar las métricas de rendimiento y precisión y, a continuación, implementar el modelo optimizado en un punto de conexión de SageMaker para llevar a cabo inferencias.

Detalles de la instancia

Detalles del producto de la instancia P5 de Amazon SageMaker

Tamaño de la instancia vCPU Memoria de la instancia (TiB) Modelo de GPU GPU Memoria total de la GPU (GB) Memoria por GPU (GB) Ancho de banda de la red (Gbps) GPUDirect RDMA GPU de pares Almacenamiento de la instancia (TB) Ancho de banda de EBS (Gbps)
ml.p5.48xlarge 192 2 NVIDIA H100 8 640 HBM3 80 3200 EFAv2   900 GB/s NVSwitch   8 x 3,84 NVMe SSD 80

Detalles del producto de la instancia Amazon SageMaker P4d

Tamaño de la instancia vCPU Memoria de la instancia (GiB) Modelo de GPU GPU Memoria total de la GPU (GB) Memoria por GPU (GB) Ancho de banda de la red (Gbps) GPUDirect RDMA GPU de pares Almacenamiento de instancia (GB) Ancho de banda de EBS (Gbps)
ml.p4d.24xlarge 96 1152 NVIDIA A100 8 320 HBM 2 40 400 ENA y EFA 600 GB/s NVSwitch 8 x 1000 NVMe SSD 19
ml.p4de.24xlarge 96 1152 NVIDIA A100 8 640 HNM2e 80 400 ENA y EFA 600 GB/s NVSwitch 8 X 1000 NVMe SSD 19

Detalles del producto de la instancia P3 de Amazon SageMaker

Tamaño de la instancia vCPU Memoria de la instancia (GiB) Modelo de GPU GPU Memoria total de la GPU (GB) Memoria por GPU (GB) Ancho de banda de la red (Gbps) GPU de pares Almacenamiento de instancia (GB) Ancho de banda de EBS (Gbps)
ml.p3.2xlarge 8 61 NVIDIA V100 1 16 16 Hasta 10 N/D Solo EBS 1,5
ml.p3.8xlarge 32 244 NVIDIA V100 4 64 16 10 NVLink Solo EBS 7
ml.p3.16xlarge 64 488 NVIDIA V100 8 128 16 25 NVLink Solo EBS 14
ml.p3dn.24xlarge 96 768 NVIDIA V100 8 256 32 100 NVLink 2 x 900 NVMeSSD 19

Detalles del producto de la instancia P2 de Amazon SageMaker

Tamaño de la instancia vCPU Memoria de la instancia (GiB) Modelo de GPU GPU Memoria total de la GPU (GB) Memoria por GPU (GB) Ancho de banda de la red (Gbps) Ancho de banda de EBS (Gbps)
ml.p2.xlarge 4 61 NVIDIA K80 1 12 12 Hasta 10 Alta
ml.p2.8xlarge 32 488 NVIDIA K80 8 96 12 10 10
ml.p2.16xlarge 64 732 NVIDIA K80 16 192 12 25 20

Detalles del producto de la instancia G4 de Amazon SageMaker

Tamaño de la instancia vCPU Memoria de la instancia (GiB) Modelo de GPU GPU Memoria total de la GPU (GB) Memoria por GPU (GB) Ancho de banda de la red (Gbps) Almacenamiento de instancia (GB) Ancho de banda de EBS (Gbps)
ml.g4dn.xlarge 4 16 NVIDIA T4 1 16 16 Hasta 25 1 x 125 SSD NVMe Hasta 3,5
ml.g4dn.2xlarge 8 32 NVIDIA T4 1 16 16 Hasta 25 1 x 125 SSD NVMe Hasta 3,5
ml.g4dn.4xlarge 16 64 NVIDIA T4 1 16 16 Hasta 25 1 x 125 SSD NVMe 4,75
ml.g4dn.8xlarge 32 128 NVIDIA T4 1 16 16 50 1 x 900 SSD NVMe 9,5
ml.g4dn.16xlarge 64 256 NVIDIA T4 1 16 16 50 1 x 900 SSD NVMe 9,5
ml.g4dn.12xlarge 48 192 NVIDIA T4 4 64 16 50 1 x 900 SSD NVMe 9,5

Detalles del producto de la instancia G5 de Amazon SageMaker

Tamaño de la instancia vCPU Memoria de la instancia (GiB) Modelo de GPU GPU Memoria total de la GPU (GB) Memoria por GPU (GB) Ancho de banda de la red (Gbps) Ancho de banda de EBS (Gbps) Almacenamiento de instancia (GB)
ml.g5n.xlarge 4 16 NVIDIA A10G 1 24 24 Hasta 10 Hasta 3,5 1 x 250
ml.g5.2xlarge 8 32 NVIDIA A10G 1 24 24 Hasta 10 Hasta 3,5 1 x 450
ml.g5.4xlarge 16 64 NVIDIA A10G 1 24 24 Hasta 25 8 1 x 600
ml.g5.8xlarge 32 128 NVIDIA A10G 1 24 24 25 16 1 x 900
ml.g5.16xlarge 64 256 NVIDIA A10G 1 24 24 25 16 1 x 1900
ml.g5.12xlarge 48 192 NVIDIA A10G 4 96 24 40 16 1 x 3800
ml.g5.24xlarge 96 384 NVIDIA A10G 4 96 24 50 19 1 x 3800
ml.g5.48xlarge 192 768 NVIDIA A10G 8 192 24 100 19 2 x 3800

Detalles del producto de la instancia Trn1 de Amazon SageMaker

Tamaño de la instancia vCPU Memoria (GiB) Aceleradores Trainium Memoria de acelerador total (GB) Memoria por acelerador (GB) Almacenamiento de instancia (GB) Ancho de banda de red (Gbps) Ancho de banda de EBS (Gbps)
ml.trn1.2xlarge 8 32 1 32 32 1 x 500 SSD NVMe Hasta 12,5 Hasta 20
ml.trn1.32xlarge 128 512 16 512 32 4 x 2000 SSD NVMe 800 80

Detalles del producto de la instancia Inf1 de Amazon SageMaker

Tamaño de la instancia vCPU Memoria (GiB) Aceleradores de Inferentia Memoria de acelerador total (GB) Memoria por acelerador (GB) Almacenamiento de la instancia  Interconexión entre aceleradores Ancho de banda de la red (Gbps) Ancho de banda de EBS (Gbps)
ml.inf1.xlarge 4 8 1 8 8 Solo EBS N/D Hasta 25 Hasta 4,75
ml.inf1.2xlarge 8 16 1 8 8 Solo EBS N/D Hasta 25 Hasta 4,75
ml.inf1.6xlarge 24 48 4 32 8 Solo EBS 25 4,75
ml.inf1.24xlarge 96 192 16 128 8 Solo EBS 100 19

Detalles del producto de la instancia Inf2 de Amazon SageMaker

Tamaño de la instancia vCPU Memoria (GiB) Aceleradores de Inferentia Memoria de acelerador total (GB) Memoria por acelerador (GB) Almacenamiento de la instancia  Interconexión entre aceleradores Ancho de banda de la red (Gbps) Ancho de banda de EBS (Gbps)
ml.inf2.xlarge 4 16 1 32 32 Solo EBS N/D Hasta 25 Hasta 10
ml.inf2.8xlarge 32 128 1 32 32 Solo EBS N/D Hasta 25 10
ml.inf2.24xlarge 96 384 6 196 32 Solo EBS 50 30
ml.inf2.48xlarge 192 768 12 384 32 Solo EBS 100 60

Amazon SageMaker Studio

Amazon SageMaker Studio es una interfaz web única para el desarrollo completo de machine learning, que ofrece una selección de entornos de desarrollo integrados (IDE) totalmente administrados y herramientas diseñadas específicamente. Puede acceder a SageMaker Studio de forma gratuita. Solo se le cobrará por el procesamiento y el almacenamiento subyacentes que utilice para los diferentes IDE y herramientas de machine learning de SageMaker Studio.

Puede usar muchos servicios de SageMaker Studio, AWS SDK para Python (Boto3) o la interfaz de la línea de comandos de AWS (AWS CLI), incluidos los siguientes:

  • Entornos de desarrollo en SageMaker Studio para realizar un desarrollo completo de machine learning con un amplio conjunto de IDE totalmente gestionados, incluidos JupyterLab, un editor de código basado en Code-OSS (Visual Studio Code, código abierto) y RStudio
  • SageMaker Pipelines para automatizar y administrar los flujos de trabajo de ML
  • SageMaker Autopilot para crear de forma automática modelos de ML con visibilidad completa
  • SageMaker Experiments para organizar los trabajos de entrenamiento y las versiones, y hacer un seguimiento de estos
  • SageMaker Debugger para depurar anomalías durante la formación
  • SageMaker Model Monitor para mantener modelos de alta calidad
  • SageMaker Clarify para explicar mejor los modelos de ML y detectar sesgos
  • SageMaker JumpStart para implementar de manera fácil soluciones de ML para muchos casos de uso. Es posible que incurra en cargos de otros servicios de AWS utilizados en la solución por las llamadas a la API subyacentes realizadas por Amazon SageMaker en su nombre.
  • Recomendador de inferencias de SageMaker para obtener recomendaciones para la configuración adecuada de los puntos de conexión

Solo paga por los recursos subyacentes de almacenamiento y computación dentro de SageMaker u otros servicios de AWS, en función del uso.

Para usar Amazon Q Developer en JupyterLab, debe suscribirse a Amazon Q Developer Pro. Los precios de Amazon Q Developer están disponibles aquí.

Evaluaciones de modelos fundacionales

SageMaker Clarify es compatible con las evaluaciones de los modelos básicos con métodos de evaluación automáticos y realizadas por humanos. Cada una de ellas tiene un precio diferente. Si evalúa un modelo básico de Amazon SageMaker JumpStart que aún no está desplegado en su cuenta, SageMaker desplegará el modelo JumpStart de manera temporal en una instancia de SageMaker mientras dure la inferencia. La instancia específica se ajustará a la recomendación de instancia brindada por JumpStart para ese modelo.

Evaluación automática:
Las evaluaciones del modelo básico se ejecutan como un trabajo de procesamiento de SageMaker. El trabajo de evaluación invocará SageMaker Inference. A los clientes se les cobra por la inferencia y por el trabajo de evaluación. A los clientes solo se les cobra por la duración del trabajo de evaluación. El costo del trabajo de evaluación sería la suma del costo por hora de la instancia de evaluación y la suma del costo por hora de la instancia de alojamiento.

Evaluaciones realizadas por humanos:
Cuando utiliza la característica de evaluación realizada por humanos, en la que trae su propio personal, se le cobran tres elementos: 1) la instancia de SageMaker utilizada para la inferencia, 2) la instancia utilizada para ejecutar el trabajo de procesamiento de SageMaker que aloja la evaluación humana y 3) un cargo de 0,21 USD por tarea de evaluación humana completada. Una tarea humana se define como la ocurrencia en la que un trabajador humano envía una evaluación de una sola solicitud y las respuestas de inferencia asociadas en la interfaz de usuario de la evaluación humana. El precio es el mismo sin importar si tiene uno o dos modelos en el trabajo de evaluación o si aporta sus propias conclusiones; también es el mismo sin importar el número de dimensiones de la evaluación y los métodos de calificación que incluya. El precio de 0,21 USD por tarea es el mismo para todas las regiones de AWS. No hay ningún cargo adicional por el personal, ya que lo suministra usted.

Evaluación administrada por AWS:
En el caso de una evaluación de expertos administrada por AWS, los precios varían según las necesidades de evaluación en un contrato privado mientras trabaja con el equipo de evaluaciones de expertos de AWS.

Amazon SageMaker Studio Lab

Puede crear y entrenar modelos de ML con Amazon SageMaker Studio Lab de forma gratuita. SageMaker Studio Lab ofrece a los desarrolladores, los académicos y los científicos de datos un entorno de desarrollo sin configuración para aprender y experimentar con ML sin cargos adicionales.

Amazon SageMaker Canvas

Amazon SageMaker Canvas amplía el acceso a ML al brindar a los analistas de negocios la capacidad de generar predicciones precisas de ML mediante una interfaz visual e interactiva, sin necesidad de tener experiencia en codificación o en ML.

Etiquetado de datos de Amazon SageMaker

El etiquetado de datos Amazon SageMaker tiene dos ofertas de etiquetado de datos: Amazon SageMaker Ground Truth Plus y Amazon SageMaker Ground Truth. Obtenga más información acerca del etiquetado de datos de Amazon SageMaker, un servicio de etiquetado de datos completamente administrado que facilita la creación de conjuntos de datos de formación de alta precisión para ML.

Pruebas de sombras de Amazon SageMaker

SageMaker le permite ejecutar pruebas de sombras para evaluar un nuevo modelo de ML antes del lanzamiento a producción. Para ello, prueba su rendimiento frente al modelo implementado actualmente. No hay cargos adicionales por las pruebas de sombras de SageMaker aparte de los cargos por uso de las instancias de ML y el almacenamiento de ML aprovisionado para alojar el modelo de sombras. El precio de las instancias de ML y de las dimensiones de almacenamiento de ML es el mismo que el de la opción de inferencia en tiempo real especificada en la tabla de precios anterior. No hay ningún cargo adicional por los datos procesados dentro y fuera de las implementaciones de sombras.

Amazon SageMaker Edge

Obtenga más información acerca de los precios de Amazon SageMaker Edge para optimizar, ejecutar y monitorear modelos de ML en flotas de dispositivos de borde. 

Savings Plans de Amazon SageMaker

Amazon SageMaker Savings Plans ayuda a reducir los costos en hasta un 64 %. Los planes se aplican automáticamente al uso de instancias de ML de SageMaker elegibles, incluidos cuadernos de SageMaker Studio, instancias de cuaderno de SageMaker, SageMaker Processing, SageMaker Data Wrangler, SageMaker Training, SageMaker Real-Time Inference y SageMaker Batch Transform, independientemente de la familia de instancias, el tamaño o la región. Por ejemplo, puede cambiar el uso de una instancia de CPU ml.c5.xlarge en funcionamiento en la región Este de EE. UU. (Ohio) a una instancia ml.Inf1 en la región Oeste de EE. UU. (Oregón) para cargas de trabajo de inferencia en cualquier momento y pagar de manera automática el precio de Savings Plans. 

Obtenga más información »

Costo total de propiedad con Amazon SageMaker

Amazon SageMaker ofrece un costo total de propiedad por lo menos 54 % más bajo en un periodo de 3 años en comparación con otras soluciones autoadministradas basadas en la nube. Obtenga más información en el análisis completo del TCO correspondiente a Amazon SageMaker.

Ejemplos de precios

  • Como científico de datos, dedica 20 días a usar JupyterLab para experimentar rápidamente con cuadernos, código y datos durante 6 horas al día en una instancia ml.g4dn.xlarge. Crea y luego ejecuta un espacio de JupyterLab para acceder al IDE de JupyterLab. La computación solo se cobra por la instancia utilizada cuando se ejecuta el espacio de JupyterLab. Los gastos de almacenamiento de un espacio de JupyterLab se acumulan hasta que se elimina.

    Computación

    Instancia Duración Días Duración total Costo por hora Total
    ml.g4dn.xlarge 6 horas 20 6 * 20 = 120 horas 0,7364 USD 88,368 USD

    Almacenamiento

    Utilizará el almacenamiento SSD de uso general durante 480 horas (24 horas* 20 días). En una región que cobra 0,1125 USD por GB al mes:
    0,112 USD por GB-mes * 5 GB * 480/(24 horas/día * 30 días al mes) = 0,373 USD

  • Como ingeniero de ML, dedica 20 días a usar el editor de código para editar, ejecutar y depurar código de producción de ML durante 6 horas al día en una instancia ml.g4dn.xlarge. Cree y, a continuación, ejecute un espacio de editor de código para acceder al IDE del editor de código. La computación solo se cobra por la instancia utilizada cuando se ejecuta el espacio del editor de código. Los gastos de almacenamiento de un espacio del editor de código se acumulan hasta que se elimina.

    Computación

    Instancia Duración Días Duración total Costo por hora Total
    ml.g4dn.xlarge 6 horas 20 6 * 20 = 120 horas 0,7364 USD 88,368 USD

    Almacenamiento

    Utilizará el almacenamiento SSD de uso general durante 480 horas (24 horas* 20 días). En una región que cobra 0,1125 USD por GB al mes:
    0,112 USD por GB-mes * 5 GB * 480/(24 horas/día * 30 días al mes) = 0,373 USD

  • Un científico de datos experimenta la siguiente secuencia de acciones mientras utiliza los cuadernos de Amazon SageMaker Studio.

    1. Abre el cuaderno 1 en un kernel de TensorFlow en una instancia ml.c5.xlarge y, luego, trabaja en este cuaderno durante una hora.
    2. Abre el cuaderno 2 en una instancia ml.c5.xlarge. Este se abre automáticamente en la misma instancia ml.c5.xlarge que ejecuta el bloc de notas 1. 
    3. Trabaja en los blocs de notas 1 y 2 de forma simultánea durante una hora.
    4. El científico de datos recibirá una factura por un total de 2 horas de uso de la instancia ml.c5.xlarge. Por la hora en la que trabajó simultáneamente en el cuaderno 1 y 2, cada aplicación de kernel contará como media hora y se le cobrará una hora.
    Aplicación de kernel Instancia de cuaderno Horas Costo por hora Total
    TensorFlow ml.c5.xlarge 1 0,204 USD 0,204 USD
    TensorFlow ml.c5.xlarge 0,5 0,204 USD 0,102 USD
    Ciencia de datos ml.c5.xlarge 0,5 0,204 USD 0,102 USD
            0,408 USD
  • Un científico de datos experimenta la siguiente secuencia de acciones mientras utiliza RStudio:

    1. Lanza RSession 1 en una instancia ml.c5.xlarge y, luego, trabaja en este cuaderno durante una hora.
    2. Lanza RSession 2 en una instancia ml.c5.xlarge. Este se abre automáticamente en la misma instancia ml.c5.xlarge que ejecuta RSession 1.
    3. Funciona con RSession 1 y RSession 2 de forma simultánea durante una hora.
    4. El científico de datos recibirá una factura por un total de dos (2) horas de uso de la instancia ml.c5.xlarge. Por la hora en la que trabajó de forma simultánea en RSession 1 y RSession 2, cada aplicación de RSession contará como media hora y se le cobrará 1 hora.

    Mientras tanto, RServer funciona ininterrumpidamente sin importar si hay RSessions en marcha o no. Si el administrador elige Small (Pequeño) (ml.t3.medium), entonces es gratuito. Si el administrador elige “Medium” (Mediano) (ml.c5.4xlarge) o “Large” (Grande) (ml.c5.9xlarge), entonces se cobra por hora mientras RStudio esté habilitado para el dominio de SageMaker.

    Aplicación RSession Instancia de RSession Horas Costo por hora Total
    Base R ml.c5.xlarge 1 0,204 USD 0,204 USD
    Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD
    Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD
            0,408 USD
  • Con el procesamiento de Amazon SageMaker, solo se cobran las instancias utilizadas mientras los trabajos están en marcha. Cuando proporciona los datos entrantes para su procesamiento en Amazon S3, Amazon SageMaker descarga los datos desde Amazon S3 al almacenamiento de archivos local al comienzo de un trabajo de procesamiento.

    El analista de datos pone en marcha un trabajo de procesamiento para preprocesar y validar los datos en dos instancias ml.m5.4xlarge para la duración de un trabajo de 10 minutos. Carga un conjunto de datos de 100 GB en S3 como entrada para el trabajo de procesamiento. Los datos de salida, que suelen tener el mismo tamaño, se almacenan nuevamente en S3.

    Horas Instancias de procesamiento Costo por hora Total
    1 * 2 *0,167 = 0,334 ml.m5.4xlarge 0,922 USD 0,308 USD
    Almacenamiento (SSD) de uso general (GB) Costo por hora Total
    100 GB * 2 = 200 0,14 USD 0,0032 USD

    El subtotal correspondiente al trabajo de procesamiento de Amazon SageMaker = 0,308 USD.
    El subtotal correspondiente a 200 GB de almacenamiento (SSD) de uso general = 0,0032 USD.
    El precio total de este ejemplo sería 0,3112 USD

  • Según la tabla, utiliza Amazon SageMaker Data Wrangler durante 18 horas en total durante un periodo de 3 días para preparar los datos. Además, crea un trabajo de SageMaker Data Wrangler para preparar datos actualizado semanalmente. Cada trabajo dura 40 minutos y este se ejecuta una vez por semana durante un mes.

    Cargos totales mensuales correspondientes al uso de Data Wrangler = 16,596 USD + 2,461 USD = 19,097 USD

    Aplicación Instancia de SageMaker Studio Días Duración Duración total Costo por hora Costo subtotal
    SageMaker Data Wrangler ml.m5.4xlarge 3 6 horas 18 horas 0,922 USD 16,596 USD
    Trabajo de SageMaker Data Wrangler ml.m5.4xlarge - 40 minutos 2,67 horas 0,922 USD 2,461 USD

    Como científico de datos, utiliza Amazon SageMaker Data Wrangler 6 horas al día durante 3 días para limpiar, explorar y visualizar datos. Tras ello, para ejecutar la canalización de preparación de datos, inicia un trabajo de SageMaker Data Wrangler programado para ejecutarse semanalmente.

    La tabla que aparece a continuación resume el uso total durante el mes y los cargos correspondientes al uso de Amazon SageMaker Data Wrangler.

  • ++ Todas las unidades de lectura fraccionarias se redondean al siguiente número entero

    Almacenamiento de datos
    Total de datos almacenados = 31,5 GB
    Cargos mensuales correspondientes a los datos almacenados = 31,5 GB * 0,45 USD = 14,175 USD

    Cargos mensuales totales correspondientes al almacén de características de Amazon SageMaker = 56,875 USD + 3,185 USD + 14,175 USD = 74,235 USD

    Día del mes Total de escrituras Total de unidades de escritura Total de lecturas Total de unidades de lectura
    Del día 1 al día 10 100 000 escrituras 
    (10 000 escrituras * 10 días)
    2 500 000 
    (100 000 * 25 KB)
    100 000 
    (10 000 * 10 días)
    700 000++ 
    (100 000 * 25/4 KB )
             
    Día 11 200 000 escrituras 5 000 000 
    (200 000 * 25KB)
    200 000 lecturas 1 400 000++ 
    (200 000 * 25/4 KB)
             
    Del día 12 al día 30 1 520 000 escrituras 
    (80 000 * 19 días)
    38 000 000 
    (1 520 000 * 25 KB)
    1 520 000 escrituras
    (80 000 * 19 días)
    10 640 000++
    (1 520 000 * 25/4 KB)
             
    Total de unidades facturables   45 500 000 unidades de escritura   12 740 000 unidades de lectura
    Cargos mensuales por escrituras y lecturas   56,875 USD 
    (45,5 millones de unidades de escritura * 1,25 USD por millón de escrituras)
      3,185 USD 
    (12,74 millones de unidades de lectura * 0,25 USD por millón de lecturas)

    Tiene una aplicación web que emite lecturas y escrituras de 25 KB cada una al almacén de características de Amazon SageMaker. Durante los primeros diez días del mes, la aplicación recibe poco tráfico, lo que resulta en 10 000 escrituras y 10 000 lecturas diarias para el almacén de características de SageMaker. El día 11 del mes, la aplicación logra atención en las redes sociales, y el tráfico aumenta a 200 000 escrituras y 200 000 lecturas ese día. Tras ello, la aplicación se establece en un patrón de tráfico más regular, con un promedio de 80 000 escrituras y 80 000 lecturas por día hasta el final del mes.

    La tabla que aparece a continuación resume el uso total durante el mes y los cargos correspondientes al uso del almacén de características de Amazon SageMaker.

  • Los cargos totales por el entrenamiento y la depuración en este ejemplo son 2,38 USD. Las instancias de informática y los volúmenes de almacenamiento de uso general que utilizan las reglas integradas del depurador de Amazon SageMaker no generan cargos adicionales.

      Almacenamiento (SSD) de uso general para entrenamiento (GB) Almacenamiento (SSD) de uso general para las reglas integradas del depurador (GB) Almacenamiento (SSD) de uso general para las reglas personalizadas del depurador (GB) Costo por GB al mes Subtotal
    Capacidad utilizada 3 2 1    
    Costo 0 USD No se aplican cargos adicionales por los volúmenes de la regla integrada 0 USD 0,10 USD 0 USD

     

    Horas Instancia de entrenamiento Instancia de depuración Costo por hora Subtotal
    4 * 0,5 = 2,00 ml.m4.4xlarge n/d 0,96 USD 1,92 USD
    4 * 0,5 * 2 = 4 n/d No se aplican cargos adicionales por las instancias de la regla integrada 0 USD 0 USD
    4 * 0,5 = 2 ml.m5.xlarge n/d 0,23 USD 0,46 USD
            -------
            2,38 USD

    Una científica de datos dedicó una semana a trabajar en un modelo para una nueva idea. Entrenó el modelo 4 veces en una ml.m4.4xlarge durante 30 minutos por ejecución de entrenamiento con el depurador de Amazon SageMaker habilitado con 2 reglas integradas y 1 regla personalizada que ella escribió. Para la regla personalizada, especificó la instancia ml.m5.xlarge. Entrena usando 3 GB de datos de entrenamiento en Amazon S3 y envía una salida modelo de 1 GB a Amazon S3. SageMaker crea volúmenes de SSD de uso general (gp2) para cada instancia de entrenamiento. SageMaker también crea volúmenes de SSD de uso general (gp2) para cada regla especificada. En este ejemplo, se creará un total de 4 volúmenes de SSD de uso general (gp2). El depurador de SageMaker emite 1 GB de datos depurados al bucket de Amazon S3 del cliente.

  • Usted tiene dos equipos de científicos de datos. Un equipo con 10 científicos de datos y el otro equipo con 40. Para admitir estos dos equipos, elige habilitar dos servidores de seguimiento de MLflow diferentes: uno pequeño y otro mediano. Cada equipo realiza experimentos de machine learning (ML) y necesita registrar las métricas, los parámetros y los artefactos producidos por sus intentos de entrenamiento. Quieren usar los servidores de seguimiento de MLflow durante 160 horas al mes. Asumamos que cada equipo de ciencia de datos almacena 1 GB de metadatos para realizar un seguimiento de las ejecuciones de los experimentos. La factura al final del mes se calcularía de la siguiente manera:  

    Cargos de procesamiento para instancias del servidor pequeño: 160 * 0,60 USD = 96 USD
    Cargos de procesamiento para instancias del servidor mediano: 160 * 1,40 USD = 166,4 USD
    Cargos de almacenamiento para los dos equipos: 2 * 1 * 0,10 USD = 0,20 USD

    Total = 262,60 USD

  • El subtotal correspondiente al entrenamiento, el alojamiento y la supervisión: 305 827 USD. El subtotal correspondiente a 3100 MB de datos precesados entrantes y 310 MB de datos procesados salientes para alojamiento al mes = 0,054 USD. El total de cargos para este ejemplo sería de 305,881 USD por mes.

    Nota: Para las reglas integradas con la instancia ml.m5.xlarge, obtiene hasta 30 horas de supervisión agregada en todos los puntos de conexión por mes, sin costo.

     

    Datos entrantes al mes: alojamiento Datos salientes al mes: alojamiento Costo por GB entrante o saliente Total
    100 MB * 31 = 3100 MB   0,016 USD 0,0496 USD
      10 MB * 31 = 310 MB 0,016 USD 0,00496 USD
    Horas al mes Instancias para alojamiento Instancias de Model Monitor Costo por hora Total
    24 * 31 *2 = 1488 ml.c5.xlarge   0,204 USD 303,522 USD
    31*0,08 = 2,5   ml.m5.4xlarge 0,922 USD 2,305 USD

    El modelo del ejemplo N.° 5 se implementa después en la fase de producción en dos (2) instancias ml.c5.xlarge para un alojamiento Multi-AZ fiable. Amazon SageMaker Model Monitor está habilitado con una (1) instancia ml.m5.4xlarge y los trabajos de supervisión se programan una vez por día. Cada trabajo de supervisión tarda 5 minutos en completarse. El modelo recibe diariamente 100 MB de datos y las inferencias tienen una décima parte del tamaño de los datos entrantes.

  • El subtotal correspondiente a la inferencia asíncrona de SageMaker = 15,81 USD + 0,56 USD+ 2 * 0,0048 = 16,38 USD. El total de cargos de la inferencia asíncrona para este ejemplo sería de 16,38 USD al mes.

    Datos entrantes al mes Datos salientes al mes Costo por GB entrante o saliente Total
    10 KB * 1024 * 31 = 310 MB 10 KB * 1024 * 31 = 310 MB 0,02 USD 0,0048
      10 KB * 1024 * 31 = 310 MB 0,02 USD 0,0048
    Almacenamiento de uso general (SSD) (GB) Costo por GB al mes Total
    4 0,14 USD 0,56 USD
    Horas al mes Instancias para alojamiento Costo por hora Total
    2,5 * 31 * 1 = 77,5 ml.c5.xlarge 0,20 USD 15,81 USD

    El servicio de inferencia asíncrona de Amazon SageMaker le cobra por las instancias utilizadas por el punto de conexión. Cuando no se procesan activamente las solicitudes, puede configurar el escalado automático para escalar el recuento de instancias a cero para ahorrar costos. En el caso de las cargas de entrada en Amazon S3, no hay ningún costo por leer los datos de entrada de Amazon S3 y escribir los datos de salida en S3 en la misma región.

    El modelo del ejemplo 5 se utiliza para ejecutar un punto de conexión de inferencia asíncrona de SageMaker. El punto de conexión se configura para que se ejecute en una instancia ml.c5.xlarge y se reduzca verticalmente el número de instancias a cero cuando no se procesen las solicitudes activamente. La instancia ml.c5.xlarge del punto de conexión tiene un almacenamiento de uso general (SSD) de 4 GB adjunto. En este ejemplo, el punto de conexión mantiene un recuento de instancias de 1 durante 2 horas al día y tiene un periodo de recuperación de 30 minutos, tras el cual se reduce verticalmente a un recuento de instancias de 0 durante el resto del día. Por lo tanto, se cobra por 2 horas y media de uso al día. 

    El punto de conexión procesa 1024 solicitudes al día. El tamaño de cada cuerpo de solicitud o respuesta de invocación es de 10 KB y cada carga de solicitud de inferencia en Amazon S3 es de 100 MB. Las salidas de inferencia tienen la décima parte del tamaño de los datos de entrada, que se almacenan de nuevo en Amazon S3 en la misma región. En este ejemplo, los cargos por procesamiento de datos se aplican al cuerpo de la solicitud y la respuesta, pero no a los datos transferidos a o desde Amazon S3. 

  • Los cargos totales por inferencia en este ejemplo serían de 2,88 USD.

    Horas Instancias para alojamiento Costo por hora Total
    3 * 0,25 * 4 = 3 horas ml.m4.4xlarge 0,96 USD 2,88 USD

    El modelo del ejemplo 5 se utiliza para ejecutar la transformación por lotes de SageMaker. El científico de datos pone en marcha cuatro trabajos de transformación por lotes de SageMaker diferentes en 3 instancias ml.m4.4xlarge durante 15 minutos por trabajo en funcionamiento. Carga un conjunto de datos de evaluación de 1 GB en S3 para cada puesta en marcha. Las inferencias tienen una décima parte del tamaño de los datos de entrada, que se almacenan nuevamente en S3.

  • Cargos mensuales por el procesamiento de datos

    Procesamiento de datos (GB) Costo por GB entrante o saliente Cargo mensual por el procesamiento de datos
    10 GB 0,016 USD 0,16 USD

    El subtotal correspondiente al cargo por la duración de la inferencia sin servidor de SageMaker bajo demanda = 40 USD. El subtotal correspondiente al cargo por el procesamiento de datos de 10 GB = 0,16 USD. Los cargos totales de este ejemplo serían 40,16 USD.

    Cargos de computación mensuales

    Número de solicitudes Duración de cada solicitud Duración total de la inferencia (segundos) Costo por segundo Cargo mensual por la duración de la inferencia
    10 M 100 ms 1 M 0,00004 USD 40 USD

    Con la inferencia sin servidor bajo demanda, solo paga por la capacidad de cálculo utilizada para procesar las solicitudes de inferencia, facturada por milisegundos y por la cantidad de datos procesados. El cargo de cálculo depende de la configuración de la memoria que elija.

    Si asignó 2 GB de memoria a su punto de conexión, lo puso en marcha 10 millones de veces en un mes durante 100 ms cada vez y se procesaron 10 GB de datos de entrada o de salida en total, los cargos se calcularían de la siguiente manera:

  • Supongamos que dirige un servicio de chatbot para una empresa de procesamiento de nóminas. Espera un aumento de las consultas de los clientes a finales de marzo, antes de la fecha límite para la declaración de la renta. Sin embargo, para el resto del mes, se espera que el tráfico sea escaso. Por lo tanto, implementa un punto de conexión sin servidor con 2 GB de memoria y agrega una simultaneidad aprovisionada de 100 para los últimos 5 días del mes de 9:00 h a 17:00 h (8 horas), durante los cuales su punto de conexión procesa 10 millones de solicitudes y 10 GB de datos de entrada/salida de datos en total. El resto del mes, el chatbot se ejecuta mediante inferencia sin servidor bajo demanda y procesa 3 millones de solicitudes y 3 GB de entrada/salida de datos. Supongamos que la duración de cada solicitud es de 100 ms.

    Cargos por simultaneidad aprovisionada (PC)
    El precio por PC es de 0,000010 USD/segundo
    Duración del uso de los PC = 5 días * 100 PC * 8 horas * 3600 segundos = 14 400 000 segundos
    Cargo por uso de PC = 14 400 000 s * 0,000010 USD/segundo = 144 USD.

    Cargos por duración de inferencia para el tráfico servido por simultaneidad aprovisionada
    El precio de la duración de la inferencia es de 0,000023 USD/segundo
    Duración total de la inferencia para PC (segundos)= 10 millones * (100 ms) / 1000 = 1 millón de segundos.
    Cargos por duración de inferencia por PC = 1 000 000 segundos * 0,000023 USD/segundo = 23 USD

    Cargos por duración de inferencia bajo demanda
    El precio mensual del cálculo es de 0,00004 USD/segundo y el nivel gratuito ofrece 150 000 segundos.
    Cálculo total (segundos) = (3) millones * (100 ms) / 1000 = 0,3 millones de segundos.
    Cálculo total - Cálculo gratuito = Cálculo mensual facturable en segundos
    0,3 millones de segundos - 150 000 segundos = 150 000 segundos
    Cargos mensuales por computación = 150 000 * 0,00004 USD = 6 USD

    Procesamiento de datos
    Costo/GB de datos procesados de entrada/salida = 0,016 USD
    Total de GB procesados: 10 + 3 = 13
    Costo total: 0,016 USD * 13 USD = 0,208 USD

    Cargos totales de marzo
    Cargos totales = cargos de la simultaneidad aprovisionada + duración de la inferencia para capacidad disponible + duración de la inferencia para computación bajo demanda + costos de procesamiento de datos
    = 144 USD + 23 USD + 6 USD + 0,208 USD = 173,2 USD

  • El cliente utiliza JumpStart para implementar un modelo BERT Base Uncased previamente entrenado para clasificar la valoración de los clientes como positiva o negativa.

    El cliente implementa el modelo en dos (2) instancias ml.c5.xlarge para un alojamiento Multi-AZ fiable. El modelo recibe diariamente 100 MB de datos y las inferencias tienen una décima parte del tamaño de los datos entrantes.

    Horas al mes Instancias para alojamiento Costo por hora Total
    24 * 31 *2 = 1488 ml.c5.xlarge 0,204 USD 303,55 USD
     
    Datos entrantes al mes – Alojamiento Datos salientes al mes – Alojamiento Costo por GB entrante o saliente

    Total

    100 MB * 31 = 3100 MB   0,02 USD 0,06 USD
      10 MB * 31 = 310 MB 0,02 USD 0,01 USD
     

    El subtotal correspondiente al entrenamiento, el alojamiento y la supervisión: 305 827 USD. EEl subtotal correspondiente a 3100 MB de datos precesados entrantes y 310 MB de datos procesados salientes para alojamiento al mes = 0,06 USD. El total de cargos para este ejemplo sería de 305,887 USD por mes.

  • Supongamos que desea aprovisionar un clúster de 4 ml.g5.24xlarge durante 1 mes (30 días) con 100 GB adicionales de almacenamiento por instancia para respaldar el desarrollo del modelo. Los cargos totales por el clúster y el almacenamiento adicional en este ejemplo son de 29 374,40 USD.

    Computación

    Instancia Duración Instancias Coste por hora Subtotal
    ml.g5.24xlarge 30 días* 24 horas = 720 horas 4 10,18 USD 29 318,40 USD

    Almacenamiento

    Almacenamiento de uso general (SSD) Duración Instancias Costo por GB al mes Subtotal
    100 GB 30 días* 24 horas = 720 horas 4 0,14 USD 56,00 USD
  • Las evaluaciones del modelo fundacional con SageMaker Clarify solo le cobran por las instancias utilizadas mientras se ejecutan los trabajos de evaluación automática. Al seleccionar una tarea de evaluación automática y un conjunto de datos, SageMaker carga el conjunto de datos de solicitudes de Amazon S3 en una instancia de evaluaciones de SageMaker.

    En el siguiente ejemplo, un ingeniero de machine learning ejecuta una evaluación del modelo Llama2 7B en el Este de EE. UU. (Norte de Virginia) para obtener un resumen preciso de la tarea. El tipo de instancia recomendado para la inferencia para Llama 2 7B es ml.g5.2xlarge. La instancia mínima recomendada para una evaluación es ml.m5.2xlarge. En este ejemplo, el trabajo se ejecuta durante 45 minutos, según el tamaño del conjunto de datos. En este ejemplo, el coste del trabajo de evaluación y los resultados detallados es de 1,48 USD.

    Procesamiento de las horas de trabajo (ejemplo)

    Región

    Tipo de instancia

    Instancia

    Costo por hora

    Costo

    0,45

    US-east-1

    Alojamiento del modelo de lenguaje de gran tamaño (LLM)

    ml.g5.2xlarge

    1,52 USD

    1,14 USD

    0,45

    US-east-1

    evaluación

    ml.m5.2xlarge

    0,46 USD

    0,35 USD

    Total

           

    1,48 USD

    En el siguiente ejemplo, el mismo ingeniero de Virginia ejecuta otro trabajo de evaluación para resumir la precisión de las tareas, pero utiliza una versión personalizada de Llama 2 7B desplegada en su cuenta y en funcionamiento. En este caso, dado que el modelo ya está desplegado en la cuenta, el único costo incremental sería el de la instancia de evaluación.

    Procesamiento de las horas de trabajo

    Región

    Tipo de instancia

    Instancia

    Costo por hora

    Costo

    0,45

    US-east-1

    evaluación

    ml.m5.2xlarge

    0,46 USD

    0,35 USD

    Total

           

    0,35 USD

  • En el siguiente ejemplo, un ingeniero de machine learning del Este de EE. UU. (Norte de Virginia) realiza una evaluación humana de Llama-2-7B para resumir la precisión de las tareas y utiliza su propio personal privado para la evaluación. El tipo de instancia recomendado para Llama-2-7B es ml.g5.2xlarge. La instancia mínima recomendada para un trabajo de procesamiento de evaluación realizado por humanos es ml.t3.medium. La inferencia en Llama-2-7B dura 45 minutos, según el tamaño del conjunto de datos. El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que dos trabajadores califiquen cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”). Este trabajo de evaluación constará de 100 tareas (una por cada par de respuesta rápida por cada trabajador: dos trabajadores x 50 conjuntos de respuesta rápida = 100 tareas humanas). El personal humano tarda un día (24 horas) en completar las 100 tareas de evaluación humana del trabajo de evaluación (depende del número y del nivel de habilidad de los trabajadores y de la longitud y la complejidad de las indicaciones y las respuestas de inferencia).

    Horas de computación

    Tareas humanas

    Región

    Tipo de instancia

    Instancia

    Costo por hora

    Costo por tarea humana

    Costo total

    0,45

     

    Este de EE. UU. (Norte de Virginia)

    Alojamiento del modelo de lenguaje de gran tamaño (LLM)

    ml.g5.2xlarge

    1,52 USD

     

    1,14 USD

    24

     

    Este de EE. UU. (Norte de Virginia)

    Trabajo de procesamiento

    ml.t3.medium

    0,05 USD

     

    1,20 USD

     

    100

    Cualquiera

         

    0,21 USD

    21,00 USD

    Total

               

    23,34 USD

    En el siguiente ejemplo, el mismo ingeniero del Este de EE. UU. (Norte de Virginia) ejecuta el mismo trabajo de evaluación, pero utiliza Llama-2-7B ya desplegado en su cuenta y en funcionamiento. En este caso, el único costo incremental sería el del trabajo de procesamiento de la evaluación y las tareas humanas.

    Horas de computación

    Tareas humanas

    Región

    Tipo de instancia

    Instancia

    Costo por hora

    Costo por tarea humana

    Costo total

    24

     

    Este de EE. UU. (Norte de Virginia)

    Trabajo de procesamiento

    ml.t3.medium

    0,05 USD

     

    1,20 USD

     

    100

    Cualquiera

         

    0,21 USD

    21,00 USD

    Total

               

    22,20 USD