중요 업데이트

Amazon Elastic Inference에 관심을 가져주셔서 감사합니다. Amazon Elastic Inference는 더 이상 신규 고객에게 제공되지 않습니다. AWS Inferentia와 같은 다른 하드웨어 가속화 옵션을 사용하여 더 낮은 비용으로 기계 학습 추론 워크로드의 성능을 개선할 수 있습니다. 현재 Amazon Elastic Inference를 사용하고 있다면 워크로드를 이러한 대안으로 마이그레이션하는 것을 고려해 보시기 바랍니다. 자세히 알아보려면 AWS 기계 학습 인프라 페이지를 방문하세요.

Amazon Elastic Inference에서는 사용한 액셀러레이터의 시간에 대해서만 비용을 지불하면 됩니다. 선결제 비용이나 최소 비용이 없으며, TensorFlow 및 Apache MXNet 딥 러닝 프레임워크의 AWS 최적화 버전에 대한 비용도 부과되지 않습니다. VPC 엔드포인트가 프로비저닝된 가용 영역에서 실행되는 액셀러레이터로 구성된 인스턴스가 하나 이상 있는 경우, Amazon Elastic Inference용 AWS PrivateLink VPC 엔드포인트에는 요금이 부과되지 않습니다.

Amazon EC2에 대한 Amazon Elastic Inference 액셀러레이터 요금

다음은 Amazon EC2 인스턴스 및 Amazon ECS에 대한 Amazon Elastic Inference 요금입니다. Amazon SageMaker 인스턴스에 대한 Amazon Elastic Inference 요금은 Amazon SageMaker 요금 페이지에서 모델 배포 섹션을 참조하십시오.

Elastic Inference 액셀러레이터는 2가지 패밀리가 있으며 각 패밀리에는 3가지 유형의 액셀러레이터가 있습니다. EIA2는 가장 최신의 액셀러레이터로서, EIA1 액셀러레이터에 비해 2배의 GPU 메모리를 포함합니다. EIA2는 어떤 EC2 인스턴스에도 연결할 수 있습니다.

참고: 2가지 액셀러레이터 패밀리의 제공 여부는 지역에 따라 다를 수 있으므로 지역 가용성을 확인하십시오.

  • 미국 동부
  • 미국 동부(버지니아 북부) 리전

    액셀러레이터 유형 초당 1조회 부동 소수점 연산의 32비트 처리량(FP-32 TFLOPS) 초당 1조회 부동 소수점 연산의 16비트 처리량(FP-16 TFLOPS) 메모리 요금
    eia2.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 2GB 시간당 0.120 USD
    eia2.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 4GB 시간당 0.240 USD
    eia2.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 8GB 시간당 0.340 USD
    eia1.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 1GB 시간당 0.130 USD
    eia1.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 2GB 시간당 0.260 USD
    eia1.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 4GB 시간당 0.520 USD

    미국 동부(오하이오) 리전

    액셀러레이터 유형 초당 1조회 부동 소수점 연산의 32비트 처리량(FP-32 TFLOPS) 초당 1조회 부동 소수점 연산의 16비트 처리량(FP-16 TFLOPS) 메모리 요금
    eia2.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 2GB 시간당 0.120 USD
    eia2.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 4GB 시간당 0.240 USD
    eia2.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 8GB 시간당 0.340 USD
    eia1.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 1GB 시간당 0.130 USD
    eia1.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 2GB 시간당 0.260 USD
    eia1.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 4GB 시간당 0.520 USD
  • 미국 서부
  • 미국 서부(오레곤) 리전

    액셀러레이터 유형 초당 1조회 부동 소수점 연산의 32비트 처리량(FP-32 TFLOPS) 초당 1조회 부동 소수점 연산의 16비트 처리량(FP-16 TFLOPS) 메모리 요금
    eia2.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 2GB 시간당 0.120 USD
    eia2.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 4GB 시간당 0.240 USD
    eia2.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 8GB 시간당 0.340 USD
    eia1.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 1GB 시간당 0.130 USD
    eia1.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 2GB 시간당 0.260 USD
    eia1.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 4GB 시간당 0.520 USD
  • EU
  • EU(아일랜드) 리전

    액셀러레이터 유형 초당 1조회 부동 소수점 연산의 32비트 처리량(FP-32 TFLOPS) 초당 1조회 부동 소수점 연산의 16비트 처리량(FP-16 TFLOPS) 메모리 요금
    eia2.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 2GB 시간당 0.129 USD
    eia2.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 4GB 시간당 0.258 USD
    eia2.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 8GB 시간당 0.366 USD
    eia1.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 1GB 시간당 0.140 USD
    eia1.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 2GB 시간당 0.280 USD
    eia1.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 4GB 시간당 0.560 USD
  • 아시아 태평양
  • 아시아 태평양(도쿄) 리전

    액셀러레이터 유형 초당 1조회 부동 소수점 연산의 32비트 처리량(FP-32 TFLOPS) 초당 1조회 부동 소수점 연산의 16비트 처리량(FP-16 TFLOPS) 메모리 요금
    eia2.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 2GB 시간당 0.205 USD
    eia2.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 4GB 시간당 0.411 USD
    eia2.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 8GB 시간당 0.582 USD
    eia1.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 1GB 시간당 0.220 USD
    eia1.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 2GB 시간당 0.450 USD
    eia1.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 4GB 시간당 0.890 USD

    아시아 태평양(서울) 리전

    액셀러레이터 유형 초당 1조회 부동 소수점 연산의 32비트 처리량(FP-32 TFLOPS) 초당 1조회 부동 소수점 연산의 16비트 처리량(FP-16 TFLOPS) 메모리 요금
    eia2.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 2GB 시간당 0.196 USD
    eia2.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 4GB 시간당 0.392 USD
    eia2.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 8GB 시간당 0.556 USD
    eia1.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 1GB 시간당 0.210 USD
    eia1.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 2GB 시간당 0.430 USD
    eia1.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 4GB 시간당 0.850 USD

요금 예 1

스트리밍 비디오 분석 애플리케이션을 실행하고 있다고 가정해 보겠습니다. 이 애플리케이션의 단일 비디오 스트림을 분석하기 위해 딥 러닝 추론을 실행하려면 Amazon Elastic Inference eia2.medium 액셀러레이터로 구성된 Amazon EC2 c5.xlarge 인스턴스를 선택할 수 있습니다. 미국 동부(버지니아 북부) 지역에서 이 딥 러닝 모델을 실행하는 데 드는 시간당 비용은 다음과 같습니다.

c5.xlarge 인스턴스의 시간당 요금: 0.17 USD
eia2.medium 액셀러레이터의 시간당 요금: 0.12 USD
이 액셀러레이터로 구성된 인스턴스의 총 시간당 요금: 0.29 USD
총 월별 요금: 0.29 USD * 24 * 31 = 215.76 USD

요금 예 2

최종 사용자가 업로드한 이미지를 실시간으로 분석하는 웹 애플리케이션을 실행하고 있다고 가정해 보겠습니다. 이 애플리케이션을 위해 딥 러닝 추론을 사용하려면, Amazon Elastic Inference eia2.medium 액셀러레이터로 구성된 Amazon EC2 c5.large 인스턴스를 선택하고 Amazon EC2 Auto Scaling을 사용하여 애플리케이션의 수요에 맞춰 이 인스턴스의 용량을 조정할 수 있습니다. 미국 동부(버지니아 북부) 지역에서 이 조합에 대한 시간당 비용은 다음과 같습니다.

c5.large 인스턴스의 시간당 요금: 0.085 USD
eia2.medium 액셀러레이터의 시간당 요금: 0.12 USD
이 액셀러레이터로 구성된 인스턴스의 총 시간당 요금: 0.205 USD
총 월별 요금: 0.205 USD * 24 * 31 = 152.52 USD

추가적인 요금 리소스

AWS 요금 계산기

AWS에서 월별 비용을 손쉽게 계산

요금 지원 받기

AWS 전문가에게 맞춤 견적 받기

시작하는 방법 알아보기

자습서 및 설명서에서 자세히 알아보십시오.

자세히 알아보기 
무료 계정에 가입

AWS 프리 티어에 즉시 액세스할 수 있습니다. 

가입 
콘솔에서 구축 시작

Amazon SageMaker 또는 Amazon EC2에서 Amazon Elastic Inference를 시작하십시오.

로그인하기