새로운 Amazon SageMaker AI MCP 서버로 Amazon SageMaker HyperPod 클러스터 관리
Amazon SageMaker AI MCP 서버가 이제 HyperPod 클러스터 설정 및 관리를 지원하는 도구를 제공합니다. Amazon SageMaker HyperPod는 AI 가속기 클러스터 전반에서 훈련, 미세 조정 또는 배포와 같은 모델 개발 작업을 신속하게 확장하여, 생성형 AI 모델 빌드에 수반되는 획일적으로 부담스러운 작업을 제거합니다. SageMaker AI MCP 서버는 이제 AI 코딩 어시스턴트가 모델 훈련 및 배포를 위한 AI/ML 클러스터를 프로비저닝하고 운영하는 기능을 지원합니다.
AWS의 MCP 서버는 AI 코드 어시스턴트가 다양한 AWS 서비스의 실시간 맥락을 이해할 수 있도록 지원함으로써 AI 지원 애플리케이션 개발을 강화하는 표준 인터페이스를 제공합니다. SageMaker AI MCP 서버에는 사용자 선택한 AI 어시스턴트를 활용하여 초기 설정에서 지속적인 관리에 이르는 엔드 투 엔드 AI/ML 클러스터 운영을 간소화하는 도구가 함께 제공됩니다. 이 도구를 이용하면 AI 에이전트는 네트워킹, 스토리지 및 컴퓨팅 리소스를 최적화하는 CloudFormation 템플릿으로 구동되는, Amazon EKS 또는 Slurm으로 오케스트레이션되는 HyperPod 클러스터를 사전 요구 사항을 완벽하게 충족하여 안정적으로 설정할 수 있습니다. 이 MCP 서버를 통해 생성된 클러스터는 고성능 분산 훈련 및 추론 워크로드에 완벽하게 최적화되어 있으며, 모범 사례 아키텍처를 활용하여 대규모 처리량을 극대화하고 지연 시간을 최소화합니다. 또한 이 도구는 작업 확장, 소프트웨어 패치 적용, 다양한 유지 관리 작업 수행을 포함한, 클러스터 및 노드 관리를 위한 포괄적인 도구도 제공합니다. 이 도구를 AWS API MCP 서버, AWS Knowledge MCP 서버 및 Amazon EKS MCP 서버와 함께 사용하면 모든 SageMaker HyperPod API가 완벽하게 지원되며, 클러스터 노드에 액세스할 수 없게 된 이유 진단 같은 일반적인 문제를 효과적으로 해결할 수 있습니다. 클러스터 관리자는 이러한 도구를 이용해 일상적인 작업을 간소화할 수 있습니다. 데이터 사이언티스트는 인프라 전문 지식이 없어도 AI/ML 클러스터를 대규모로 설정하여 가장 중요한 일, 즉 모델 학습과 배포에 집중할 수 있습니다.
SageMaker HyperPod이 제공되는 모든 리전에서 SageMaker AI MCP 서버를 통해 AI/ML 클러스터를 관리할 수 있습니다. 시작하려면 AWS MCP 서버 설명서를 참조하세요.