미리 구성된 환경에서 확장 가능하고 안전한 딥 러닝 애플리케이션을 빠르게 구축
규모 조정
분산 기계 학습(ML) 훈련을 수천 개의 가속화된 인스턴스로 규모 조정하고 프로덕션 추론용 모델을 원활하게 배포할 수 있습니다.
개발
최신 드라이버, 프레임워크, 라이브러리 및 도구를 사용하여 AWS Trainium, AWS Inferentia, NVIDIA GPU를 비롯한 액셀러레이터를 기반으로 개발할 수 있습니다.
위험 감소
보안 취약성을 해결하기 위해 정기적으로 패치를 적용하는 사용자 지정되고 안정적인 머신 이미지를 통해 위험을 줄일 수 있습니다.
사용 사례
자율 주행 차량 개발
수백만 개의 가상 테스트를 통해 모델을 검증하여 대규모로 고급 ML 모델을 개발해서 자율 주행 차량(AV) 기술을 안전하게 개발합니다.
자연어 처리
Hugging Face Transformers를 포함한 최신 프레임워크 및 라이브러리를 사용하여 AWS 인스턴스의 설치 및 구성을 가속화하고 실험 및 평가 속도를 높입니다.
의료 데이터 분석
고급 분석, ML 및 딥 러닝 기능을 사용하여 서로 다른 원시 건강 데이터에서 추세를 확인하고 예측합니다.
모델 훈련 가속화
DLAMI에는 사전 구성된 드라이버, Intel Math Kernel Library(MKL), Python 패키지 및 Anaconda 플랫폼을 통한 최신 NVIDIA GPU 가속이 포함되어 있습니다.
고객 성공 사례
Cimpress는 장기적으로 고객 중심의 기업용 인쇄 대량 맞춤화 비즈니스에 투자하고 구축합니다. Cimpress를 사용하면 쉽고 저렴하게 고객, 조직 또는 사랑하는 사람에게 깊은 인상을 남길 수 있습니다. 기업의 브랜드를 돋보이게 하는 홍보 자료든, 탄생을 축하하는 소식이든, Cimpress는 고객이 원하는 개별 맞춤화와 실제 제품의 실질적인 효과를 결합합니다.
“Cimpress는 AWS Deep Learning AMI를 사용하여 기계 학습 환경을 신속하게 설정하고 배포합니다. DLAMI는 운영 오버헤드를 줄여줍니다. 따라서 컴퓨터 비전 및 생성형 AI를 위한 딥 러닝 모델을 교육하고 배포하는 핵심 작업에 집중함으로써 제품을 더 빨리 출시할 수 있습니다.”
Ajay Joshi, Cimpress Principal Software Engineer
Flip AI는 데이터 및 플랫폼에 구애받지 않고, 지표, 이벤트, 로그 및 추적을 포함한 모든 관찰성 양식을 이해하고, 예측 및 사고 근본 원인 분석을 몇 초 만에 생성하는 최초의 GenAI 기본 관찰성 플랫폼입니다.
"Flip AI에서는 기업이 최고 수준의 고객 경험에 도달할 수 있도록 지원하기 위해 DevOps용 자체 LLM을 훈련했습니다. 이 교육에는 쉽게 사용자 지정할 수 있는 고성능 설정이 필요합니다. DLAMI를 사용하면 CUDA 드라이버 또는 Pytorch 관련 최적화를 사용하지 않아도 됩니다. 정말 효과가 있습니다. GPU 사용률을 개선하면 모델을 더 효율적으로 훈련하고 추론에 걸리는 시간을 수십 밀리초 단축할 수 있습니다."
Sunil Mallya, CTO – Flip AI
Torc Robotics는 트럭 운송 분야의 글로벌 리더이자 선구자인 다임러 트럭 AG의 독립 자회사로, 레벨 4 자율 클래스 8 트럭으로 장거리 화물 운송을 혁신하는 데 주력하고 있습니다.
“AWS Deep Learning AMI는 Torc에서 업계 최고의 운전자 지원 시스템 개발을 가속화하는 데 중요한 역할을 했습니다. DLAMI를 사용하면 AWS EC2 인스턴스에 기계 학습 환경을 신속하게 설정하고 배포할 수 있습니다. 이는 연구 개발 노력에 매우 중요합니다. 사전 패키징된 NVIDIA 및 CUDA 드라이버는 기본적으로 원활하게 작동하여 운영 오버헤드를 크게 줄여주는 안정적이고 신뢰할 수 있는 플랫폼을 제공합니다. ML 인프라 관리를 간소화함으로써 AWS DLAMI를 사용하면 제품을 더 빨리 출시하는 데 리소스를 집중할 수 있습니다. AWS Deep Learning AMI의 효율성과 안정성 덕분에 자율 주행 차량 분야에서 Torc의 핵심 임무를 완수하는 데 없어서는 안 될 도구가 되었습니다.”
제이슨 폭스, Torc 시니어 엔지니어링 매니저, 개발자 플랫폼
작동 방식
AWS Deep Learning AMI(DLAMI)는 Amazon EC2 기반 딥 러닝을 가속화할 수 있는 안전한 프레임워크, 종속성 및 도구를 엄선하여 ML 실무자와 연구자에게 제공합니다. Amazon Linux 및 Ubuntu용으로 구축된 Amazon 머신 이미지 (AMI) 는 텐서플로우, PyTorch, NVIDIA CUDA 드라이버 및 라이브러리, 인텔 MKL, 엘라스틱 패브릭 어댑터 (EFA) 및 AWS OFI NCCL 플러그인으로 사전 구성되어 제공되므로 이러한 프레임워크와 도구를 대규모로 빠르게 배포하고 실행할 수 있습니다.
re:Invent 세션
AWS re:Invent 2023 - Large model training on AWS Deep Learning AMIs & PyTorch, ft.(AWS Deep Learning AMI 및 PyTorch에 대한 대규모 모델 훈련, ft.) Pinterest - AIM326