AWS Inferentia | Amazon Web Services 한국 블로그

AWS Silicon Innovation Day – 클라우드 기반 맞춤형 칩셋 개발 정보 공유

오는 6월 21일 수요일에 무료로 참석할 수 있는 온라인 이벤트인 AWS Silicon Innovation Day에 함께해 주세요. AWS는 LinkedIn Live, 트위터, 유튜브, 트위치를 비롯한 여러 플랫폼에서 동시에 이벤트를 스트리밍할 예정입니다. AWS Silicon Innovation Day는 2023년 6월 21일 수요일 하루 동안 열리는 온라인 이벤트로, AWS Silicon에 대해 자세히 알아보고 AWS의 고유한 Amazon EC2 칩 제품을 사용하여 어떤 […]

Amazon EC2 Inf2 인스턴스 정식 출시 – 저비용 고성능 생성 AI 추론 가능

딥 러닝(Deep Learning, DL)의 혁신, 특히 대규모 언어 모델(Large Langage Model, LLM)의 급속한 성장이 업계를 강타했습니다. DL 모델은 수백만 ~ 수십억 개의 파라미터로부터 성장했으며 흥미롭고 새로운 기능을 보여주고 있습니다. DL 모델은 생성 AI (Generative AI) 또는 의료 및 생명과학 분야의 첨단 연구에 새롭게 적용되고 있습니다. AWS는 이러한 DL 워크로드를 대규모로 가속화하기 위해 칩, 서버, 데이터 […]

AWS 기반 생성 AI를 위한 새로운 도구 발표 – Amazon Bedrock, Titan 기반 모델 미리보기 및 EC2 Trn1n, Inf2 인스턴스, CodeWhisperer 정식 출시

기계 학습(Machine Learning) 패러다임 전환의 씨앗은 수십 년 동안 존재해 왔지만, 확장 가능한 컴퓨팅 용량의 가용성과 데이터의 대량 확산, 그리고 ML 기술의 급속한 발전으로 업계 전반의 고객이 비즈니스를 변화시키고 있습니다. 최근에 ChatGPT와 같은 생성 AI(Generative AI) 애플리케이션이 광범위한 관심과 상상력을 사로잡았습니다. 우리는 진정으로 ML의 광범위한 채택에서 흥미로운 변곡점에 있으며 대부분의 고객 경험과 애플리케이션이 생성 AI로 […]

Amazon Advertisement, Amazon SageMaker 및 AWS Inferentia를 사용한 광고 이미지 검증 확장 사례

Amazon Advertisement 팀은 15개 국 이상에서 웹사이트, 앱, 스트리밍 TV 콘텐츠 등 Amazon 스토어 안팎에 게재되는 광고를 통해 기업이 브랜드를 구축하고 쇼핑객과 소통할 수 있도록 지원합니다. Amazon Marketplace의 등록된 셀러, 공급 업체, 도서 공급업체, Kindle Direct Publishing(KDP) 저자, 앱 개발자 및 에이전시를 비롯한 모든 규모의 기업 또는 브랜드는 이미지, 동영상, 오디오 및 Amazon에서 판매되는 제품 […]

Amazon Alexa, 비용 효율적인 EC2 Inf1 인스턴스 기반 추론 작업 전환 사례

Amazon Alexa 팀은 대다수의 GPU 기반 기계 학습 추론 워크로드를 AWS Inferentia 기반의 Amazon Elastic Compute Cloud(EC2) Inf1 인스턴스로 마이그레이션했습니다. 그 결과 GPU 기반 인스턴스에 비해 Alexa 텍스트-음성 변환 워크로드의 전체 지연이 25% 단축되고 비용이 30% 절감되었습니다. 지연이 짧으면 Alexa 엔지니어가 보다 복잡한 알고리즘으로 혁신하고 Alexa의 전반적인 고객 경험을 개선할 수 있습니다. AWS는 클라우드에서 최저 […]

Amazon ECS에서 기계 학습 추론을 위한 EC2 Inf1 인스턴스 정식 지원

기계 학습과 딥 러닝 모델이 더 정교해짐에 따라 높은 처리량으로 빠른 예측을 제공하는 데 필요한 하드웨어 가속의 중요성이 점점 더 커지고 있습니다. 오늘부터, AWS 고객은 Amazon ECS에서 Amazon EC2 Inf1 인스턴스를 사용하여 클라우드에서 성능을 개선하고 예측 비용을 절감할 수 있습니다. 이러한 인스턴스는 지난 몇 주 동안 Amazon Elastic Kubernetes Service에서도 제공되었습니다. EC2 Inf1 인스턴스에 대한 […]

Amazon EKS, 기계 학습 추론용 EC2 Inf1 인스턴스 지원 시작

Amazon Elastic Kubernetes Service (EKS)는 기계 학습 워크로드를 위한 최고의 선택으로 빠르게 자리매김하고 있습니다. 이 솔루션은 개발자의 민첩성 및 Kubernetes의 확장성을 C5, P3 및 G4 패밀리와 같이 AWS에서 사용할 수 있는 다양한 Amazon Elastic Compute Cloud(EC2) 인스턴스 유형과 결합합니다. 모델이 더욱 정교해짐에 따라 높은 처리량으로 빠른 예측을 제공하는 데 하드웨어 가속이 점점 더 요구되고 있습니다. […]

Amazon EC2 업데이트 – 고성능 추론을 위한 Inf1 인스턴스 출시

AWS의 고객은 기계 학습에 많은 관심을 가지고 있습니다. 객체 감지, 음성 인식, 자연어 처리, 개인화 및 사기 감지를 비롯한 다양한 유형의 워크로드를 실행하고 있습니다. 대규모 프로덕션 워크로드에서 실행하는 경우 가능한 한 빠르고 비용 효율적으로 추론을 수행할 수 있어야 합니다. 고객들의 피드백에 따르면, 추론은 기계 학습 작업 비용의 최대 90%까지 차지할 수 있습니다. 고성능 추론을 위한 […]

Category: AWS Inferentia