Amazon Web Services 한국 블로그
Amazon Nova 모델 출시: 프론티어 인텔리전스 및 업계 최고의 가격 대비 성능 제공
오늘은 최고의 인텔리전스와 업계 최고의 가격 대비 성능을 제공하는 차세대 최첨단 파운데이션 모델(FM)인 Amazon Nova를 발표하게 되어 매우 기쁩니다. 이 모델은 Amazon Bedrock에서만 독점적으로 사용할 수 있습니다.
Amazon Nova를 사용하여 거의 모든 생성형 AI 작업의 비용과 지연 시간을 줄일 수 있습니다. Amazon Nova를 기반으로 엔터프라이즈 워크로드에 최적화된 다양한 인텔리전스 클래스에서 복잡한 문서 및 동영상을 분석하고, 차트와 다이어그램을 이해하고, 매력적인 동영상 콘텐츠를 생성하고, 정교한 AI 에이전트를 빌드할 수 있습니다.
이미지와 텍스트를 처리해야 하는 문서 처리 애플리케이션을 개발하든, 대규모 마케팅 콘텐츠를 생성하든, 시각적 정보를 이해하고 이에 따라 조치를 취할 수 있는 AI 어시스턴트를 빌드하든, Amazon Nova는 이해와 창의적인 콘텐츠 생성이라는 두 가지 범주의 모델을 통해 필요한 인텔리전스와 유연성을 제공합니다.
Amazon Nova 이해 모델은 텍스트, 이미지 또는 동영상 입력을 받아들여 텍스트 출력을 생성합니다. Amazon 크리에이티브 콘텐츠 생성 모델은 텍스트 및 이미지 입력을 받아들여 이미지 또는 동영상 출력을 생성합니다.
모델 이해: 텍스트 및 시각적 인텔리전스
Amazon Nova 모델에는 다양한 요구 사항을 충족하도록 설계된 세 가지 이해 모델(네 번째 모델도 곧 제공될 예정)이 포함됩니다.
Amazon Nova Micro – Amazon Nova 모델 제품군 중 지연 시간이 가장 짧은 응답을 매우 저렴한 비용으로 제공하는 텍스트 전용 모델입니다. 컨텍스트 길이가 128K 토큰이고 속도와 비용에 최적화된 Amazon Nova Micro는 텍스트 요약, 번역, 콘텐츠 분류, 대화형 채팅 및 브레인스토밍, 간단한 수학적 추론 및 코딩과 같은 작업에서 탁월한 성능을 발휘합니다. 또한 Amazon Nova Micro는 정확도를 높이기 위해 미세 조정 및 모델 증류를 사용하여 독점 데이터에 대한 사용자 지정을 지원합니다.
Amazon Nova Lite – 이미지, 동영상 및 텍스트 입력을 매우 빠르게 처리하여 텍스트 출력을 생성하는 매우 저렴한 멀티모달 모델입니다. Amazon Nova Lite는 실시간 고객 상호 작용, 문서 분석 및 시각적 질문-답변 작업을 높은 정확도로 처리할 수 있습니다. 이 모델은 최대 300K 토큰 길이의 입력을 처리하고 단일 요청으로 여러 이미지 또는 최대 30분 분량의 동영상을 분석할 수 있습니다. 또한 Amazon Nova Lite는 텍스트 및 멀티모달 미세 조정을 지원하며 모델 증류와 같은 기술을 사용하여 사용 사례에 맞는 최상의 품질과 비용을 제공하도록 최적화할 수 있습니다.
Amazon Nova Pro – 다양한 작업에 대해 정확성, 속도 및 비용을 최적으로 조합한 고성능 멀티모달 모델입니다. Amazon Nova Pro는 최대 300K 입력 토큰을 처리할 수 있으며 복잡한 워크플로를 완료하기 위해 API와 도구를 직접 호출해야 하는 멀티모달 인텔리전스 및 에이전트 워크플로의 새로운 표준을 제시합니다. 시각적 질문 답변(TextVQA) 및 동영상 이해(VATEX)를 비롯한 주요 벤치마크에서 최첨단 성능을 제공합니다. Amazon Nova Pro는 시각적 정보와 텍스트 정보를 모두 처리하는 강력한 기능을 보여주며 재무 문서 분석에도 탁월합니다. 300K 토큰의 입력 컨텍스트를 사용하여 15,000줄 이상의 코드가 포함된 코드베이스를 처리할 수 있습니다. 또한 Amazon Nova Pro는 Amazon Nova Micro 및 Lite의 맞춤형 변형을 증류하는 교사 모델로도 사용됩니다.
Amazon Nova Premier – 복잡한 추론 작업을 수행하고 사용자 지정 모델을 분석하기 위한 최고의 교사로 사용할 수 있는 가장 유능한 멀티모달 모델입니다. Amazon Nova Premier는 아직 훈련 중이며 2025년 초 출시를 목표로 하고 있습니다.
Amazon Nova 이해 모델은 검색 증강 생성(RAG), 함수 직접 호출 및 에이전트 애플리케이션에서 탁월한 성능을 발휘합니다. 이러한 성능은 포괄적인 RAG 벤치마크(CRAG) 평가, 버클리 함수 직접 호출 리더보드(BFCL), VisualWebBench 및 Mind2Web의 Amazon Nova 모델 점수에 반영됩니다.
Amazon Nova가 기업에 특히 강력한 이유는 사용자 지정 기능 때문입니다. 정장을 맞춤 제작하는 과정으로 생각하면 됩니다. 고품질 파운데이션으로 시작하여 정확한 요구 사항에 맞게 조정하는 과정입니다. 텍스트, 이미지 및 동영상을 사용하여 모델을 미세 조정하여 업계의 용어를 이해하고 브랜드 톤에 맞게 조정하고 특정 사용 사례에 맞게 최적화할 수 있습니다. 예를 들어 법률 회사는 법률 용어와 문서 구조를 더 적절히 이해하도록 Amazon Nova를 사용자 지정할 수 있습니다.
Amazon Nova 제품 페이지에서 이러한 모델의 최신 벤치마크 점수를 확인할 수 있습니다.
창의적인 콘텐츠 생성: 컨셉 구현
Amazon Nova 모델에는 두 가지 크리에이티브 콘텐츠 생성 모델도 포함됩니다.
Amazon Nova Canvas – 복원, 향상, 배경 제거와 같은 다양한 편집 기능을 비롯해 스타일 및 콘텐츠를 정밀하게 제어하여 스튜디오 품질의 이미지를 생성하는 최첨단 이미지 생성 모델입니다. Amazon Nova Canvas는 질문에 대한 답변을 통해 텍스트-이미지 충실도 평가(TIFA), ImageReward 등의 주요 벤치마크 및 사람 평가에서 탁월한 성능을 발휘합니다.
Amazon Nova Reel – 최첨단 동영상 생성 모델입니다. Amazon Nova Reel을 사용하면 텍스트 프롬프트 및 이미지를 통해 짧은 동영상을 생성하고, 시각적 스타일과 속도를 제어하고, 마케팅, 광고 및 엔터테인먼트를 위한 전문가 수준의 동영상 콘텐츠를 생성할 수 있습니다. Amazon Nova Reel은 동영상 품질 및 동영상 일관성에 대한 사람의 평가에서 기존 모델을 능가합니다.
모든 Amazon Nova 모델에는 안전 제어 기능이 내장되어 있으며 크리에이티브 콘텐츠 생성 모델에는 책임 있는 AI 사용을 장려하는 워터마킹 기능이 포함되어 있습니다.
몇 가지 사용 사례에서 이러한 모델이 실제로 어떻게 작동하는지 살펴보겠습니다.
문서 분석을 위해 Amazon Nova Pro 사용
문서 분석의 기능을 시연하기 위해 AWS 설명서에서 생성형 AI 서비스 선택 의사 결정 가이드를 PDF 형식으로 다운로드했습니다.
먼저 Amazon Bedrock 콘솔 탐색 창에서 모델 액세스를 선택하고 새로운 Amazon Nova 모델에 대한 액세스를 요청합니다. 그런 다음 탐색 창의 플레이그라운드 섹션에서 채팅/텍스트를 선택하고 Amazon Nova Pro 모델을 선택합니다. 채팅에서 저는 의사 결정 가이드 PDF를 업로드하고 다음과 같이 질문하겠습니다.
이 문서의 요약을 100단어로 작성해 줘. 그런 다음 의사 결정 트리를 생성해 줘.
출력으로, 저의 지침에 따라 문서를 읽기 전에 미리 볼 수 있는 구조화된 의사 결정 트리를 생성합니다.
동영상 분석을 위해 Amazon Nova Pro 사용
동영상 분석을 설명하기 위해 두 개의 짧은 클립을 결합한 동영상을 준비했습니다(자세한 내용은 다음 섹션 참조).