Qwen 모델, Amazon Bedrock 정식 출시

AWS는 Amazon Bedrock에 Alibaba의 Qwen 모델을 추가합니다. Amazon Bedrock은 이번 출시를 통해 완전관리형 서버리스 방식으로 Qwen3 오픈 웨이트 파운데이션 모델(FM)에 대한 액세스를 추가하여 모델 선택 범위를 계속 확대합니다. 이번 릴리스에는 Qwen3-Coder-480B-A35B-Instruct, Qwen3-Coder-30B-A3B-Instruct, Qwen3-235B-A22B-Instruct-2507, Qwen3-32B(Dense) 등 4개 모델이 포함됩니다. 이러한 모델은 전문가 혼합(MoE) 아키텍처와 밀집 아키텍처를 모두 사용하여 다양한 애플리케이션 요구 사항에 맞는 유연한 옵션을 제공합니다.

Amazon Bedrock은 통합 API를 통해 업계 최고의 FM에 대한 액세스를 제공하며 인프라를 관리할 필요가 없습니다. 여러 모델 제공업체의 모델에 액세스하고, 모델을 애플리케이션에 통합하고, 워크로드 요구 사항에 따라 사용 규모를 조정할 수 있습니다. Amazon Bedrock에서는 기본 모델을 훈련하는 데 고객 데이터를 절대 사용하지 않습니다. Qwen3 모델이 추가됨에 따라 Amazon Bedrock은 다음과 같은 사용 사례를 위한 더 많은 옵션을 제공합니다.

확장된 컨텍스트 이해를 통한 코드 생성 및 리포지토리 분석
비즈니스 자동화를 위해 여러 도구와 API를 조율하는 에이전틱 워크플로 구축
적응형 추론을 위한 하이브리드 사고 모드를 사용하여 AI 비용과 성능의 균형을 도모

Amazon Bedrock의 Qwen3 모델
이 4개의 Qwen3 모델을 이제 Amazon Bedrock에서 사용할 수 있으며, 각 모델은 서로 다른 성능 및 비용 요구 사항에 맞게 최적화되어 있습니다.

Qwen3-Coder-480B-A35B-Instruct – 이 모델은 총 파라미터가 4,800억 개이고 활성 파라미터가 350억 개인 전문가 혼합(MoE) 모델입니다. 코딩 및 에이전틱 태스크에 최적화되어 있으며 에이전틱 코딩, 브라우저 사용, 도구 사용과 같은 벤치마크에서 강력한 결과를 달성합니다. 이러한 기능은 리포지토리 규모의 코드 분석 및 다단계 워크플로 자동화에 적합합니다.
Qwen3-Coder-30B-A3B-Instruct – 총 파라미터가 300억 개이고 활성 파라미터가 30억 개인 MoE 모델입니다. 코딩 작업 및 지시 준수 시나리오에 특히 최적화된 이 모델은 여러 프로그래밍 언어에서 코드 생성, 분석 및 디버깅에 강력한 성능을 발휘합니다.
Qwen3-235B-A22B-Instruct-2507 – 총 파라미터가 2,350억 개이고 활성 파라미터가 220억개 명령어 튜닝 MoE 모델입니다. 코딩, 수학 및 일반 추론 태스크 전반에서 성능과 효율성 간의 균형을 유지하면서 경쟁력 있는 성능을 제공합니다.
Qwen3-32B(Dense) – 320억 개의 파라미터가 있는 밀집 모델입니다. 일관된 성능이 중요한 모바일 디바이스 및 엣지 컴퓨팅 배포와 같이 실시간 환경 또는 리소스가 제한된 환경에 적합합니다.

Qwen3의 아키텍처 및 특성 특징
Qwen3 모델에는 다음과 같은 몇 가지 아키텍처 및 특성 특징이 도입되었습니다.

MoE 아키텍처 대 밀집 아키텍처 – Qwen3-Coder-480B-A35B, Qwen3-Coder-30B-A3B-Instruct, Qwen3-235B-A22B-Instruct-2507과 같은 MoE 모델은 각 요청에 대해 파라미터의 일부만 활성화하여 효율적인 추론으로 고성능을 제공합니다. 밀집 Qwen3-32B는 모든 파라미터를 활성화하여 보다 일관되고 예측 가능한 성능을 제공합니다.

에이전틱 기능 – Qwen3 모델은 한 번의 모델 간접 호출로 다단계 추론과 구조화된 계획 수립을 처리할 수 있습니다. 에이전트 프레임워크에 통합되면 외부 도구 또는 API를 직접적으로 호출하는 출력을 생성할 수 있습니다. 또한 Qwen3 모델은 긴 세션에서 확장된 컨텍스트를 유지합니다. 게다가 외부 환경과의 표준화된 통신을 허용하는 도구 호출을 지원합니다.

하이브리드 사고 모드 – Qwen3은 문제 해결에 대한 하이브리드 접근 방식을 도입하여 사고 모드 및 비사고 모드를 지원합니다. 사고 모드는 단계별 추론을 통해 최종 답변을 제공합니다. 이는 심층적 사고가 필요한 복잡한 문제에 이상적입니다. 반면, 비사고 모드는 심도보다 속도가 더 중요한 덜 복잡한 태스크에 거의 즉각적으로 신속한 응답을 제공합니다. 이를 통해 개발자는 성능과 비용 간 절충을 보다 효과적으로 관리할 수 있습니다.

긴 컨텍스트 처리 – Qwen3-Coder 모델은 기본적으로 최대 256,000개의 토큰과 외삽법을 사용하는 최대 1백만 개의 토큰으로 확장된 컨텍스트 창을 지원합니다. 그러므로 모델은 전체 리포지토리, 대규모 기술 문서 또는 긴 대화 기록을 단일 태스크에서 처리할 수 있습니다.

각 모델의 사용 사례
4개의 Qwen3 모델은 서로 다른 사용 사례를 제공합니다. Qwen3-Coder-480B-A35B-Instruct는 복잡한 소프트웨어 엔지니어링 시나리오를 위해 설계되었습니다. 고급 코드 생성, 긴 컨텍스트 처리(예: 리포지토리 수준 분석), 외부 도구 통합에 적합합니다. Qwen3-Coder-30B-A3B-Instruct는 코드 완성, 리팩터링, 프로그래밍 관련 쿼리 답변과 같은 태스크에 특히 효과적입니다. 여러 도메인에 걸쳐 범용적 성능이 필요한 경우 Qwen3-235B-A22B-Instruct-2507은 MoE 아키텍처의 효율성 이점을 활용하면서 강력한 범용 추론 및 지시 준수 기능을 제공하는 균형을 제공합니다. Qwen3-32B(Dense)는 일관된 성능, 짧은 지연 시간, 비용 최적화가 중요한 시나리오에 적합합니다.

Amazon Bedrock에서 Qwen 모델 시작하기
Amazon Bedrock에서 Qwen 모델을 시작하려면 Amazon Bedrock 콘솔에서 탐색 창의 Chat/Text Playground 섹션에서 프롬프트를 사용하여 새 Qwen 모델을 빠르게 테스트할 수 있습니다.

Qwen3 모델을 내 애플리케이션에 통합하려면 모든 AWS SDK를 사용할 수 있습니다. AWS SDK에는 Amazon Bedrock InvokeModel 및 Converse API에 대한 액세스가 포함됩니다. 또한 Amazon Bedrock을 지원하는 모든 에이전틱 프레임워크에서 이러한 모델을 사용하고 Amazon Bedrock AgentCore를 사용하여 에이전트를 배포할 수 있습니다. 예를 들어 다음은 Strands Agents를 사용하여 빌드한 도구 액세스 권한이 있는 간단한 에이전트의 Python 코드입니다.

from strands import Agent
from strands_tools import calculator

agent = Agent(
    model="qwen.qwen3-coder-480b-instruct-v1:0",
    tools=[calculator]
)

agent("Tell me the square root of 42 ^ 9")

with open("function.py", 'r') as f:
    my_function_code = f.read()

agent(f"Help me optimize this Python function for better performance:\n\n{my_function_code}")

정식 출시
Qwen 모델은 현재 다음 AWS 리전에서 제공됩니다.

Qwen3-Coder-480B-A35B-Instruct는 미국 서부(오리건), 아시아 태평양(뭄바이, 도쿄) 및 유럽(런던, 스톡홀름) 리전에서 사용할 수 있습니다.
Qwen3-Coder-30B-A3B-Instruct, Qwen3-235B-A22B-Instruct-2507 및 Qwen3-32B는 미국 동부(버지니아 북부), 미국 서부(오리건), 아시아 태평양(뭄바이, 도쿄), 유럽(아일랜드, 런던, 밀라노, 스톡홀름) 및 남미(상파울루) 리전에서 사용할 수 있습니다.

향후 업데이트 여부는 전체 리전 목록을 확인하세요. 인프라 설정 또는 용량 계획 없이 즉시 테스트 및 빌드를 시작할 수 있습니다. 더 자세히 알아보려면 Amazon Bedrock 기반 Qwen 제품 페이지와 Amazon Bedrock 요금 페이지를 참조하세요.

지금 Amazon Bedrock 콘솔에서 Qwen 모델을 사용해 보시고 AWS re:Post for Amazon Bedrock 또는 평소 이용하는 AWS Support 채널을 통해 피드백을 보내주세요.

– Danilo

2025년 9월 19일 업데이트 — 모델 액세스 섹션을 제거했습니다. Amazon Bedrock은 모든 AWS 계정에 대해 자동으로 활성화하여 모든 서버리스 파운데이션 모델 및 새 모델에 대한 액세스를 간소화하므로 Bedrock 콘솔을 통해 수동으로 액세스를 활성화할 필요가 없습니다. 모델 액세스 페이지는 2025년 10월 8일에 사용 중지됩니다. 계정 관리자는 필요에 따라 모델 액세스를 제한하기 위해 AWS IAM 정책 및 서비스 제어 정책(SCP)을 사용하실 수 있습니다.

Amazon Web Services 한국 블로그

Qwen 모델, Amazon Bedrock 정식 출시

주요 링크 모음

팔로우하기

알아보기

리소스

개발자

도움말