Amazon Web Services 한국 블로그
Amazon Nova 2 Lite 출시: 빠르고 비용 효율적인 추론 모델
오늘, 일상적인 워크로드를 위한 빠르고 비용 효율적인 추론 모델인 Amazon Nova 2 Lite를 출시합니다. Amazon Bedrock에서 사용할 수 있는 이 모델은 업계 최고의 가격 대비 성능을 제공하며 기업과 개발자가 강력하고 안정적이며 효율적인 에이전트 AI 애플리케이션을 구축할 수 있도록 지원합니다. 해당 분야를 진정으로 이해하는 AI가 필요한 조직이라면 Nova 2 Lite는 Nova Forge와 함께 사용하여 자체적인 프런티어 인텔리전스를 구축할 수 있는 최고의 모델입니다.
Nova 2 Lite는 응답을 제공하거나 조치를 취하기 전에 단계별 추론 및 작업 분해를 포함한 확장된 사고를 지원합니다. 확장된 사고는 빠르고 비용 최적화된 응답을 제공하기 위해 기본적으로 비활성화되어 있지만, 심층적인 분석이 필요한 경우 활성화하여 세 가지 사고 예산 수준(낮음, 중간, 높음) 중에서 선택하여 속도, 인텔리전스 및 비용 상충 관계를 제어할 수 있습니다.
Nova 2 Lite는 텍스트, 이미지, 비디오, 문서를 입력으로 지원하고 100만 토큰의 컨텍스트 창을 제공하여 확장된 추론과 더욱 풍부한 컨텍스트 내 학습을 가능하게 합니다. 또한 Nova 2 Lite는 특정 비즈니스 요구 사항에 맞게 사용자 지정할 수 있습니다. 이 모델에는 웹 그라운딩과 코드 인터프리터라는 두 가지 기본 제공 도구에 대한 액세스도 포함되어 있습니다. 웹 그라운딩은 인용을 통해 공개적으로 사용 가능한 정보를 검색하고, 코드 인터프리터는 모델이 동일한 워크플로 내에서 코드를 실행하고 평가할 수 있도록 합니다.
Amazon Nova 2 Lite는 다양한 평가 벤치마크에서 뛰어난 성능을 보여줍니다. 이 모델은 지시 수행, 수학, 시간 추론을 통한 비디오 이해 등 여러 영역에서 핵심 지능을 발휘합니다. 에이전트 워크플로의 경우, Nova 2 Lite는 작업 자동화를 위한 안정적인 함수 직접 호출 및 정밀한 UI 상호작용 기능을 제공합니다. 또한 이 모델은 강력한 코드 생성 및 실질적인 소프트웨어 엔지니어링 문제 해결 능력을 보여줍니다.
회사의 요구 사항을 충족하도록 구축된 Nova 2 Lite
Nova 2 Lite는 광범위한 일상적인 AI 작업에 활용할 수 있으며, 가격, 성능, 속도의 최적의 조합을 제공합니다. 초기 고객들은 고객 서비스 챗봇, 문서 처리, 비즈니스 프로세스 자동화에 Nova 2 Lite를 사용하고 있습니다.
Nova 2 Lite는 다양한 사용 사례에서 워크로드를 지원하는 데 도움이 될 수 있습니다.
- 비즈니스 애플리케이션 – 비즈니스 프로세스 워크플로, 지능형 문서 처리(IDP), 고객 지원, 웹 검색을 자동화하여 생산성과 성과를 향상시킵니다.
- 소프트웨어 엔지니어링 – 코드 생성, 디버깅, 리팩토링, 시스템 마이그레이션을 통해 개발 속도를 높이고 효율성을 높입니다.
- 비즈니스 인텔리전스 및 연구 – 장기 추론 및 웹 기반 분석을 통해 내부 및 외부 소스를 분석하여 인사이트를 도출하고 정보에 기반한 의사 결정을 내립니다.
구체적인 요구 사항에 따라 Amazon Bedrock 및 Amazon SageMaker AI에서 Nova 2 Lite를 사용자 지정할 수도 있습니다.
Amazon Nova 2 Lite 사용
Amazon Bedrock 콘솔에서 채팅/텍스트 플레이그라운드를 사용하여 프롬프트를 통해 새 모델을 빠르게 테스트할 수 있습니다. 모델을 애플리케이션에 통합하기 위해 Amazon Bedrock InvokeModel 및 Converse API와 함께 AWS SDK를 사용할 수 있습니다. 다음은 AWS SDK for Python(Boto3)을 사용한 샘플 간접 호출입니다.
import boto3
AWS_REGION="us-east-1"
MODEL_ID="global.amazon.nova-2-lite-v1:0"
MAX_REASONING_EFFORT="low" # low, medium, high
bedrock_runtime = boto3.client("bedrock-runtime", region_name=AWS_REGION)
# Enable extended thinking for complex problem-solving
response = bedrock_runtime.converse(
modelId=MODEL_ID,
messages=[{
"role": "user",
"content": [{"text": "I need to optimize a logistics network with 5 warehouses, 12 distribution centers, and 200 retail locations. The goal is to minimize total transportation costs while ensuring no location is more than 50 miles from a distribution center. What approach should I take?"}]
}],
additionalModelRequestFields={
"reasoningConfig": {
"type": "enabled", # enabled, disabled (default)
"maxReasoningEffort": MAX_REASONING_EFFORT
}
}
)
# The response will contain reasoning blocks followed by the final answer
for block in response["output"]["message"]["content"]:
if "reasoningContent" in block:
reasoning_text = block["reasoningContent"]["reasoningText"]["text"]
print(f"Nova's thinking process:\n{reasoning_text}\n")
elif "text" in block:
print(f"Final recommendation:\n{block['text']}")
Amazon Bedrock을 지원하는 에이전트 프레임워크와 함께 새 모델을 사용하고 Amazon Bedrock AgentCore를 사용하여 에이전트를 배포할 수도 있습니다. 이렇게 하면 다양한 작업을 위한 에이전트를 구축할 수 있습니다. Strands Agents SDK를 사용하는 대화형 다중 에이전트 시스템의 샘플 코드는 다음과 같습니다. 에이전트는 파일 읽기 및 쓰기 권한과 쉘 명령 실행 기능을 비롯한 여러 도구에 액세스할 수 있습니다.
from strands import Agent
from strands.models import BedrockModel
from strands_tools import calculator, editor, file_read, file_write, shell, http_request, graph, swarm, use_agent, think
AWS_REGION="us-east-1"
MODEL_ID="global.amazon.nova-2-lite-v1:0"
MAX_REASONING_EFFORT="low" # low, medium, high
SYSTEM_PROMPT = (
"You are a helpful assistant. "
"Follow the instructions from the user. "
"To help you with your tasks, you can dynamically create specialized agents and orchestrate complex workflows."
)
bedrock_model = BedrockModel(
region_name=AWS_REGION,
model_id=MODEL_ID,
additional_request_fields={
"reasoningConfig": {
"type": "enabled", # enabled, disabled (default)
"maxReasoningEffort": MAX_REASONING_EFFORT
}
}
)
agent = Agent(
model=bedrock_model,
system_prompt=SYSTEM_PROMPT,
tools=[calculator, editor, file_read, file_write, shell, http_request, graph, swarm, use_agent, think]
)
while True:
try:
prompt = input("\nEnter your question (or 'quit' to exit): ").strip()
if prompt.lower() in ['quit', 'exit', 'q']:
break
if len(prompt) > 0:
agent(prompt)
except KeyboardInterrupt:
break
except EOFError:
break
print("\nGoodbye!")
알아야 할 사항
이제 Amazon Bedrock에서 여러 리전의 글로벌 리전 간 추론을 통해 Amazon Nova 2 Lite를 사용할 수 있습니다. 리전별 이용 가능 여부 및 향후 로드맵은 리전별 AWS 기능을 참조하세요.
Nova 2 Lite에는 책임 있는 AI 사용을 장려하는 기본 안전 제어 기능과 다양한 애플리케이션에서 적절한 출력을 유지하는 데 도움이 되는 콘텐츠 조정 기능이 포함되어 있습니다.
비용을 이해하려면 Amazon Bedrock 요금을 참조하세요. 자세한 내용은 Amazon Nova 사용 설명서를 참조하세요.
지금 Nova 2 Lite로 구축해 보세요. 새 모델을 시험해 보려면 Amazon Nova 대화형 웹사이트를 방문하세요. Amazon Bedrock 콘솔에서 모델을 시험해보고 AWS re:Post에서 피드백을 공유해 주세요.
– Danilo
