Amazon Web Services 한국 블로그
Amazon Bedrock, Stability AI 차세대 이미지 생성 모델 제공
오늘부터 Amazon Bedrock에서 Stability AI의 세 가지 새로운 텍스트 투 이미지 모델인 Stable Image Ultra, Stable Diffusion 3 Large, Stable Image Core를 사용할 수 있습니다. 이들 모델은 다중 주제 프롬프트, 이미지 품질 및 타이포그래피에서 성능을 크게 개선하며 마케팅, 광고, 미디어, 엔터테인먼트, 소매 등 다양한 사용 사례에 맞는 고품질 비주얼을 빠르게 생성하는 데 사용할 수 있습니다.
이들 모델은 뛰어난 디테일, 색상, 조명을 자랑하는 놀라운 포토리얼리즘으로 이미지 제작에 탁월하며, 사실적인 손과 얼굴 렌더링과 같은 일반적인 문제를 해결합니다. 모델의 고급 프롬프트 이해를 통해 공간 추론, 구성 및 스타일과 관련된 복잡한 지침을 해석할 수 있습니다.
Amazon Bedrock에서 사용할 수 있는 다음 세 가지 새로운 Stability AI 모델은 다양한 사용 사례를 다룹니다.
Stable Image Ultra – 최고 품질의 사실적인 결과물을 생성하므로 전문 인쇄 미디어 및 대형 포맷 용도에 적합합니다. Stable Image Ultra는 뛰어난 디테일과 사실감을 렌더링하는 데 탁월합니다.
Stable Diffusion 3 Large – 생성 속도와 출력 품질 간의 균형을 유지합니다. 웹 사이트, 뉴스레터, 마케팅 자료 등 대량의 고품질 디지털 자산을 제작하는 데 이상적입니다.
Stable Image Core – 빠르고 경제적인 이미지 생성에 최적화되어 아이디어 구상 중 콘셉트를 빠르게 반복하는 데 적합합니다.
다음 표에 모델의 주요 기능이 요약되어 있습니다.
기능 | Stable Image Ultra | Stable Diffusion 3 Large | Stable Image Core |
---|---|---|---|
파라미터: | 160억 | 80억 | 26억 |
입력 | 텍스트 | 텍스트 또는 이미지 | 텍스트 |
타이포그래피 | 대형 디스플레이에 맞춤화됨 |
대형 디스플레이에 맞춤화됨 |
다양한 크기와 용도에 걸친 다용도성 및 가독성 |
시각적 미학 |
사실적인 이미지 출력 |
디테일에 세심한 주의를 기울여 매우 사실적임 |
좋은 렌더링, 디테일 지향적이지 않음 |
Stable Diffusion XL(SDXL)과 비교한 Stable Image Ultra와 Stable Diffusion 3 Large의 주요 개선 사항 중 하나는 생성되는 이미지의 텍스트 품질입니다. 이미지와 텍스트에 대해 별도의 두 가지 가중치 세트를 구현하지만 두 양식 간의 정보 흐름을 가능하게 하는 혁신적인 Diffusion Transformer 아키텍처 덕분에 철자 및 타이포그래피 오류가 더 적습니다.
다음은 이들 모델로 생성된 몇 가지 이미지입니다.
Stable Image Ultra – 프롬프트: 사진, 사실적, 들판에 앉아 하늘을 나는 연을 바라보는 한 여성, 폭풍이 몰아치는 하늘, 매우 세부적인 묘사, 콘셉트 아트, 복잡하고 전문적인 구성.
Stable Diffusion 3 Large – 프롬프트: 만화풍 일러스트, 가로등 아래 서 있는 남자 형사, 느와르 도시, 트렌치코트 착용, 중절모, 어둡고 비 오는 날씨, 네온사인, 젖은 포장도로에 반사된 불빛, 세부적인 묘사, 분위기 있는 조명.
Stable Image Core – 프롬프트: 흰색과 주황색 운동화의 전문적인 3D 렌더링, 중앙에 떠 있음, 공중 정지, 부유, 고품질, 사실적.
Amazon Bedrock의 새로운 Stability AI 모델 사용 사례
텍스트 투 이미지 모델은 다양한 산업 분야의 비즈니스에 혁신적인 잠재력을 제공하며 마케팅 및 광고 부서의 크리에이티브 워크플로를 크게 간소화하여 캠페인, 소셜 미디어 콘텐츠 및 제품 모형을 위한 고품질 비주얼을 빠르게 생성할 수 있습니다. 크리에이티브 프로세스를 가속화함으로써 기업은 시장 트렌드에 더 빠르게 대응하고 새로운 이니셔티브의 출시 시간을 단축할 수 있습니다. 또한 이러한 모델은 브레인스토밍 세션을 개선하여 더 많은 혁신을 촉발할 수 있는 콘셉트를 즉시 시각적으로 표현할 수 있습니다.
전자 상거래 비즈니스의 경우 AI 생성 이미지를 사용하여 다양한 제품 쇼케이스와 맞춤형 마케팅 자료를 대규모로 생성할 수 있습니다. 사용자 경험과 인터페이스 디자인 영역에서 이러한 도구는 와이어프레임과 프로토타입을 빠르게 생성하여 설계 반복 프로세스를 가속화할 수 있습니다. 텍스트 투 이미지 모델을 채택하면 상당한 비용 절감, 생산성 향상, 다양한 비즈니스 기능 전반의 시각적 커뮤니케이션에서 경쟁 우위 확보 등의 이점을 얻을 수 있습니다.
다음은 다양한 산업 전반의 몇 가지 사용 사례입니다.
광고 및 마케팅
- 럭셔리 브랜드 광고 및 사실적인 제품 쇼케이스를 위한 Stable Image Ultra
- 고품질 제품 마케팅 이미지 및 인쇄 캠페인에 적합한 Stable Diffusion 3 Large
- 소셜 미디어 광고를 위한 시각적 콘셉트의 신속한 A/B 테스트에 Stable Image Core 사용
전자 상거래
- 고급 제품 커스터마이징 및 주문 제작 제품을 위한 Stable Image Ultra
- 전자 상거래 사이트 전반의 대부분의 제품 비주얼에 적합한 Stable Diffusion 3 Large
- 제품 이미지를 빠르게 생성하고 목록을 최신 상태로 유지하는 Stable Image Core
미디어 및 엔터테인먼트
- 매우 사실적인 키 아트, 마케팅 자료 및 게임 비주얼을 위한 Stable Image Ultra
- 환경 텍스처, 캐릭터 아트 및 게임 내 자산을 위한 Stable Diffusion 3 Large
- 빠른 프로토타이핑 및 콘셉트 아트 탐색을 위한 Stable Image Core
이제 AWS Management Console을 사용한 다음 AWS Command Line Interface(AWS CLI)와 AWS SDK를 사용하여 이러한 새로운 모델이 실제로 작동하는 모습을 살펴보겠습니다.
Amazon Bedrock 콘솔에서 새 Stability AI 모델 사용
Amazon Bedrock 콘솔의 탐색 창에서 모델 액세스를 선택하여 Stability AI 섹션에서 세 가지 새 모델에 대한 액세스를 활성화합니다.
이제 액세스할 수 있으므로 탐색 창의 플레이그라운드 섹션에서 이미지를 선택합니다. 모델로 Stability AI와 Stable Image Ultra를 선택합니다.
프롬프트로 다음과 같이 입력합니다.
A stylized picture of a cute old steampunk robot with in its hands a sign written in chalk that says "Stable Image Ultra in Amazon Bedrock".
다른 모든 옵션은 기본값으로 두고 실행을 선택합니다. 몇 초 후 제가 요청한 결과가 나옵니다. 다음 이미지입니다.
AWS CLI로 Stable Image Ultra 사용
콘솔 이미지 플레이그라운드에 있는 동안 플레이그라운드 창 모서리에 있는 작은 점 세 개를 선택한 다음 API 요청 보기를 선택합니다. 이렇게 하면 방금 콘솔에서 수행한 것에 해당하는 AWS Command Line Interface(AWS CLI) 명령을 볼 수 있습니다:
Stable Image Core 또는 Stable Diffusion 3 Large를 사용하려면 모델 ID를 바꿉니다.
이전 명령은 텍스트 파일의 JSON 객체 안에 있는 이미지를 Base64 형식으로 출력합니다.
단일 명령으로 이미지를 가져오려면 출력 JSON 파일을 표준 출력에 작성하고 jq 도구를 사용하여 인코딩된 이미지를 추출하여 즉시 디코딩할 수 있도록 합니다. 출력은 img.png
파일에 기록됩니다. 전체 명령은 다음과 같습니다.
AWS SDK로 Stable Image Ultra 사용
AWS SDK for Python(Boto3)으로 Stable Image Ultra를 사용하는 방법은 다음과 같습니다. 이 간단한 애플리케이션은 텍스트 투 이미지 프롬프트를 대화형으로 요청한 다음 Amazon Bedrock을 직접적으로 호출하여 이미지를 생성합니다.
import base64
import boto3
import json
import os
MODEL_ID = "stability.stable-image-ultra-v1:0"
bedrock_runtime = boto3.client("bedrock-runtime", region_name="us-west-2")
print("Enter a prompt for the text-to-image model:")
prompt = input()
body = {
"prompt": prompt,
"mode": "text-to-image"
}
response = bedrock_runtime.invoke_model(modelId=MODEL_ID, body=json.dumps(body))
model_response = json.loads(response["body"].read())
base64_image_data = model_response["images"][0]
i, output_dir = 1, "output"
if not os.path.exists(output_dir):
os.makedirs(output_dir)
while os.path.exists(os.path.join(output_dir, f"img_{i}.png")):
i += 1
image_data = base64.b64decode(base64_image_data)
image_path = os.path.join(output_dir, f"img_{i}.png")
with open(image_path, "wb") as file:
file.write(image_data)
print(f"The generated image has been saved to {image_path}")
없는 경우 새로 생성되는 output
디렉터리에 결과 이미지가 작성됩니다. 기존 파일을 덮어쓰지 않기 위해 코드는 기존 파일을 검사하여 img_<number>.png
형식의 사용 가능한 첫 번째 파일 이름을 찾습니다.
Stable Diffusion 모델을 사용하는 방법에 대한 더 많은 예제는 AWS Documentation의 Code Library에서 확인할 수 있습니다
고객의 평가
Stability AI의 Global Alliance Director인 Ken Hoge에게서 Stable Diffusion 모델이 텍스트 투 이미지에서 비디오, 오디오, 3D로 업계를 어떻게 재편하고 있는지, 그리고 Amazon Bedrock이 안전하고 확장 가능한 올인원 솔루션으로 어떻게 고객의 역량을 강화하는지 알아보세요.
Stride Learning의 Product Owner인 Nicolette Han과 함께 생동하는 독서의 세계를 탐험하세요. Amazon Bedrock과 AWS의 지원을 바탕으로 Stride Learning의 Legend Library는 AI를 사용하여 어린이가 문학을 접하고 이해하는 방식을 변화시키고 있으며, 동화를 위한 놀랍고 안전한 삽화를 만들고 있습니다.
알아야 할 사항
Amazon Bedrock의 새로운 Stability AI 모델인 Stable Image Ultra, Stable Diffusion 3 Large, Stable Image Core가 오늘 미국 서부(오리건) AWS 리전에서 출시되었습니다. 이번 출시를 통해 Amazon Bedrock은 창의성을 높이고 콘텐츠 생성 워크플로를 가속화하는 광범위한 솔루션을 제공합니다. 사용 사례에 대한 비용은 Amazon Bedrock 요금 페이지를 참조하세요.
Stable Diffusion 3에 대한 자세한 내용은 기반 기술을 자세히 설명하는 연구 논문에서 찾을 수 있습니다.
시작하려면 Amazon Bedrock User Guide의 Stability AI 모델 섹션을 참조하세요. 다른 사람들이 각자의 솔루션에서 생성형 AI를 어떻게 사용하고 있는지 알아보고 심층적인 기술 콘텐츠로 학습하려면 community.aws를 방문하세요.
– Danilo