Amazon SageMaker Canvas 기능

코드가 필요 없는 시각적 인터페이스를 사용하여 매우 정확한 ML 모델을 구축

Amazon Q Developer를 통해 채팅 기반의 ML 개발

Amazon Q Developer는 비즈니스 과제와 ML 모델 간의 격차를 해소하도록 돕습니다. 비즈니스 문제를 단계별 ML 워크플로로 전문적으로 변환하고 비기술적 언어를 사용하여 ML 용어를 설명합니다.

Amazon Q Developer는 데이터 준비부터 ML 모델 빌드, 훈련 및 배포에 이르기까지 모델 개발의 모든 단계에서 사용자를 전문적으로 안내합니다. Amazon Q Developer는 채팅 인터페이스를 사용하여 상황에 맞는 지원을 제공하고 사용자가 엔드 투 엔드 ML 워크플로를 탐색하여 프로덕션에 바로 사용할 수 있는 ML 모델을 빌드할 수 있도록 지원합니다.

Amazon Q Developer의 결정론적 파이프라인 빌더와 고급 AutoML 기술은 모델 생성의 재현성과 정확성을 지원합니다. Q Developer는 사용자에게 고급 데이터 과학 기능을 제공함으로써 모델 유틸리티에 대한 신뢰를 유지하면서 빠른 실험을 지원합니다.

Amazon Q Developer는 자연어를 사용하여 생성된 데이터 준비 파이프라인뿐만 아니라 원본 및 변환된 데이터세트와 같은 아티팩트를 유지 관리합니다. 또한 Q Developer를 사용하여 빌드한 모델을 SageMaker 모델 레지스트리에 등록할 수 있으며 추가 사용자 지정 및 통합을 위해 모델 노트북을 내보낼 수 있습니다.

데이터 준비

SageMaker Canvas를 50개 이상의 데이터 소스에 연결하거나 로컬 파일을 업로드하여 ML 모델을 훈련할 수 있습니다. 테이블, 이미지 또는 텍스트 데이터가 지원됩니다. 또한 SQL을 사용하여 쿼리를 작성하여 데이터 소스에 액세스하고 다양한 파일 형식(예: CSV, Parquet, ORC 및 JSON과 데이터베이스 테이블)에서 직접 파일을 가져올 수 있습니다.
SageMaker Canvas의 노코드 없는 인터페이스에서 기본 제공 시각화 또는 사용자 지정 시각화를 사용하여 데이터를 탐색, 시각화 및 분석할 수 있습니다. 클릭 한 번으로 데이터 품질 및 인사이트 보고서를 생성하여 데이터 세트에 누락값이나 중복 행이 없는지 확인하는 등 데이터 품질을 검증하고 이상값, 클래스 불균형, 데이터 누수와 같은 이상 징후도 감지할 수 있습니다.
SageMaker는 300여 개의 사전 구축된 PySpark 기반 데이터 변환 기능을 제공하므로 단 한 줄의 코드 작성 없이 데이터를 변환할 수 있습니다. 또는 파운데이션 모델 기반 채팅 인터페이스를 사용하여 데이터를 준비할 수도 있습니다.
SageMaker Canvas를 사용하면 데이터 준비 워크플로를 손쉽게 시작 또는 예약하여 데이터를 신속하게 처리하고 데이터 세트 전반으로 데이터 준비를 확장하며 이를 SageMaker Studio 노트북으로 내보내거나 SageMaker 파이프라인과 통합할 수 있습니다.

ML 모델 액세스 및 구축

SageMaker Canvas의 노코드 인터페이스에서 회사 데이터를 사용하여 사용자 지정 ML 모델을 자동으로 구축할 수 있습니다. 데이터를 선택 및 준비하고 예측하려는 대상을 식별하면 SageMaker Canvas가 문제 유형을 식별하고 문제 유형에 따라 수백 개의 ML 모델을 테스트(선형 회귀, 로지스틱 회귀, 딥 러닝, 시계열 예측, 그라디언트 부스팅과 같은 ML 기법 사용)한 후 데이터 세트를 기반으로 가장 정확한 예측을 수행하는 사용자 지정 모델을 생성합니다. 또는 이전에 구축한 모델을 SageMaker Canvas로 가져와서 추론에 사용할 모델을 배포할 수도 있습니다.

SageMaker Canvas는 감정 분석, 이미지의 객체 감지, 이미지의 텍스트 감지, 객체 추출을 비롯한 사용 사례에 바로 사용할 수 있는 테이블 형식, NLP 및 CV 모델에 대한 액세스를 제공합니다. 즉시 사용 가능한 모델은 모델 구축이 필요하지 않으며 Amazon Rekognition, Amazon Textract, Amazon Comprehend를 비롯한 AWS AI 서비스로 구동됩니다.

모델을 구축한 후에는 회사 데이터를 사용하여 프로덕션 환경에 배포하기 전에 모델의 성능을 평가할 수 있습니다. 모델 응답을 쉽게 비교하고 요구 사항에 가장 적합한 응답을 선택할 수 있습니다.

SageMaker Canvas는 콘텐츠 생성, 텍스트 추출 및 텍스트 요약을 위해 바로 사용할 수 있는 파운데이션 모델(FM)에 대한 액세스를 제공합니다. Claude 2, Llama-2, Amazon Titan, Jurassic-2, Command(Amazon Bedrock 기반) 등의 FM은 물론 Falcon, Flan-T5, Mistral, Dolly, MPT(SageMaker JumpStart 기반) 등의 공개적으로 사용 가능한 FM에 액세스하고 자체 데이터를 사용하여 조정할 수 있습니다.

ML 예측 생성

SageMaker Canvas는 시각적인 가정 분석을 제공하므로 모델 입력을 변경한 다음 변경 사항이 개별 예측에 미치는 영향을 이해할 수 있습니다. 전체 데이터 세트에 대해 자동화된 배치 예측을 생성할 수 있으며, 데이터 세트가 업데이트되면 ML 모델도 자동으로 업데이트됩니다. ML 모델이 업데이트된 후에는 SageMaker Canvas의 노코드 인터페이스에서 업데이트된 예측을 검토할 수 있습니다.

SageMaker Canvas 모델을 SageMaker 엔드포인트에 배포하여 실시간 추론을 지원할 수 있습니다.

Amazon QuickSight로 모델 예측을 공유하여 기존 비즈니스 인텔리전스와 예측 데이터를 동일한 대화형 시각 자료에 결합하는 대시보드를 구축할 수 있습니다. 또한 QuickSight에서 직접 SageMaker Canvas 모델을 공유하고 통합하여 QuickSight 대시보드 내에서 새 데이터에 대해 매우 정확한 예측을 생성할 수 있습니다.

MLOps 활용

SageMaker Canvas에서 만든 ML 모델을 클릭 한 번으로 SageMaker Model Registry에 등록하여 모델을 기존 모델 배포 CI/CD 프로세스에 통합할 수 있습니다.

SageMaker Studio를 사용하는 데이터 사이언티스트와 SageMaker Canvas 모델을 공유할 수 있습니다. 그러면 데이터 사이언티스트가 업데이트된 모델을 검토, 업데이트 및 공유하거나 추론을 위해 모델을 배포할 수 있습니다.