Amazon Web Services 한국 블로그

Category: Amazon SageMaker

Amazon SageMaker Feature Store – 기계 학습 피처 저장, 검색 및 공유 기능 제공

오늘 Amazon SageMaker의 새로운 기능인 Amazon SageMaker Feature Store를 소개하게 되어 정말 기쁩니다. 이 기능을 사용하면 데이터 사이언티스트와 기계 학습 엔지니어는 훈련 및 예측 워크플로에서 사용되는 준비된 데이터를 쉽고 안전하게 저장, 검색 및 공유할 수 있습니다. 기계 학습(ML) 모델을 훈련하는 올바른 알고리즘 선택의 중요성 때문에 숙련된 실무자는 고품질 데이터 제공의 중요성을 잘 알고 있습니다. 데이터 […]

Read More

Amazon SageMaker Data Wrangler – 기계 학습을 위해 데이터를 준비하는 시각적 인터페이스 제공

오늘 Amazon SageMaker의 새로운 기능인 Amazon SageMaker Data Wrangler를 소개하게 되어 정말 기쁩니다. 이 기능을 사용하면 데이터 사이언티스트와 엔지니어가 시각적 인터페이스를 사용하여 기계 학습(ML) 애플리케이션을 위한 데이터를 쉽고 빠르게 준비할 수 있습니다. 데이터 사이언티스트와 ML 엔지니어 그룹에 실제로 ML 문제를 연구하는 데 얼마나 많은 시간을 할애하는지 물어볼 때마다 이들은 단체로 한숨을 쉰 후에 “운이 좋으면 […]

Read More

Amazon SageMaker JumpStart로 사전 구축된 모델과 기계 학습 솔루션 액세스 단순화

오늘 Amazon SageMaker JumpStart 출시 소식을 발표할 수 있게 되어 무척 기쁩니다. 이는 Amazon SageMaker의 한 기능으로, 클릭 한 번으로 인기 모델 컬렉션(“모델 동물원”으로도 알려진)과 공통적인 사용 사례를 해결하는 전체적 솔루션에 액세스하여 기계 학습 워크플로를 가속화할 수 있습니다. 최근 몇 년 동안, 기계 학습(ML)은 업무 프로세스를 개선하고 자동화하는 데 중요한 기술이라는 것이 입증되었습니다. 실제로 과거 […]

Read More

Amazon SageMaker Studio, 서울 리전 출시

Amazon SageMaker Studio는 기계 학습 모델을 쉽게 빌드, 훈련, 디버깅, 배포 및 모니터링할 수 있게 해주는 기계 학습을 위한 웹 기반의 통합 개발 환경(IDE)입니다. Studio는 생산성을 높이는 동시에 실험에서 생산에 이르기까지 모델을 적용하는 데 필요한 모든 도구를 제공합니다. 단일 통합 시각적 인터페이스에서 고객은 다음 작업을 수행할 수 있습니다. 작년 AWS re:Invent에서 출시 된 후, 꾸준한 […]

Read More

Amazon SageMaker, 기계 학습 분야를 선도하다! GPU 인스턴스 요금 최대 18% 인하 발표

Amazon Web Services(AWS)는 2006년 이래로 수백만 개의 고객사가 IT 워크로드를 구축하고 관리하는 작업을 도왔습니다. 스타트업에서 대기업, 공공 기관에 이르기까지 모든 규모의 기관이 AWS 클라우드 컴퓨팅 서비스에서 지금까지 경험해보지 못한 수준의 보안, 회복성, 확장성을 얻고 있습니다. 이들은 나날이 실험, 혁신, 프로덕션 배포에 소요되는 시간을 단축하고, 그 어느 때보다도 큰 비용을 절감하고 있습니다. 이에 따라 비즈니스 기회를 […]

Read More

Amazon SageMaker와 Deep Graph Library를 이용한 이종 네트워크에서 사기 탐지하기

이상 행위자나 의심스러운 계정으로 인해서 매년 수 십조 원의 손실이 발생하고 있습니다. 시스템에서 악의적인 행동들이 일어나는 것을 방지하기 위해서 많은 기업들은 규칙 기반 필터를 적용하고 있지만, 이 필터들은 다루기 힘들기도 하고 악의적인 행동 전체를 잡아내지 못합니다. 하지만 그래프 기술과 같은 솔루션들은 이상 행위자나 악의적인 사용자를 탐지하는데 아주 적합합니다. 이상 행위자는 규칙 기반의 시스템이나 단순한 특징 […]

Read More

Amazon SageMaker와 Apache Airflow을 통한  기계학습 워크플로 구축하기

기계 학습(Machine Learning, ML) 워크플로는 데이터 수집 및 변환을 가능하게 함으로써 ML 작업 순서를 오케스트레이션하고 자동화합니다. 그런 다음 ML 모델을 학습, 테스트 및 평가하여 결과를 얻습니다. 예를 들어 Amazon SageMaker에서 모델을 학습하고 모델을 프로덕션 환경에 배포하여 추론하기 전에 Amazon Athena에서 쿼리를 수행하거나 AWS Glue에서 데이터를 통합하고 준비 할 수 있습니다. 이러한 작업을 자동화하고 다양한 서비스에서 […]

Read More

Amazon SageMaker Ground Truth 기반 3D 포인트 클라우드 레이블 지정 기능 출시 (서울 리전 포함)

AWS re:Invent 2018에서 공개된 Amazon Sagemaker Ground Truth는 기계 학습 데이터 세트에 간편하게 주석을 기록해주는 Amazon SageMaker의 기능입니다. AWS 고객은 내장 워크플로로 효율적이고 정확하게 이미지 및 텍스트 데이터에 레이블을 지정하거나 사용자 지정 워크플로로 모든 유형의 데이터에 레이블을 지정할 수 있습니다. 데이터 샘플이 인력(개인, 타사 또는 MTurk)에게 자동으로 배포되고 주석이 Amazon Simple Storage Service(S3)에 저장됩니다. 또는 […]

Read More

Amazon.Science – AWS의 SK텔레콤의 ‘한국어 자연어 처리기’ 개발 지원기

이 글은 Amazon Science의  Amazon scientists help SK telecom create Korean-based natural language processor (글쓴이 – Douglas Gantenbein)를 한국어로 번역했습니다. 한국어는 전세계에서 8천만 명이 사용하는 주요한 언어입니다. 오래전 만주 지역에서 기원한 것으로 여기지는 긴 역사에도 불구하고, 한국어는 (영어가 프랑스어나 라틴어와 가지는 것과 같은) 다른 언어와의 뚜렷한 연관성이 없는 “고립어”라고 불립니다. 그러나, 한국어는 컴퓨터가 인간의 언어를 […]

Read More

Amazon SageMaker의 MXNet 추론 컨테이너를 활용한 KoGPT2 모델 배포하기

기계 학습 기반 자연어 처리를 위한 다양한 학습 모델이 나오고 있는 가운데, 다국어로 학습된 BERT의 한국어 성능 한계를 극복하기 위해 SK텔레콤의 T-Brain에서는 KoBERT라는 한국형 사전 훈련 모델을 개발하였습니다. 위키피디아나 뉴스 등에서 수집한 수백만 개의 한국어 문장으로 이루어진 대규모 말뭉치(corpus)를 기반으로 학습하였으며, 한국어의 불규칙한 언어 변화의 특성을 반영하기 위해 데이터 기반 토큰화(Tokenization) 기법을 적용하여 Apache MXNet을 […]

Read More