Amazon Web Services 한국 블로그

Category: Amazon SageMaker

Amazon.Science – AWS의 SK텔레콤의 ‘한국어 자연어 처리기’ 개발 지원기

이 글은 Amazon Science의  Amazon scientists help SK telecom create Korean-based natural language processor (글쓴이 – Douglas Gantenbein)를 한국어로 번역했습니다. 한국어는 전세계에서 8천만 명이 사용하는 주요한 언어입니다. 오래전 만주 지역에서 기원한 것으로 여기지는 긴 역사에도 불구하고, 한국어는 (영어가 프랑스어나 라틴어와 가지는 것과 같은) 다른 언어와의 뚜렷한 연관성이 없는 “고립어”라고 불립니다. 그러나, 한국어는 컴퓨터가 인간의 언어를 […]

Amazon SageMaker의 MXNet 추론 컨테이너를 활용한 KoGPT2 모델 배포하기

기계 학습 기반 자연어 처리를 위한 다양한 학습 모델이 나오고 있는 가운데, 다국어로 학습된 BERT의 한국어 성능 한계를 극복하기 위해 SK텔레콤의 T-Brain에서는 KoBERT라는 한국형 사전 훈련 모델을 개발하였습니다. 위키피디아나 뉴스 등에서 수집한 수백만 개의 한국어 문장으로 이루어진 대규모 말뭉치(corpus)를 기반으로 학습하였으며, 한국어의 불규칙한 언어 변화의 특성을 반영하기 위해 데이터 기반 토큰화(Tokenization) 기법을 적용하여 Apache MXNet을 […]

Amazon API Gateway 매핑 템플릿과 Amazon SageMaker를 통한 기계 학습 기반 REST API 생성하기

AWS 고객들은 완전 관리형 기계 학습 서비스인 Amazon SageMaker를 사용하여 기계 학습 모델을 구축, 교육 및 배포 할 수 있습니다. 이를 통해 개인화 된 제품 추천을 하거나, 사용자에 따른 선호 사항을 자동으로 제공하는 애플리케이션을 통해 고객의 경험을 높일 수 있습니다. 그런데, 이런 애플리케이션을 구축 할 때 아키텍처의 주요 고려 사항 중 하나는 사용자 단말기나 웹브라우저에서 실행되는 […]

클라우드 기술의 5가지 주요 흐름 – 2019년 회고

이제 2019년도 하루 밖에 남지 않았네요! 매년 해왔던 블로그 회고 (2015년, 2016년, 2017년, 2018년)의 일환으로 이번에는 한해 동안 클라우드 기술의 흐름이 어떻게 변화했는지 살펴보고자 합니다. 제가 지난 5년간 AWS에서 일하면서, 올해 개인적으로 중요하다고 생각된 것들을 뽑아 보았는데, 혹시 내년에 여러분의 기술 자산을 채우기 위한 목표를 세운다면 어느 분야에 집중하면 좋을지 실마리가 되길 바랍니다. 1. 클라우드 […]

Amazon SageMaker, 그래프 딥러닝 학습을 위한 Deep Graph Library 모델 추가

AWS에서는 이미 검증된 다양한 기계 학습 모델을 최적화해서 Amazon SageMaker에서 사용할 수 있도록 다수의 유명 기-훈련 알고리즘과 모델을 제공하고 있습니다. 또한, AWS Marketplace의 기계 학습 분야에는 수백개의 모델들을 원-클릭으로 SageMaker에서 사용 가능합니다. 이번에 그래프 신경망의 손쉬운 구현을 위해 빌드된 오픈 소스 라이브러리 Deep Graph Library를 Amazon SageMaker에서 사용할 수 있습니다. 최근 몇 년 동안 딥 […]

Amazon SageMaker Debugger – 기계 학습 모델 학습 과정 디버깅 기능 출시 (서울 리전 포함)

Amazon SageMaker Debugger는 기계 학습(ML) 훈련 작업 중 발생하는 복잡한 문제를 자동으로 식별해주는 기능입니다. ML 모델을 구축하고 학습하려면 과학과 기술(요술이라고 말하는 사람도 있음)이 모두 필요합니다. 데이터 세트를 수집하고 준비하는 것부터 다양한 알고리즘을 실험하여 최적의 학습 파라미터(공포의 하이퍼파라미터)를 찾는 것까지, ML 실무자가 고성능 모델을 제공하기까지 넘어야 할 허들은 꽤 많습니다. 그래서 AWS는 모듈식의 완전관리형 서비스인 Amazon […]

Amazon SageMaker Autopilot – 완벽한 제어 및 가시성을 바탕으로 고품질 기계 학습 모델 자동 생성 기능 (서울 리전 포함)

Amazon SageMaker Autopilot은 높은 품질의 분류 및 회귀 기계 학습 모델을 자동으로 생성하면서도, 완벽한 제어 및 가시성을 제공하는 AutoML 서비스입니다. 1959년에 Arthur Samuel은 기계 학습을 명시적 프로그래밍 없이 학습할 수 있는 컴퓨터의 기능이라고 정의했습니다. 그러나, 현실적으로 기존 데이터 세트에서 패턴을 추출하고 이러한 패턴을 사용하여 새 데이터에 일반화되는 예측 모델을 구축할 수 있는 알고리즘을 찾는 것을 […]

Amazon SageMaker Model Monitor – 기계 학습 모델을 위한 완전 관리형 자동 모니터링 기능 출시 (서울 리전 포함)

Amazon SageMaker Model Monitor는 정식 서비스 환경에서 기계 학습(ML) 모델을 모니터링하고, 데이터 품질 문제가 발생했을 때 이를 알려주는 새로운 서비스입니다. 데이터 작업을 시작하면서 때 처음 깨달은 것은 데이터 품질에 아무리 주의를 기울여도 부족하다는 것입니다. 데이터베이스 중 하나에서 예기치 않은 NULL 값이나 복잡한 문자 인코딩 때문에 발생한 문제를 해결하기 위해 수많은 시간을 보낸 경험을 여러분 모두 […]

Amazon SageMaker Experiments – 반복적인 기계 학습 모델 훈련 구성, 추적 및 평가 기능 출시 (서울 리전 포함)

Amazon SageMaker Experiments는 반복적인 기계 학습(Machine Learning, ML) 모델 버전을 구성, 추적, 비교 및 평가하는 데 사용되는 새로운 기능입니다. 기계 학습 워크로드는 매우 반복적인 과정입니다. 프로젝트 한 건을 진행하는 동안 데이터 과학자와 ML 엔지니어가 최대한의 정확성을 찾기 위해 학습하는 모델의 수는 수천 개에 달합니다. 실제로, 알고리즘, 데이터 세트 및 학습 파라미터(일명 하이퍼파라미터)의 조합은 무한대이며 이 […]

Amazon SageMaker Processing – 완전 관리형 데이터 처리 및 모델 평가

Amazon SageMaker의 새로운 기능인  SageMaker Processing은 사전 처리, 사후 처리 및 모델 평가 워크로드를 쉽게 실행할 수 있습니다. 정확한 ML(기계 학습) 모델 학습을 위해서는 여러 가지 단계가 필요하지만 다음과 같은 데이터 세트 사전 처리보다 더 중요한 단계는 없습니다. 사용 중인 ML 알고리즘에 사용되는 입력 형식으로 데이터 세트 변환 기존 기능을 더욱 강력한 표현 방식으로 변환(예: […]