게시된 날짜: Nov 2, 2017
Amazon Kinesis Analytics를 사용하여 스트리밍 데이터에서 실시간으로 변칙을 검색할 수 있습니다. 오늘, AWS는 변칙에 대한 설명을 제공하여 근본 원인 분석을 쉽게 해 주는 두 가지 새로운 기능을 출시했습니다. 높은 변칙 점수가 데이터의 어떤 필드에서 발생하는지 알아 내고 변칙과 관련된 추세를 파악할 수 있습니다.
Kinesis Analytics는 Random Cut Forest 알고리즘을 하나 이상의 숫자 필드 분석과 점수 생성에 사용하여 데이터 스트림에서 변칙을 식별합니다. 데이터 스트림의 레코드에 필드가 많을 때, 특히 데이터가 크고 빠르게 이동하며 자주 변경되는 경우, 어떤 필드에서 높은 변칙 점수가 발생하는지 수동으로 파악하기 어려울 수 있습니다. Kinesis Analytics는 이제 귀인(attribution)과 방향성(directionality)을 사용하여 변칙 점수의 실시간 설명을 제공합니다. 귀인은 전체 점수에 대한 입력 필드의 기여도를 설명하고, 방향성은 각 필드의 딥(dip)과 스파이크(spike) 같은 추세에 대한 정보를 제공합니다. 자세한 내용과 샘플 코드는 Amazon Kinesis Analytics SQL 참조의 Random Cut Forest 및 설명을 참조하십시오.
Kinesis Analytics는 새로운 프로그래밍 언어 또는 처리 프레임워크를 배울 필요 없이 SQL을 통해 실시간으로 스트리밍 데이터를 처리할 수 있는 가장 쉬운 방법입니다. Kinesis Analytics를 사용하면 SQL을 사용하여 스트리밍 데이터를 쿼리하거나 전체 스트리밍 애플리케이션을 구축할 수 있으므로 수행해야 할 작업을 정확하게 파악하고 비즈니스 및 고객 요구 사항에 적절하게 대응할 수 있습니다. Kinesis Analytics는 미국 동부(버지니아 북부), 미국 서부(오레곤), EU(아일랜드) 리전에서 사용할 수 있습니다.