Amazon Web Services 한국 블로그

Category: Analytics

AQUA(Advanced Query Accelerator) 정식 출시 – Amazon Redshift 쿼리 속도 향상

Amazon Redshift는 이미 다른 클라우드 데이터 웨어하우스보다 규모에 관계없이 최대 3배 향상된 가성비를 제공합니다. 우리는 자체 하드웨어를 설계하고 기계 학습(ML)을 사용하여 이를 수행합니다. 예를 들어 2019년 말에 Amazon Redshift용 SSD 기반 RA3 노드를 시작했으며(Amazon Redshift 업데이트 – 차세대 컴퓨팅 인스턴스 및 관리형 분석 최적화 스토리지), 지난 4월(Amazon Redshift 업데이트 – ra3.4xlarge 노드) 및 지난 12월(Amazon […]

Amazon Elasticsearch Service 메모리 자동 조정(Auto-Tune) 기능 사용하기

얼마 전 Amazon Elasticsearch Service의 클러스터 리소스를 자동으로 최적화하여 성능과 가용성을 개선하기 위해 메모리 자동 조정(Auto-Tune) 기능을 출시하였습니다. Elasticsearch는 Java Virtual Machine(JVM)에서 실행되며, 많은 수집 볼륨과 검색 워크로드를 지원하는 경우 메모리 설정 조정은 필수적입니다. 자동 조정의 적응형 시스템은 수신 워크로드 성능에 영향을 미치는 리소스 병목 현상을 식별하고 필요한 확장 및 성능을 지원하기 위해 클러스터에서 적절한 […]

Amazon Lookout for Metrics 미리보기 – 비즈니스 상태를 모니터링하기 위한 이상 탐지 서비스

기계 학습(ML)으로 지표에서 이상을 탐지하여 ML 경험이 없어도 사전에 비즈니스 상태를 모니터링하고 문제를 진단하며 빠르게 기회를 찾을 수 있도록 지원하는 새로운 서비스, Amazon Lookout for Metrics를 소개합니다. Lookout for Metrics는 Amazon이 오탐을 줄이면서 데이터에서 찾기 어려운 이상한 변경 사항을 탐지하는 데 사용하던 기술을 동일하게 사용합니다. 또한 유사한 결과를 그룹화하고 심각도별로 순위를 매기며 이상의 근본 원인을 […]

새로운 기능 — Amazon EMR on Amazon Elastic Kubernetes Service(EKS)

수만 명의 고객이 Amazon EMR을 사용하여 Apache Spark, Hive, HBase, Flink,Hudi 및 Presto와 같은 프레임워크에서 빅 데이터 분석 애플리케이션을 대규모로 실행합니다. EMR은 이러한 프레임워크의 프로비저닝 및 조정을 자동화하고 다양한 EC2 인스턴스 유형으로 성능을 최적화하여 가격 및 성능 요구 사항을 충족합니다. 이제 고객은 Kubernetes를 사용하여 조직 전체에서 컴퓨팅 풀을 통합하고 있습니다. Amazon Elastic Kubernetes Service(EKS)에서 Apache […]

새로운 기능 – Amazon QuickSight Q가 비즈니스 데이터에 대한 자연어 질문에 답변

세션별 지불 요금제의 첫 번째 BI(비즈니스 인텔리전스) 서비스로 Amazon QuickSight가 출시되었습니다. 오늘 AWS는 기계 학습(ML)을 기반으로 하는 자연어 쿼리(NLQ) 기능인 Amazon QuickSight Q의 preview를 발표하게 되었습니다. 이제 비즈니스 사용자는 Q를 통해 QuickSight를 사용하여 일상 언어로 데이터에 대해 질문하고 몇 초 만에 정확한 답변을 받을 수 있습니다. 예를 들어, “전년 대비 연간 매출 성잘률은 얼마지?” 또는 […]

Amazon DynamoDB 테이블 S3 내보내기 기능 출시 – 코드 없는 데이터 레이크 분석 제공

2012년 출시 이래 수십만의 AWS 고객이 미션 크리티컬 워크로드를 지원할 솔루션으로 Amazon DynamoDB를 선택했습니다. DynamoDB는 비관계형 관리형 데이터베이스로, 사실상 무한한 양의 데이터를 저장하며 규모에 관계없이 1밀리초 단위로 데이터를 검색할 수 있습니다. 이 데이터를 최대한 활용하려면 고객은 AWS Data Pipeline, Amazon EMR 또는 DynamoDB 스트림 기반의 기타 솔루션을 사용해야 했습니다. 이러한 솔루션은 일반적으로 읽기 처리량이 높은 […]

Amazon CloudFront 실시간 로그 기능을 통한 대시 보드 생성하기

Amazon CloudFront 는 글로벌 엣지 로케이션 네트워크를 사용하여 짧은 지연 시간과 빠른 전송 속도로 정적 및 동적 웹 콘텐츠를 안전하게 전송하는 콘텐츠 전송 네트워크 (CDN) 서비스입니다. 오늘 부터 CloudFront에서 실시간 로그를 제공하는 새로운 기능을 발표했습니다. CloudFront 실시간 로그에는 수신하는 모든 요청에 ​​대한 자세한 정보를 포함할 수 있기 때문에 운영 시 생기는 문제에 대해 신속하게 대응할 […]

Amazon EMR 6.0.0을 사용하여 Docker로 Spark 애플리케이션 실행하기

지난 4월 Amazon EMR 6.0.0 버전을 정식 출시했습니다. Amazon EMR 6.0.0을 사용하면, Spark 사용자가 Docker Hub 및 Amazon Elastic Container Registry(Amazon ECR)의 Docker 이미지를 사용하여 환경 및 라이브러리 종속성을 정의할 수 있습니다. 사용자는 Docker를 사용하여 종속성을 손쉽게 정의하고 개별 작업에 사용할 수 있으므로 개별 클러스터 호스트에 종속성을 설치할 필요가 없습니다. 이 글에서는 EMR 6.0.0에서 Docker를 […]

Amazon EMR에서 spark-submit를 사용하여 사용자 애플리케이션 제출하기

빅 데이터로의 전환을 시작하는 고객은 종종 사용자 애플리케이션을 Amazon EMR에서 실행되는 Spark에 제출하는 방법에 대한 지침을 요청합니다. 예를 들어, 고객은 애플리케이션에 사용할 수 있는 메모리 및 계산 리소스의 크기를 조정하는 방법이나 사용 사례에 가장 적합한 리소스 할당 모델에 대한 지침에 대해 문의합니다. 이 게시물에서는 EMR에서 실행 중인 Spark에 제출된 애플리케이션에서 사용할 수 있는 메모리 및 […]

AWS Glue 버전 2.0 정식 출시 – Spark ETL 작업 시간 1/10로 단축 가능 (서울 리전 포함)

AWS Glue는 분석을 위한 데이터를 준비하고 로드할 때 사용할 수 있는 완전관리형 ETL(추출, 변환 및 로드) 서비스입니다. Glue는 “서버리스”이므로 리소스를 프로비저닝하거나 관리할 필요 없이 Glue가 실행될 때의 리소스 요금만 지불하면 됩니다. 이제, Spark ETL 작업을 10배 더 빠르게 시작할 수 있는 AWS Glue 버전 2.0이 정식 출시되었습니다. 시작 지연 시간이 감소함에 따라 전체 작업 완료 […]