Amazon Web Services 한국 블로그

Category: Analytics

Apache Spark과 Amazon Redshift 통합 기능 정식 출시

Apache Spark는 빅 데이터 워크로드에 일반적으로 사용되는 오픈 소스 분산 처리 시스템입니다. Amazon EMR, Amazon SageMaker 및 AWS Glue에서 작업하는 Spark 애플리케이션 개발자는 Amazon Redshift로 데이터를 읽고 쓸 수 있는 타사 Apache Spark 커넥터를 사용하는 경우가 많습니다. 이러한 타사 커넥터는 다양한 버전의 Spark에서 정기적으로 유지 관리, 지원 또는 테스트되지 않습니다. 오늘 Apache Spark용 Amazon Redshift […]

AWS Glue Data Quality 미리보기 – 규칙 기반 자동 데이터 품질 기능 출시

1980년에 저는 두 번째 전문 프로그래밍 일을 하면서 미국 여러 주의 운전면허증 데이터를 분석하는 프로젝트를 진행하고 있었습니다. 당시 해당 유형의 데이터는 일반적으로 고정 길이 레코드에 저장되었으며 값은 각 필드에 신중하게(또는 인코딩되지 않은) 인코딩되었습니다. 데이터에 대한 스키마가 주어졌음에도 불구하고, 항상 개발자들이 미리 예상하지 못한 값을 나타내기 위해 트릭에 의존해야 한다는 것을 알게 되었습니다. 예를 들어, 서로 […]

Amazon Athena – Apache Spark 지원 기능 정식 출시

2016년 Jeff Barr가 Amazon Athena를 처음 발표했을 때, 데이터와의 상호 작용에 대한 제 관점이 바뀌었습니다. Amazon Athena를 사용하면 Athena에서 테이블 생성, 커넥터를 사용하는 데이터 로드, ANSI SQL 표준을 사용하는 쿼리부터 시작하여 몇 단계만 거치면 데이터와 상호 작용할 수 있습니다. 시간이 지남에 따라 금융 서비스, 의료 및 소매업과 같은 다양한 산업에서는 다양한 형식과 크기의 데이터에 대해 […]

Amazon QuickSight Q – 자동화된 데이터 준비 기능 출시

2021년 9월에 공개된 이 게시글에서 Jeff Barr 씨가 Amazon QuickSight Q의 정식 출시 소식을 발표했었습니다. 요약해서 말씀드리자면, Amazon QuickSight Q는 기업 사용자가 데이터에 대한 간단한 질문을 할 수 있는 자연어 쿼리 기능입니다. QuickSight Q는 쉬운 언어를 사용하여 데이터를 쿼리하고 대시보드, 제어 기능, 계산을 사용할 필요가 없는 기계 학습(ML) 기반 셀프 서비스 분석을 제공합니다. 작년에 QuickSight […]

Amazon Security Lake 미리 보기 – 보안을 위한 고객 소유 데이터 레이크 서비스

잠재적 보안 위협 및 취약성을 식별하기 위해 고객은 다양한 리소스에 대한 로깅을 활성화하고 분석 도구 내에서 쉽게 액세스하고 사용할 수 있도록 이러한 로그를 중앙 집중화해야 합니다. 이러한 데이터 소스 중 일부에는 온프레미스 인프라, 방화벽 및 엔드포인트 보안 솔루션의 로그가 포함되며, 클라우드를 사용하는 경우 Amazon Route 53, AWS CloudTrail 및 Amazon Virtual Private Cloud(VPC)와 같은 서비스가 […]

Amazon OpenSearch 서버리스 미리보기 – 클러스터 관리 없이 검색 및 분석 워크로드 실행 기능

대부분의 AWS 분석 서비스에는 고객이 기본 인프라를 구성, 확장 또는 관리할 필요 없이 방대한 양의 데이터를 훨씬 쉽게 분석할 수 있는 강력한 서버리스 서비스를 제공합니다. 비즈니스 인텔리전스를 위한 Amazon QuickSight 및 데이터 통합을 위한 AWS Glue와 같은 다른 서버리스 분석과 함께 올해 Amazon EMR Serverless, Amazon MSK Serverless 및 Amazon Redshift Serverless를 출시했습니다. 오늘 Amazon […]

Amazon QuickSight API 기능 정식 출시

이 블로그의 일반 독자는 물론 AWS 고객 모두 코드형 인프라(IaC)의 이점을 알고 있습니다. IaC에서는 프로그래밍 언어를 사용하여 인프라를 구성함으로써 인프라를 여러 환경 또는 AWS 리전에 일관되게 배포할 수 있습니다. 다른 이점으로는 애플리케이션 소스 코드를 관리하는 데 사용하는 것과 동일한 개발 도구 및 워크플로우를 사용하여 인프라의 버전을 관리할 수 있다는 것입니다. 또한 IaC는 인프라를 배포하기 전에 […]

Amazon QuickSight 업데이트 – 페이지 기반 운영 보고서 생성 및 공유 기능 출시

데이터 인사이트를 보고하는 방법에는 여러 가지가 있는데, 페이지 기반 보고서도 그 중 하나입니다. 페이지 기반 보고서는 최종 사용자를 위한 중요한 비즈니스 정보가 포함된 필수 문서입니다. 수십 년 동안 페이지 기반 보고서는 표준 비즈니스 보고 형식이었습니다. 다음은 페이지 기반 보고서의 예입니다. 왼쪽에는 손익 계산서가 표시되어 있고 오른쪽에는 연간 실적 요약이 표시되어 있습니다. 예에서 볼 수 있듯이 […]

Amazon Redshift 신규 기능 – Kinesis Data Streams 및 Kafka용 관리형 스트리밍 수집 정식 출시

10년 전, 제가 AWS에 입사한 지 불과 몇 달 만에 Amazon Redshift가 출시되었습니다. 수년에 걸쳐 성능을 개선하고 더 쉽게 사용할 수 있게 많은 기능을 추가했습니다. Amazon Redshift를 사용하면 이제 데이터 웨어하우스, 운영 데이터베이스 및 데이터 레이크에 걸쳐 구조화된 데이터와 반정형 데이터를 분석할 수 있습니다. 최근에는 데이터 웨어하우스 인프라를 관리하지 않고도 분석을 쉽게 실행하고 확장할 수 […]

AWS Glue 4.0 – 새롭고 업데이트된 엔진, 더 많은 데이터 형식 제공 등

AWS Glue는 데이터 통합 및 ETL 워크로드의 개발과 실행 속도를 높이는 데 도움이 되는 확장 가능한 서버리스 도구입니다. 오늘 AWS는 업데이트된 엔진, 추가 데이터 형식 지원, Ray 지원 등의 다양한 새로운 기능을 제공하는 Glue 4.0을 출시합니다. 자세히 살펴보기 전에, 먼저 버전 관리에 대해 간단히 말씀드리겠습니다. 서비스 팀이 API를 소유하고 완전히 제어하는 대부분의 AWS 서비스와 달리, […]