Amazon Web Services 한국 블로그

Category: Analytics

Amazon SageMaker Data Wrangler – 신규 SaaS 애플리케이션 데이터 소스 지원

데이터는 기계 학습의 원동력입니다. 기계 학습에서 데이터 준비는 원시 데이터를 추가 처리 및 분석에 적합한 형식으로 변환하는 프로세스입니다. 데이터 준비를 위한 일반적인 프로세스는 데이터를 수집한 다음 정리하고 레이블을 지정하고 마지막으로 검증 및 시각화하는 것으로 시작됩니다. 고품질의 데이터를 올바로 얻는 프로세스는 보통 복잡하고 시간이 많이 걸릴 수 있습니다. 이것이 바로 AWS에서 기계 학습(ML) 워크로드를 구축하는 고객들이 […]

Amazon Redshift 업데이트 – S3 자동 복사, Aurora Zero-ETL, 멀티 AZ 지원, 동적 데이터 마스킹 등

고객과 이야기를 나누다 보면 고객이 데이터에서 얻은 인사이트를 활용하여 시기 적절하고 영향력 있고 실행 가능한 비즈니스 결정을 내릴 수 있기를 원한다는 것을 알 수 있습니다. 데이터 기반 조직의 일반적인 패턴은 분석 시스템에 수집해야 하는 데이터 소스가 다양하다는 것입니다. 이를 위해서는 운영 데이터베이스, 데이터 레이크, 스트리밍 데이터 및 웨어하우스 내 데이터를 아우르는 수동 데이터 파이프라인을 구축해야 […]

Apache Spark과 Amazon Redshift 통합 기능 정식 출시

Apache Spark는 빅 데이터 워크로드에 일반적으로 사용되는 오픈 소스 분산 처리 시스템입니다. Amazon EMR, Amazon SageMaker 및 AWS Glue에서 작업하는 Spark 애플리케이션 개발자는 Amazon Redshift로 데이터를 읽고 쓸 수 있는 타사 Apache Spark 커넥터를 사용하는 경우가 많습니다. 이러한 타사 커넥터는 다양한 버전의 Spark에서 정기적으로 유지 관리, 지원 또는 테스트되지 않습니다. 오늘 Apache Spark용 Amazon Redshift […]

AWS Glue Data Quality 미리보기 – 규칙 기반 자동 데이터 품질 기능 출시

1980년에 저는 두 번째 전문 프로그래밍 일을 하면서 미국 여러 주의 운전면허증 데이터를 분석하는 프로젝트를 진행하고 있었습니다. 당시 해당 유형의 데이터는 일반적으로 고정 길이 레코드에 저장되었으며 값은 각 필드에 신중하게(또는 인코딩되지 않은) 인코딩되었습니다. 데이터에 대한 스키마가 주어졌음에도 불구하고, 항상 개발자들이 미리 예상하지 못한 값을 나타내기 위해 트릭에 의존해야 한다는 것을 알게 되었습니다. 예를 들어, 서로 […]

Amazon Athena – Apache Spark 지원 기능 정식 출시

2016년 Jeff Barr가 Amazon Athena를 처음 발표했을 때, 데이터와의 상호 작용에 대한 제 관점이 바뀌었습니다. Amazon Athena를 사용하면 Athena에서 테이블 생성, 커넥터를 사용하는 데이터 로드, ANSI SQL 표준을 사용하는 쿼리부터 시작하여 몇 단계만 거치면 데이터와 상호 작용할 수 있습니다. 시간이 지남에 따라 금융 서비스, 의료 및 소매업과 같은 다양한 산업에서는 다양한 형식과 크기의 데이터에 대해 […]

Amazon QuickSight Q – 자동화된 데이터 준비 기능 출시

2021년 9월에 공개된 이 게시글에서 Jeff Barr 씨가 Amazon QuickSight Q의 정식 출시 소식을 발표했었습니다. 요약해서 말씀드리자면, Amazon QuickSight Q는 기업 사용자가 데이터에 대한 간단한 질문을 할 수 있는 자연어 쿼리 기능입니다. QuickSight Q는 쉬운 언어를 사용하여 데이터를 쿼리하고 대시보드, 제어 기능, 계산을 사용할 필요가 없는 기계 학습(ML) 기반 셀프 서비스 분석을 제공합니다. 작년에 QuickSight […]

Amazon Security Lake 미리 보기 – 보안을 위한 고객 소유 데이터 레이크 서비스

잠재적 보안 위협 및 취약성을 식별하기 위해 고객은 다양한 리소스에 대한 로깅을 활성화하고 분석 도구 내에서 쉽게 액세스하고 사용할 수 있도록 이러한 로그를 중앙 집중화해야 합니다. 이러한 데이터 소스 중 일부에는 온프레미스 인프라, 방화벽 및 엔드포인트 보안 솔루션의 로그가 포함되며, 클라우드를 사용하는 경우 Amazon Route 53, AWS CloudTrail 및 Amazon Virtual Private Cloud(VPC)와 같은 서비스가 […]

Amazon OpenSearch 서버리스 미리보기 – 클러스터 관리 없이 검색 및 분석 워크로드 실행 기능

대부분의 AWS 분석 서비스에는 고객이 기본 인프라를 구성, 확장 또는 관리할 필요 없이 방대한 양의 데이터를 훨씬 쉽게 분석할 수 있는 강력한 서버리스 서비스를 제공합니다. 비즈니스 인텔리전스를 위한 Amazon QuickSight 및 데이터 통합을 위한 AWS Glue와 같은 다른 서버리스 분석과 함께 올해 Amazon EMR Serverless, Amazon MSK Serverless 및 Amazon Redshift Serverless를 출시했습니다. 오늘 Amazon […]

Amazon QuickSight API 기능 정식 출시

이 블로그의 일반 독자는 물론 AWS 고객 모두 코드형 인프라(IaC)의 이점을 알고 있습니다. IaC에서는 프로그래밍 언어를 사용하여 인프라를 구성함으로써 인프라를 여러 환경 또는 AWS 리전에 일관되게 배포할 수 있습니다. 다른 이점으로는 애플리케이션 소스 코드를 관리하는 데 사용하는 것과 동일한 개발 도구 및 워크플로우를 사용하여 인프라의 버전을 관리할 수 있다는 것입니다. 또한 IaC는 인프라를 배포하기 전에 […]

Amazon QuickSight 업데이트 – 페이지 기반 운영 보고서 생성 및 공유 기능 출시

데이터 인사이트를 보고하는 방법에는 여러 가지가 있는데, 페이지 기반 보고서도 그 중 하나입니다. 페이지 기반 보고서는 최종 사용자를 위한 중요한 비즈니스 정보가 포함된 필수 문서입니다. 수십 년 동안 페이지 기반 보고서는 표준 비즈니스 보고 형식이었습니다. 다음은 페이지 기반 보고서의 예입니다. 왼쪽에는 손익 계산서가 표시되어 있고 오른쪽에는 연간 실적 요약이 표시되어 있습니다. 예에서 볼 수 있듯이 […]