Amazon Web Services 한국 블로그
Category: Analytics
Amazon Redshift의 가격 대비 성능 리더쉽
데이터는 전략적 자산입니다. 데이터에서 적시에 가치를 얻으려면 비용을 낮게 유지하면서 대규모로 성능을 제공할 수 있는 고성능 시스템이 필요합니다. Amazon Redshift는 수만 명의 고객이 매일 엑사바이트 규모의 데이터를 분석하는 데 사용하는 가장 인기 있는 클라우드 데이터 웨어하우스입니다. Amazon Redshift 환경에 더 많은 데이터를 가져올 때 고객을 위해 가격 대비 성능을 개선하기 위해 새로운 기능을 계속 추가하고 […]
Amazon Athena 프로비저닝 용량 기능 출시
Amazon Athena 쿼리를 실행하기 위한 용량을 미리 프로비저닝하는 기능을 오늘 출시했습니다. Amazon Athena는 Amazon Simple Storage Service(S3) 데이터 레이크의 데이터와 온프레미스 데이터 소스 또는 기타 클라우드 시스템을 비롯한 30가지 데이터 소스의 데이터를 표준 SQL 쿼리를 사용하여 간단하게 분석할 수 있는 쿼리 서비스입니다. Athena는 서버리스 솔루션이므로 관리가 필요한 인프라가 없으며, 오늘까지는 실행한 쿼리에 대해서만 요금을 지불하면 […]
AWS Pi Day 2023 출시 안내 – Amazon S3 출시 17주년
AWS Pi Day 2023이 3월 14일 Twitch의 AWS 온 에어 채널에서 개최되었습니다. 지금으로 부터 17년 전 오늘, 저희는 아주 단순한 객체 스토리지 서비스를 출시했습니다. 이를 통해 개발자는 개인 스토리지 공간(버킷이라고 함)을 생성, 나열 및 삭제하고, 파일을 업로드 및 다운로드하고, 액세스 권한을 관리할 수 있었습니다. 이 서비스는 REST 및 SOAP API를 통해서만 사용할 수 있었습니다. 99.99999999999%의 […]
Amazon SageMaker Data Wrangler – 신규 SaaS 애플리케이션 데이터 소스 지원
데이터는 기계 학습의 원동력입니다. 기계 학습에서 데이터 준비는 원시 데이터를 추가 처리 및 분석에 적합한 형식으로 변환하는 프로세스입니다. 데이터 준비를 위한 일반적인 프로세스는 데이터를 수집한 다음 정리하고 레이블을 지정하고 마지막으로 검증 및 시각화하는 것으로 시작됩니다. 고품질의 데이터를 올바로 얻는 프로세스는 보통 복잡하고 시간이 많이 걸릴 수 있습니다. 이것이 바로 AWS에서 기계 학습(ML) 워크로드를 구축하는 고객들이 […]
Amazon Redshift 업데이트 – S3 자동 복사, Aurora Zero-ETL, 멀티 AZ 지원, 동적 데이터 마스킹 등
고객과 이야기를 나누다 보면 고객이 데이터에서 얻은 인사이트를 활용하여 시기 적절하고 영향력 있고 실행 가능한 비즈니스 결정을 내릴 수 있기를 원한다는 것을 알 수 있습니다. 데이터 기반 조직의 일반적인 패턴은 분석 시스템에 수집해야 하는 데이터 소스가 다양하다는 것입니다. 이를 위해서는 운영 데이터베이스, 데이터 레이크, 스트리밍 데이터 및 웨어하우스 내 데이터를 아우르는 수동 데이터 파이프라인을 구축해야 […]
Apache Spark과 Amazon Redshift 통합 기능 정식 출시
Apache Spark는 빅 데이터 워크로드에 일반적으로 사용되는 오픈 소스 분산 처리 시스템입니다. Amazon EMR, Amazon SageMaker 및 AWS Glue에서 작업하는 Spark 애플리케이션 개발자는 Amazon Redshift로 데이터를 읽고 쓸 수 있는 타사 Apache Spark 커넥터를 사용하는 경우가 많습니다. 이러한 타사 커넥터는 다양한 버전의 Spark에서 정기적으로 유지 관리, 지원 또는 테스트되지 않습니다. 오늘 Apache Spark용 Amazon Redshift […]
AWS Glue Data Quality 미리보기 – 규칙 기반 자동 데이터 품질 기능 출시
1980년에 저는 두 번째 전문 프로그래밍 일을 하면서 미국 여러 주의 운전면허증 데이터를 분석하는 프로젝트를 진행하고 있었습니다. 당시 해당 유형의 데이터는 일반적으로 고정 길이 레코드에 저장되었으며 값은 각 필드에 신중하게(또는 인코딩되지 않은) 인코딩되었습니다. 데이터에 대한 스키마가 주어졌음에도 불구하고, 항상 개발자들이 미리 예상하지 못한 값을 나타내기 위해 트릭에 의존해야 한다는 것을 알게 되었습니다. 예를 들어, 서로 […]
Amazon Athena – Apache Spark 지원 기능 정식 출시
2016년 Jeff Barr가 Amazon Athena를 처음 발표했을 때, 데이터와의 상호 작용에 대한 제 관점이 바뀌었습니다. Amazon Athena를 사용하면 Athena에서 테이블 생성, 커넥터를 사용하는 데이터 로드, ANSI SQL 표준을 사용하는 쿼리부터 시작하여 몇 단계만 거치면 데이터와 상호 작용할 수 있습니다. 시간이 지남에 따라 금융 서비스, 의료 및 소매업과 같은 다양한 산업에서는 다양한 형식과 크기의 데이터에 대해 […]
Amazon QuickSight Q – 자동화된 데이터 준비 기능 출시
2021년 9월에 공개된 이 게시글에서 Jeff Barr 씨가 Amazon QuickSight Q의 정식 출시 소식을 발표했었습니다. 요약해서 말씀드리자면, Amazon QuickSight Q는 기업 사용자가 데이터에 대한 간단한 질문을 할 수 있는 자연어 쿼리 기능입니다. QuickSight Q는 쉬운 언어를 사용하여 데이터를 쿼리하고 대시보드, 제어 기능, 계산을 사용할 필요가 없는 기계 학습(ML) 기반 셀프 서비스 분석을 제공합니다. 작년에 QuickSight […]
Amazon Security Lake 미리 보기 – 보안을 위한 고객 소유 데이터 레이크 서비스
잠재적 보안 위협 및 취약성을 식별하기 위해 고객은 다양한 리소스에 대한 로깅을 활성화하고 분석 도구 내에서 쉽게 액세스하고 사용할 수 있도록 이러한 로그를 중앙 집중화해야 합니다. 이러한 데이터 소스 중 일부에는 온프레미스 인프라, 방화벽 및 엔드포인트 보안 솔루션의 로그가 포함되며, 클라우드를 사용하는 경우 Amazon Route 53, AWS CloudTrail 및 Amazon Virtual Private Cloud(VPC)와 같은 서비스가 […]