Amazon Web Services 한국 블로그
Category: Amazon Redshift
AWS Backup 신규 기능 – Amazon Redshift 지원 기능 출시
Amazon Redshift를 사용하게 되면 스케일과 관계없이 클라우드에서 데이터를 분석할 수 있습니다. Amazon Redshift에서는 자동 스냅샷과 수동 스냅샷을 사용하여 데이터를 보호하는 데이터 보호 기능이 기본적으로 제공됩니다. 이 기능은 자체적으로 훌륭하게 작동하지만, 다른 AWS 서비스를 사용할 때는 데이터 보호 정책을 관리하는 도구를 두 가지 이상 구성해야 합니다. 이 작업이 더 쉬워지도록 AWS Backup에 Amazon Redshift 지원을 추가했습니다. […]
AWS 관리형 데이터베이스 서비스 전송 비용 알아보기
여러분은 애플리케이션의 목적에 따라 관계형, 키-값, 문서, 인메모리, 그래프, 시계열, 칼럼 또는 원장 등 AWS 관리형 데이터베이스 서비스를 선택할 수 있습니다. 이때, DB 서비스 내 데이터 전송 요금이 계산되는 방식을 이해하는 것이 중요합니다. 이 글에서는 여러 AWS 관리형 데이터베이스 제품에 대한 데이터 전송 요금을 간략하게 설명합니다. 여기서는 데모를 위해 기본 AWS 리전을 미국 동부 (버지니아 북부), […]
Amazon Redshift Serverless – 추가 신규 기능과 함께 정식 출시 (서울 리전 포함)
작년 re:Invent에서는 Amazon Redshift Serverless 평가판이 출시되었습니다. 이 서비스는 Amazon Redshift의 서버리스 옵션으로, 데이터 웨어하우스 인프라를 관리하지 않고도 모든 규모의 데이터를 분석할 수 있습니다. 데이터를 로드 및 쿼리하고 사용한 만큼만 요금을 지불하면 됩니다. 이를 통해 더 많은 기업이 현대적 데이터 전략을 구축할 수 있게 됩니다. 특히, 분석 워크로드를 상시 실행하지 않고 데이터 웨어하우스가 상시 활성 […]
Amazon Redshift, 비용 최적 고밀도 컴퓨팅(DC2) 노드 활용하기
Amazon Redshift를 사용하면 엑사바이트 규모의 데이터를 빠르고 쉽고 비용 효율적으로 분석할 수 있습니다. 이 솔루션은 병렬 실행, 압축된 컬럼 방식 스토리지, 종단 간 암호화 등과 같은 고급 데이터 웨어하우징 기능을 종합 관리형 서비스로 제공합니다. 비용은 TB당 연간 $1,000 미만입니다. Amazon Redshift Spectrum을 사용하면 Amazon S3에서 엑사바이트 규모의 비정형 데이터에 대해 SQL 쿼리를 직접 실행할 수 있습니다. […]
Amazon Redshift Spectrum – S3 데이터에 대한 엑사바이트(Exabyte)급 질의 수행 서비스
이제 몇 번의 클릭만으로 클라우드 기반 컴퓨팅 및 스토리지 리소스를 시작할 수 있게 되었기 때문에, 이러한 리소스를 사용하여 초기 데이터에서 실행 가능한 결과로 최대한 신속하고 효율적으로 이동해야합니다. Amazon Redshift를 사용하면 다양한 내부 및 외부 소스의 데이터를 통합하는 페타 바이트 규모의 데이터웨어 하우스를 구축 할 수 있습니다. Redshift는 대형 테이블에서 복잡한 조인(Join, 여러 조인이 수반되는 경우가 […]
Amazon Redshift 쿼리 캐싱을 위해 pgpool 및 Amazon ElastiCache 사용
최근 국내의 많은 고객 분들이 Amazon Redshift 도입을 고려하고 계시거나, 또는 이미 도입하여 사용하고 계십니다. OLTP 뿐만 아니라 데이터 웨어하우스 시스템에서도 쿼리 캐싱은 전체적인 사용자 체감 속도를 개선할 수 있는 아주 좋은 방법입니다. 쿼리 캐싱을 위한 다양한 방법이 있겠지만, pgpool 및 Amazon ElastiCache 사용에 대한 좋은 블로그 글이 있어 소개하도록 하겠습니다. 원문은 Using pgpool and […]
Amazon Redshift 를 위한 10가지 성능 튜닝 기법
최근 국내의 많은 고객 분들이 Amazon Redshift 도입을 고려하고 계시거나, 또는 이미 도입하여 사용하고 계십니다. 도입 전, PoC(Proof of Concept) 등의 과정을 통해서 기존 업무와의 호환성 또는 원하는 성능에 대한 평가 등을 하신 후에 사용하고 계시겠지만, 제목과 같이 Redshift 의 성능 튜닝에 도움이 될 수 있는 내용을 다시 한번 살펴보시라는 의미에서, 좋은 블로그 포스트를 번역하여 […]
Amazon Redshift에서 빠르게 데이터 로딩하기
Amazon Redshift는 페타바이트급의 데이터를 빠르고 저렴하고 간단하게 분석할 수 있는 클라우드 기반 데이터 웨어하우스(DW)서비스입니다. 병렬 실행, 압축 스토리지, 암호화 등 다양한 매니지드 서비스를 제공합니다. Amazon Redshift의 데이터 활용 크기는 160GB의 클러스터로 부터 1,000/TB/Year의 페타바이트급 대량 데이터를 다루는데 적합합니다. 우선 DW에서 데이터 로딩의 특성에 대해 살펴보겠습니다. 일반적으로 DW는 하나 이상의 서로 다른 데이터 소스에서 수집된 데이터의 […]