Amazon Web Services 한국 블로그

Category: Amazon Redshift

Amazon Redshift ML 정식 출시 – SQL기반 기계 학습 모델 생성 및 예측 수행 (서울 리전 포함)

Amazon Redshift를 사용하면 SQL로 엑사바이트의 구조적 및 반구조화된 데이터를 데이터 웨어하우스, 운영 데이터베이스및 데이터 레이크 전반에서 쿼리하고 결합할 수 있습니다. 이제 AQUA (고급 쿼리 가속기) 를 일반적으로 사용할 수 있으므로 추가 비용 및 코드 변경 없이 쿼리 성능을 최대 10배까지 향상시킬 수 있습니다. 실제로 Amazon Redshift는 다른 클라우드 데이터 웨어하우스보다 최대 3배 향상된 가격 대비 […]

AQUA(Advanced Query Accelerator) 정식 출시 – Amazon Redshift 쿼리 속도 향상

Amazon Redshift는 이미 다른 클라우드 데이터 웨어하우스보다 규모에 관계없이 최대 3배 향상된 가성비를 제공합니다. 우리는 자체 하드웨어를 설계하고 기계 학습(ML)을 사용하여 이를 수행합니다. 예를 들어 2019년 말에 Amazon Redshift용 SSD 기반 RA3 노드를 시작했으며(Amazon Redshift 업데이트 – 차세대 컴퓨팅 인스턴스 및 관리형 분석 최적화 스토리지), 지난 4월(Amazon Redshift 업데이트 – ra3.4xlarge 노드) 및 지난 12월(Amazon […]

Amazon Redshift, ra3.4xlarge 인스턴스 추가 업데이트 (서울 리전 포함)

Amazon Redshift를 클라우드 데이터 웨어하우스 서비스로 출시한 이후로 수만 명의 고객이 이를 사용하여 워크로드를 구축했습니다.  지난해 12월에는 3세대 RA3 노드 유형을 정식 출시하여 컴퓨팅 및 스토리지를 따로 확장하는 기능을 제공하기 시작했습니다. 이전 세대의 DS2 및 DC2 노드는 스토리지 용량이 고정되어 있어서 스토리지 용량을 늘리려면 더 많은 노드를 추가해야 했습니다. 새로운 RA3 노드에서는 워크로드를 지원하는 데 […]

쿼리 실행의 속도를 높여 주는 Amazon Redshift 구체화 보기 기능 출시

Amazon Redshift에서는 테이블에서 질의한 보기(View)는 Amazon QuickSight 또는 Tableau 같은 BI(비즈니스 인텔리전스) 도구를 위해 사용할 수 있습니다. 다만,  사용 편의성과 유연성을 제공하지만 데이터 액세스의 속도를 높여 주지 않습니다. 성능이 중요한 경우, 데이터 엔지니어는 CTAS(create table as)를 사용합니다. CTAS는 질의에 의해 정의된 테이블입니다. 질의는 테이블 생성 시점에 실행되며 애플리케이션은 CTAS를 일반 테이블과 같이 사용할 수 있습니다. […]

클라우드 기술의 5가지 주요 흐름 – 2019년 회고

이제 2019년도 하루 밖에 남지 않았네요! 매년 해왔던 블로그 회고 (2015년, 2016년, 2017년, 2018년)의 일환으로 이번에는 한해 동안 클라우드 기술의 흐름이 어떻게 변화했는지 살펴보고자 합니다. 제가 지난 5년간 AWS에서 일하면서, 올해 개인적으로 중요하다고 생각된 것들을 뽑아 보았는데, 혹시 내년에 여러분의 기술 자산을 채우기 위한 목표를 세운다면 어느 분야에 집중하면 좋을지 실마리가 되길 바랍니다. 1. 클라우드 […]

Amazon Redshift – 데이터 레이크 내보내기 및 통합 질의 기능 출시 (서울 리전 포함)

데이터 웨어하우스는 트랜잭션 시스템 및 업무용 애플리케이션에서 생성되는 관계형 데이터를 분석하는 데 최적화된 데이터베이스입니다. Amazon Redshift는 표준 SQL과 기존 BI(비즈니스 인텔리전스) 도구를 사용하여 데이터를 간편하고 비용 효율적으로 분석할 수 있는 완전 관리형 데이터 웨어하우스입니다. 데이터 웨어하우스에 맞지 않는 구조화되지 않은 데이터로부터 정보를 얻으려면 데이터 레이크를 빌드할 수 있습니다. 데이터 레이크는 구조화된 데이터와 구조화되지 않은 데이터 모두 […]

Amazon Redshift 업데이트 – 차세대 컴퓨팅 인스턴스(RA3)와 관리형 분석 최적화 스토리지 출시 (서울 리전 포함)

Amazon Redshift는 2012년에 출시된 전 세계에서 가장 인기 있는 클라우드 기반 데이터 웨어하우스입니다. 빠른 성능, 복잡한 쿼리에 대한 지원 및 트랜잭션 기능을 업계 최고의 가성비로 제공하여 꾸준한 사랑을 받고 있습니다. 원래 Redshift 모델은 컴퓨팅 파워와 스토리지 용량이 꽤 긴밀하게 연결됩니다. 특정 수의 인스턴스로 클러스터를 생성하면 각 인스턴스가 제공하는 로컬 스토리지의 양을 약정에 따라 사용하게 됩니다(경우에 […]

Amazon Redshift 동시성 확장(Concurrent Scaling) 기능 출시

Amazon Redshift는 엑사바이트 규모까지 확장이 가능한 데이터 웨어하우스입니다. 현재 NTT DOCOMO, Finra 및 Johnson & Johnson을 비롯한 수많은 AWS 고객이 Redshift를 사용하여 미션 크리티컬 BI 대시보드를 실행하고 실시간 스트리밍 데이터를 분석하고 예측 분석 작업을 실행합니다. 그런데, 문제는 사용자 피크 시간에 동시 쿼리의 수가 증가할 때 발생합니다. 다수의 비즈니스 분석가가 모두 BI 대시보드로 이동하거나 오래 실행되는 […]

Amazon Redshift Spectrum에 대한 10가지 모범 사례

지난 4월 Amazon Redshift Spectrum 출시 이후, 이번 주에는 서울 리전에도 출시하였습니다. 이 글에서는 한국 고객 분들이 Redshift Specturm을 더 잘 활용하기 위한 10가지 모범 사례를 전달해 드립니다. Amazon Redshift Spectrum 을 사용하면 Amazon S3에 저장된 데이터에 대해 Amazon Redshif SQL 쿼리를 실행할 수 있습니다.  즉, Amazon Redshift의 분석 기능을 데이터웨어 하우스(DW) 내 로컬 디스크에 […]

Amazon Redshift, 비용 최적 고밀도 컴퓨팅(DC2) 노드 활용하기

Amazon Redshift를 사용하면 엑사바이트 규모의 데이터를 빠르고 쉽고 비용 효율적으로 분석할 수 있습니다. 이 솔루션은 병렬 실행, 압축된 컬럼 방식 스토리지, 종단 간 암호화 등과 같은 고급 데이터 웨어하우징 기능을 종합 관리형 서비스로 제공합니다. 비용은 TB당 연간 $1,000 미만입니다. Amazon Redshift Spectrum을 사용하면 Amazon S3에서 엑사바이트 규모의 비정형 데이터에 대해 SQL 쿼리를 직접 실행할 수 있습니다. […]