AWS에서는 사실상 어떤 빅 데이터 애플리케이션이든 구축할 수 있습니다. 다음은 기업이 AWS를 사용하여 빅 데이터에서 가치를 확보하는 방법에 대한 일부 예입니다.


AWS에서는 전체 분석 애플리케이션을 구축하여 비즈니스를 지원할 수 있습니다. 몇 분 만에 0개에서 수천 개의 서버로 하둡 클러스터를 확장하고 작업이 완료되면 이를 종료할 수 있습니다. 다시 말해 더 짧은 시간에 더 저렴한 비용을 빅 데이터 워크로드를 처리할 수 있습니다.

Redfin은 수백만 명의 주택 구매자에게 부동산 목록과 추천 정보를 제공합니다. Redfin은 매일 스팟 인스턴스로 Amazon EMR을 실행하여, 즉 동적으로 Apache 하둡 클러스터를 가동 및 제거하여 대규모 데이터 변환 작업을 수행하고 데이터를 내부 및 외부 고객에게 제공합니다. 동영상 보기 »


고객의 디지털 경험을 개선하고 웹 사이트에 대한 이해도를 높입니다. AWS를 통해 실시간으로 클릭스트림을 수집, 처리 및 분석하고 통찰력을 시각화할 수 있습니다.

Hearst Corporation은 전 세계 250개의 디지털 자산에 대한 인기 콘텐츠를 모니터링하고 매일 30TB가 넘는 데이터를 처리합니다. Hearst Corporation은 Amazon Kinesis, Amazon EMR에서 구동되는 Spark 등의 아키텍처를 사용하여 데이터 과학자와 비즈니스 이해 관계자에게 실시간 통찰력을 제공합니다. 동영상 보기 »


AWS Lambda를 사용하면 새로운 데이터에 대한 데이터 변환 작업(필터링, 정렬, 조인, 집계 등)을 수행하고, 대화식 쿼리 및 분석을 위해 변환된 데이터 세트를 Amazon Redshift로 로드할 수 있습니다.

Zillow는 AWS Lambda와 Amazon Kinesis를 사용하여 인프라를 구축하지 않고도 글로벌 수집 파이프라인을 관리하고 실시간으로 품질 분석을 수행합니다. re:Invent 프레젠테이션 보기 »


Amazon Machine Learning을 사용하면 애플리케이션에 예측 기능을 손쉽게 추가할 수 있습니다. Amazon Kinesis의 역량을 조합하여 소셜 미디어 또는 다른 소스에서 실시간으로 데이터를 수집하고, Machine Learning을 사용하여 해당 데이터에 대한 예측을 생성합니다.

"Amazon Machine Learning은 예측 모델을 구축하는 프로세스를 누구나 사용할 수 있게 해줍니다. 사용이 빠르고 간편하며, 제품에 기계 학습 모범 사례가 캡슐화되어 있어 이전보다 훨씬 더 빠르게 결과를 제공할 수 있게 되었습니다."
고객 사례 읽어보기 »


AWS 클라우드에 데이터 웨어하우징 아키텍처를 배포하여 쿼리 성능을 최적화하고 비용을 절감하세요. Amazon EMR을 사용하면 Apache 하둡 프레임워크의 역량을 활용하여 데이터 변환 작업(ETL)을 수행하고, 분석 및 비즈니스 인텔리전스 애플리케이션을 위해 처리된 데이터를 Amazon Redshift로 로드할 수 있습니다.

Nasdaq에서는 Amazon Redshift로 이전하고 ETL에 Amazon EMR을 사용함으로써, 더 빠르고 풍부한 분석 및 데이터 웨어하우징 기능을 실현하고 이와 동시에 비용을 57% 절감했습니다.
re:Invent 프레젠테이션 보기 »