온라인 분석 처리란 무엇인가요?
온라인 분석 처리(OLAP)는 다양한 관점에서 비즈니스 데이터를 분석하는 데 사용할 수 있는 소프트웨어 기술입니다. 조직은 웹 사이트, 애플리케이션, 스마트 미터 및 내부 시스템과 같은 여러 데이터 소스에서 데이터를 수집하고 저장합니다. OLAP는 이 데이터를 범주로 결합하고 그룹화하여 전략 계획을 위한 실행 가능한 통찰력을 제공합니다. 예를 들어 소매업체는 색상, 크기, 비용, 위치 등 판매하는 모든 제품에 대한 데이터를 저장합니다. 소매업체는 또한 다른 시스템에서 주문한 품목의 이름 및 총 판매액과 같은 고객 구매 데이터를 수집합니다. OLAP는 데이터 세트를 결합하여 어떤 색상 제품이 더 인기가 있는지 또는 제품 배치가 판매에 미치는 영향과 같은 질문에 답합니다.
OLAP이 중요한 이유는 무엇인가요?
온라인 분석 처리(OLAP)를 통해 조직은 증가하는 디지털 정보를 처리하고 이점을 누릴 수 있습니다. OLAP의 몇 가지 이점은 다음과 같습니다.
더 빠른 의사 결정
기업은 급변하는 경제에서 경쟁력을 유지하기 위해 OLAP를 사용하여 빠르고 정확한 결정을 내립니다. 여러 관계형 데이터베이스에서 분석 쿼리를 수행하는 것은 컴퓨터 시스템이 여러 데이터 테이블을 검색하기 때문에 시간이 많이 걸립니다. 반면 OLAP 시스템은 데이터를 미리 계산하고 통합하므로 비즈니스 분석가는 필요할 때 더 빠르게 보고서를 생성할 수 있습니다.
기술 지식이 없는 사용자 지원
OLAP 시스템을 사용하면 기술 지식이 없는 비즈니스 사용자가 복잡한 데이터를 더 쉽게 분석할 수 있습니다. 비즈니스 사용자는 데이터베이스 운영 방법을 배우는 대신 복잡한 분석 계산을 만들고 보고서를 생성할 수 있습니다.
통합 데이터 보기
OLAP는 마케팅, 재무, 생산 및 기타 사업부를 위한 통합 플랫폼을 제공합니다. 관리자와 의사 결정권자는 더 큰 그림을 보고 문제를 효과적으로 해결할 수 있습니다. 한 부서에서 내린 결정이 비즈니스의 다른 영역에 미치는 영향을 보여주는 가정(what-if) 분석을 수행할 수 있습니다.
OLAP 아키텍처란 무엇인가요?
온라인 분석 처리(OLAP) 시스템은 2개 이상의 차원 또는 범주로 정보를 표현하여 다차원 데이터를 저장합니다. 2차원 데이터에는 열과 행이 포함되지만 다차원 데이터에는 여러 특성이 있습니다. 예를 들어, 제품 판매에 대한 다차원 데이터는 다음과 같은 차원으로 구성될 수 있습니다.
- 제품 유형
- 위치
- 시간
데이터 엔지니어는 다음 요소로 구성된 다차원 OLAP 시스템을 빌드합니다.
데이터 웨어하우스
데이터 웨어하우스는 애플리케이션, 파일 및 데이터베이스를 비롯한 다양한 소스에서 정보를 수집합니다. 분석 목적으로 데이터를 준비할 수 있도록 다양한 도구를 사용하여 정보를 처리합니다. 예를 들어, 데이터 웨어하우스는 행과 열의 테이블에 데이터를 저장하는 관계형 데이터베이스에서 정보를 수집할 수 있습니다.
ETL 도구
추출, 전환, 적재(ETL) 도구는 분석 목적에 맞는 형식으로 데이터를 자동으로 검색, 변경 및 준비하는 데이터베이스 프로세스입니다. 데이터 웨어하우스는 OLAP 도구에서 사용할 수 있도록 다양한 소스의 정보를 ETL로 변환하고 표준화합니다.
OLAP 서버
OLAP 서버는 OLAP 시스템을 구동하는 기본 시스템입니다. ETL 도구로 관계형 데이터베이스의 정보를 변환하고 OLAP 작업을 위해 준비합니다.
OLAP 데이터베이스
OLAP 데이터베이스는 데이터 웨어하우스에 연결되는 별도의 데이터베이스입니다. OLAP 분석이 데이터 웨어하우스에 부담을 주지 않도록 OLAP 데이터베이스를 사용하는 경우가 많습니다. OLAP 데이터 모델을 더 쉽게 만들기 위해 OLAP 데이터베이스를 사용하기도 합니다.
OLAP 큐브
데이터 큐브는 정보의 다차원 배열을 나타내는 모델입니다. 3차원 데이터 모델로 시각화하는 것이 더 쉽지만 대부분의 데이터 큐브에는 3개가 넘는 차원이 있습니다. OLAP 큐브 또는 하이퍼큐브는 OLAP 시스템에서 데이터 큐브를 나타내는 용어입니다. OLAP 큐브는 일단 모델링하면 차원과 기본 데이터를 변경할 수 없기 때문에 고정적입니다. 예를 들어, 제품, 위치 및 시간 차원이 있는 큐브에 웨어하우스 차원을 추가하는 경우 전체 큐브를 다시 모델링해야 합니다.
OLAP 분석 도구
비즈니스 분석가는 OLAP 도구를 사용하여 OLAP 큐브와 상호 작용합니다. 슬라이싱, 다이싱 및 피벗과 같은 작업을 수행하여 OLAP 큐브 내의 특정 정보에 대한 심층적인 인사이트를 얻습니다.
OLAP은 어떻게 작동하나요?
OLAP은 어떻게 작동하나요?
온라인 분석 처리(OLAP) 시스템은 다음 단계에 따라 데이터를 수집, 구성, 집계 및 분석하여 작동합니다.
- OLAP 서버가 관계형 데이터베이스 및 데이터 웨어하우스를 포함한 여러 데이터 소스에서 데이터를 수집합니다.
- 그런 다음 추출, 전환, 적재(ETL) 도구가 지정된 차원 수에 따라 OLAP 큐브에서 데이터를 정리, 집계, 사전 계산 및 저장합니다.
- 비즈니스 분석가는 OLAP 도구를 사용하여 OLAP 큐브의 다차원 데이터에서 보고서를 쿼리하고 생성합니다.
OLAP은 MDX(Multidimensional Expressions)를 사용하여 OLAP 큐브를 쿼리합니다. MDX는 데이터베이스 조작을 위한 일련의 지침을 제공하는 SQL과 같은 쿼리입니다.
OLAP 유형으로 무엇이 있나요?
온라인 분석 처리(OLAP) 시스템은 3가지 주요 방식으로 작동합니다.
MOLAP
다차원 온라인 분석 처리(MOLAP)에는 데이터 웨어하우스의 다차원 데이터를 나타내는 데이터 큐브를 만드는 작업이 포함됩니다. MOLAP 시스템은 미리 계산된 데이터를 하이퍼큐브에 저장합니다. 이러한 유형의 OLAP 기술은 빠른 분석을 제공하기 때문에 데이터 엔지니어는 MOLAP을 사용합니다.
ROLAP
데이터 엔지니어는 데이터 큐브를 사용하는 대신 관계형 온라인 분석 처리(ROLAP)를 사용하여 관계형 데이터베이스에서 다차원 데이터 분석을 수행할 수 있습니다. 즉, 데이터 엔지니어는 SQL 쿼리를 사용하여 필요한 차원을 기반으로 특정 정보를 검색하고 검색합니다. ROLAP은 광범위하고 상세한 데이터를 분석하는 데 적합합니다. 그러나 ROLAP은 MOLAP에 비해 쿼리 성능이 느립니다.
HOLAP
하이브리드 온라인 분석 처리(HOLAP)는 MOLAP과 ROLAP을 결합하여 두 아키텍처의 장점을 모두 제공합니다. HOLAP을 사용하면 데이터 엔지니어가 데이터 큐브에서 분석 결과를 신속하게 검색하고 관계형 데이터베이스에서 자세한 정보를 추출할 수 있습니다.
OLAP에서 데이터 모델링이란 무엇인가요?
데이터 모델링은 데이터 웨어하우스 또는 온라인 분석 처리(OLAP) 데이터베이스의 데이터 표현입니다. 데이터 모델링은 관계형 데이터베이스에서 직접 데이터를 분석하기 때문에 관계형 온라인 분석 처리(ROLAP)에서 필수적입니다. 다차원 데이터를 스타 또는 눈송이 스키마로 저장합니다.
스타 스키마
스타 스키마는 팩트 테이블과 여러 차원 테이블로 구성됩니다. 팩트 테이블은 비즈니스 프로세스와 관련된 숫자 값을 포함하는 데이터 테이블이며 차원 테이블에는 팩트 테이블의 각 속성을 설명하는 값이 들어 있습니다. 팩트 테이블은 차원 테이블의 각 정보와 상관 관계가 있는 고유 식별자인 외래 키가 있는 차원 테이블을 참조합니다.
스타 스키마에서 팩트 테이블은 여러 차원 테이블에 연결되므로 데이터 모델이 스타, 즉 별 모양입니다. 다음은 제품 판매에 대한 팩트 테이블의 예제입니다.
- 제품 ID
- 위치 ID
- Salesperson ID
- 판매 금액
제품 ID는 데이터베이스 시스템으로 하여금 다음과 같이 구성된 제품 차원 테이블에서 정보를 검색하도록 합니다.
- 제품 ID
- 제품 이름
- 제품 유형
- 제품 비용
마찬가지로 위치 ID는 다음과 같이 구성될 수 있는 위치 차원 테이블을 가리킵니다.
- 위치 ID
- 국가
- 구/군/시
판매 사원 테이블은 다음과 같이 구성될 수 있습니다.
- Salesperson ID
- 이름
- 성
- 이메일
눈송이 스키마
눈송이 스키마는 스타 스키마의 확장입니다. 일부 차원 테이블은 하나 이상의 보조 차원 테이블로 이어질 수 있습니다. 그 결과 차원 테이블을 합치면 눈송이 모양이 됩니다.
예를 들어, 제품 차원 테이블에는 다음 필드가 포함될 수 있습니다.
- 제품 ID
- 제품 이름
- 제품 유형 ID
- 제품 비용
제품 유형 ID는 다음 예와 같은 다른 차원 테이블에 연결됩니다.
- 제품 유형 ID
- 유형 이름
- 버전
- 변형
OLAP 작업이란 무엇인가요?
비즈니스 분석가는 다차원 온라인 분석 처리(MOLAP) 큐브를 사용하여 몇 가지 기본 분석 작업을 수행합니다.
롤업
롤업에서 온라인 분석 처리(OLAP) 시스템은 특정 속성에 대한 데이터를 요약합니다. 즉, 덜 상세한 데이터를 보여줍니다. 예를 들어, 뉴욕, 캘리포니아, 런던 및 도쿄에 따른 제품 판매를 볼 수 있습니다. 롤업 작업은 미국, 영국 및 일본과 같은 국가를 기반으로 한 판매 데이터 보기를 제공합니다.
드릴다운
드릴다운은 롤업 작업의 반대입니다. 비즈니스 분석가는 개념 계층 구조에서 아래로 이동하여 필요한 세부 정보를 추출합니다. 예를 들어, 연도별 판매 데이터 보기에서 월별 시각화로 이동할 수 있습니다.
슬라이스
데이터 엔지니어는 슬라이스 작업을 사용하여 OLAP 큐브에서 2차원 보기를 만듭니다. 예를 들어, MOLAP 큐브는 제품, 도시 및 월에 따라 데이터를 정렬합니다. 데이터 엔지니어는 큐브를 분할하여 특정 월의 제품 및 도시로 구성된 스프레드시트와 같은 테이블을 만들 수 있습니다.
주사위
데이터 엔지니어는 주사위 연산을 사용하여 OLAP 큐브에서 더 작은 하위 큐브를 만듭니다. 필요한 차원을 결정하고 원래 하이퍼큐브에서 더 작은 큐브를 만듭니다.
피벗
피벗 작업에는 OLAP 큐브를 해당 차원 중 하나를 따라 회전하여 다차원 데이터 모델에 대한 다른 관점을 얻는 작업이 포함됩니다. 예를 들어, 3차원 OLAP 큐브의 각 축에는 다음 차원이 있습니다.
- X축 - 제품
- Y축 - 위치
- Z축 - 시간
피벗 시 OLAP 큐브는 다음과 같이 구성됩니다.
- X축 - 위치
- Y축 - 시간
- Z축 - 제품
OLAP은 다른 데이터 분석 방법과 비교하여 어떤가요?
데이터 마이닝
데이터 마이닝은 패턴과 인사이트를 찾기 위해 대량의 기록 데이터를 처리하는 분석 기술입니다. 비즈니스 분석가는 데이터 마이닝 도구를 사용하여 데이터 내의 관계를 발견하고 미래 추세를 정확하게 예측합니다.
OLAP 및 데이터 마이닝
온라인 분석 처리(OLAP)는 요약 데이터를 쿼리, 추출 및 연구하는 데이터베이스 분석 기술입니다. 반면에 데이터 마이닝에는 처리되지 않은 정보를 심층적으로 조사하는 작업이 포함됩니다. 예를 들어, 마케팅 담당자는 데이터 마이닝 도구를 사용하여 모든 웹 사이트 방문 레코드에서 사용자 행동을 분석할 수 있습니다. 그런 다음 OLAP 소프트웨어를 사용하여 기간, 디바이스, 국가, 언어 및 브라우저 유형과 같은 다양한 각도에서 이러한 동작을 검사할 수 있습니다.
OLTP
온라인 트랜잭션 처리(OLTP)는 데이터베이스에 정보를 빠르고 안정적으로 저장하는 데이터 기술입니다. 데이터 엔지니어는 OLTP 도구를 사용하여 재무 레코드, 서비스 구독 및 고객 피드백과 같은 트랜잭션 데이터를 관계형 데이터베이스에 저장합니다. OLTP 시스템은 관계형 테이블의 레코드 생성, 업데이트 및 삭제를 필요로 합니다.
OLAP 및 OLTP
OLTP는 데이터베이스에서 여러 트랜잭션 스트림을 처리하고 저장하는 데 적합합니다. 그러나 데이터베이스에서 복잡한 쿼리를 수행할 수는 없습니다. 따라서 비즈니스 분석가는 OLAP 시스템을 사용하여 다차원 데이터를 분석합니다. 예를 들어, 데이터 사이언티스트는 OLTP 데이터베이스를 클라우드 기반 OLAP 큐브에 연결하여 기록 데이터에 대해 컴퓨팅 집약적 쿼리를 수행합니다.
AWS는 OLAP에 관해 어떤 도움을 줄 수 있나요?
AWS 데이터베이스는 조직이 온라인 분석 처리(OLAP) 작업을 저장하고 수행하는 데 도움이 되는 다양한 관리형 클라우드 데이터베이스를 제공합니다. 데이터 분석가는 AWS 데이터베이스를 사용하여 조직의 요구 사항에 맞는 안전한 데이터베이스를 빌드합니다. 조직은 경제성과 확장성 때문에 비즈니스 데이터를 AWS 데이터베이스로 마이그레이션합니다.
- Amazon Redshift는 온라인 분석 처리를 위해 특별히 설계된 클라우드 데이터 웨어하우스입니다.
- Amazon Relational Database Service(Amazon RDS)는 OLAP 기능을 갖춘 관계형 데이터베이스입니다. 데이터 엔지니어는 Oracle OLAP과 함께 Amazon RDS를 사용하여 차원 큐브에 대한 복잡한 쿼리를 수행합니다.
- Amazon Aurora는 MySQL 및 PostgreSQL과 호환되는 클라우드 관계형 데이터베이스입니다. 복잡한 OLAP 워크로드 실행에 최적화되어 있습니다.
지금 AWS 계정을 만들어 OLAP on AWS를 시작하세요.