본문 바로가기
Programing/DB

[DB] Data Warehouse

by 꾸압 2022. 12. 13.

 

<설명>

  - 보다 Information 에 입각한 의사 결정을 내리도록 분석하게 하는 Information 중앙 저장소.

  - Data 는 Transaction System, 관계형 Database 등을 통해 정기적으로 DW (Data Warehouse) 에 들어감.

 

  - DW 는 Data 를 효율있게 저장하여 보고서&대시보드&분석도구 를 강화함.

  - Data I/O 를 최소화하고 수 만명이 될 수도 있는 User 에게 Query 를 동시에 빠르게 제공.

 

  - 대체로 월별 판매 보고서, 직역별 판매 내역, 웹사이트 Traffic 같은 Business 에서 주로 쓰이는 반복적 보고 및 분석 유형에 적합

 


 

<DW 이점>

  - Information 에 기반한 의사 결정

  - 여러 Source 의 Data 통합

  - 과거 Data 분석

  - Data 품질 & 일관성 & 정확성 증가

  - Transaction Database와 분석 처리를 분리하여, 두 System 모두 성능을 향상

 


 

<Data Warehouse 와 Transaction Database 비교>

특징 Data Warehouse Transaction Database
적합한 Workload 분석 & 보고 & Big-Data Transaction 처리
Data 원본 여러 Source 에서 수집 및 정규화된 Data Transaction System과 같이 단일 Source에 있는 그대로 Capture 한 Data
Data Capture 대개 미리 결정된 대량 Batch 일정에
따른 대량 Write 작업
Transaction 처리량을 최대화하도록
새로운 Data가 사용 가능해져서
연속적인 Write 작업에 최적화
Data 정규화 Star Schema & Snow-Flake Schema 같은
비정규 Schema
고도로 정규화된 정적 Schema
Data Storage Column 방식 Storage 를 사용하여
간단한 Access 및 고속 Query 성능에 최적화.
단일 행 지향적 Physic Block에 대한
고도의 처리량 Write 작업에 최적화.
Data Access I/O 를 가장 적게,
Data 처리량은 가장 많이 하도록 최적화
대량의 소규모 Write 작업

 


 

<참조 1> https://www.redhat.com/ko/topics/data-storage/what-is-a-data-lake

<참조 2> https://aws.amazon.com/ko/data-warehouse/

<참조 3>

 

 

'Programing > DB' 카테고리의 다른 글

[DB] Hadoop (하둡)  (0) 2022.12.15
[DB] Data Lake vs Data Warehouse 비교  (0) 2022.12.14
[DB] Data Lake (데이터 레이크)  (0) 2022.12.12
[MySQL] Stored Program  (0) 2022.12.05

댓글