<설명>
- 보다 Information 에 입각한 의사 결정을 내리도록 분석하게 하는 Information 중앙 저장소.
- Data 는 Transaction System, 관계형 Database 등을 통해 정기적으로 DW (Data Warehouse) 에 들어감.
- DW 는 Data 를 효율있게 저장하여 보고서&대시보드&분석도구 를 강화함.
- Data I/O 를 최소화하고 수 만명이 될 수도 있는 User 에게 Query 를 동시에 빠르게 제공.
- 대체로 월별 판매 보고서, 직역별 판매 내역, 웹사이트 Traffic 같은 Business 에서 주로 쓰이는 반복적 보고 및 분석 유형에 적합
<DW 이점>
- Information 에 기반한 의사 결정
- 여러 Source 의 Data 통합
- 과거 Data 분석
- Data 품질 & 일관성 & 정확성 증가
- Transaction Database와 분석 처리를 분리하여, 두 System 모두 성능을 향상
<Data Warehouse 와 Transaction Database 비교>
특징 | Data Warehouse | Transaction Database |
적합한 Workload | 분석 & 보고 & Big-Data | Transaction 처리 |
Data 원본 | 여러 Source 에서 수집 및 정규화된 Data | Transaction System과 같이 단일 Source에 있는 그대로 Capture 한 Data |
Data Capture | 대개 미리 결정된 대량 Batch 일정에 따른 대량 Write 작업 |
Transaction 처리량을 최대화하도록 새로운 Data가 사용 가능해져서 연속적인 Write 작업에 최적화 |
Data 정규화 | Star Schema & Snow-Flake Schema 같은 비정규 Schema |
고도로 정규화된 정적 Schema |
Data Storage | Column 방식 Storage 를 사용하여 간단한 Access 및 고속 Query 성능에 최적화. |
단일 행 지향적 Physic Block에 대한 고도의 처리량 Write 작업에 최적화. |
Data Access | I/O 를 가장 적게, Data 처리량은 가장 많이 하도록 최적화 |
대량의 소규모 Write 작업 |
<참조 1> https://www.redhat.com/ko/topics/data-storage/what-is-a-data-lake
<참조 2> https://aws.amazon.com/ko/data-warehouse/
<참조 3>
'Programing > DB' 카테고리의 다른 글
[DB] Hadoop (하둡) (0) | 2022.12.15 |
---|---|
[DB] Data Lake vs Data Warehouse 비교 (0) | 2022.12.14 |
[DB] Data Lake (데이터 레이크) (0) | 2022.12.12 |
[MySQL] Stored Program (0) | 2022.12.05 |
댓글