본문 바로가기

Programing/DB24

[DB] Data Lake vs Data Warehouse 비교 - Big Data 를 위한 Storage Repository [Data Lake] - 딱히 Data Model 없음. 그냥 모든 Raw Data 끌어옴. - Data 수집 Time 에 지연이 없음. 어떤 조건이나 Filtering 이 없으므로. - 대규모 Data 용량이지만 상용 Hardware 를 자주 사용하기에, Data Warehouse 보다 Cost 가 저렴. [Data Warehouse] - Report(보고) 를 위해 설계된 구조적 Data Model 을 제공. - Data 를 Data Warehouse 에 저장하기 전, Data를 정제하는 Process는 시간이 오래 걸릴 수 있음(몇 개월~몇 년) ==> Data Lake 처럼 즉시 Data 수집 불가. - Data 저장 Cost가 상당할.. 2022. 12. 14.
[DB] Data Warehouse - 보다 Information 에 입각한 의사 결정을 내리도록 분석하게 하는 Information 중앙 저장소. - Data 는 Transaction System, 관계형 Database 등을 통해 정기적으로 DW (Data Warehouse) 에 들어감. - DW 는 Data 를 효율있게 저장하여 보고서&대시보드&분석도구 를 강화함. - Data I/O 를 최소화하고 수 만명이 될 수도 있는 User 에게 Query 를 동시에 빠르게 제공. - 대체로 월별 판매 보고서, 직역별 판매 내역, 웹사이트 Traffic 같은 Business 에서 주로 쓰이는 반복적 보고 및 분석 유형에 적합 - Information 에 기반한 의사 결정 - 여러 Source 의 Data 통합 - 과거 Data 분석 - Dat.. 2022. 12. 13.
[DB] Data Lake (데이터 레이크) - 대규모의 다양한 Raw-Data(원시 데이터) 집합체를 기본 형식으로 저장하는 Data 저장소 유형. @@ Raw-Data : 특정 목적을 위해 처리되지 않은 Data - 구조화, 반구조화, 구조화 되지 않은 대량의 Data 를 저장&처리&보호하기 위한 중앙 집중식 저장소. - Data 를 기본 형식으로 저장 가능하며, 크기 제한을 무시하고 다양한 Data 처리 가능. - Data Lake에 있는 Data 는 Query 되기 전까지 정의되지 않음. - Data Lake 를 통해 모든 Data 가 보존되며, Storage에 저장하기 전에 제거 및 필터링되지 않음. - 확장성 & 안정성 있는 Platform 제공 - On-premise, Cloud, Edge-Computing 등을 가리지 않고 모든 Sy.. 2022. 12. 12.
[MySQL] Stored Program - Database Server 내에 저장 및 실행되는 Computer Program. ==> Source Code 와 (종종) Stored Program의 Compile 버전이 거의 항상 Database Server System Table에 보관됨. ==> Database Server의 Process 혹은 Thread 의 메모리 주소 안에서 Program이 실행됨. - 종종 Stored Module 혹은 Stored Routine 으로 불림. - Stored Procedure, Stored Function, Trigger 등을 아우르는 상위 개념. 1) Stored Procedures - Stored Program 에서 가장 흔한 Type. - 요청시 실행되며 또한 여러 번의 Input/Output P.. 2022. 12. 5.