Data Lake2 [DB] Data Lake vs Data Warehouse 비교 - Big Data 를 위한 Storage Repository [Data Lake] - 딱히 Data Model 없음. 그냥 모든 Raw Data 끌어옴. - Data 수집 Time 에 지연이 없음. 어떤 조건이나 Filtering 이 없으므로. - 대규모 Data 용량이지만 상용 Hardware 를 자주 사용하기에, Data Warehouse 보다 Cost 가 저렴. [Data Warehouse] - Report(보고) 를 위해 설계된 구조적 Data Model 을 제공. - Data 를 Data Warehouse 에 저장하기 전, Data를 정제하는 Process는 시간이 오래 걸릴 수 있음(몇 개월~몇 년) ==> Data Lake 처럼 즉시 Data 수집 불가. - Data 저장 Cost가 상당할.. 2022. 12. 14. [DB] Data Lake (데이터 레이크) - 대규모의 다양한 Raw-Data(원시 데이터) 집합체를 기본 형식으로 저장하는 Data 저장소 유형. @@ Raw-Data : 특정 목적을 위해 처리되지 않은 Data - 구조화, 반구조화, 구조화 되지 않은 대량의 Data 를 저장&처리&보호하기 위한 중앙 집중식 저장소. - Data 를 기본 형식으로 저장 가능하며, 크기 제한을 무시하고 다양한 Data 처리 가능. - Data Lake에 있는 Data 는 Query 되기 전까지 정의되지 않음. - Data Lake 를 통해 모든 Data 가 보존되며, Storage에 저장하기 전에 제거 및 필터링되지 않음. - 확장성 & 안정성 있는 Platform 제공 - On-premise, Cloud, Edge-Computing 등을 가리지 않고 모든 Sy.. 2022. 12. 12. 이전 1 다음