Ein Data Lake ist ein einziger Speicher für alle Unternehmensdaten. Die Daten werden zunächst in ihrem Rohformat, in einer flachen und unbearbeiteten Struktur. Dadurch kann nahezu eine beliebige Menge von Daten in dem Data Lake gespeichert werden. Die Daten werden erst in ein anderes Format umgewandelt, wenn sie verwendet werden. Im Gegensatz zum Data-Lake-Konzept, bei dem alle Daten aus den Quellsystemen geladen werden, werden beim Data-Warehouse-Konzept bestimmte Daten nach dem ETL-Schema aus den Quellsystemen extrahiert, transformiert und in das zentrale Data Warehouse geladen. Durch die Art, wie die Daten gespeichert werden, ist die Speicherung der Daten in einem Data Lake, im Vergleich zum Data Warehouse, kostengünstiger.

Zurück zum Glossar