Amazon SageMaker Lakehouse

Analytik und KI mit einem einheitlichen, offenen und sicheren Data Lakehouse vereinfachen

Was ist SageMaker Lakehouse?

Amazon SageMaker Lakehouse vereinheitlicht all Ihre Daten aus Data Lakes von Amazon Simple Storage Service (Amazon S3) und Amazon Redshift Data Warehouses und hilft Ihnen so, leistungsstarke Analytik- und KI/ML-Anwendungen auf einer einzigen Datenkopie zu erstellen. SageMaker Lakehouse bietet Ihnen die Flexibilität, mit allen Apache-Iceberg-kompatiblen Tools und Engines direkt auf Ihre Daten zuzugreifen und diese abzufragen. Schützen Sie Ihre Daten im Lakehouse, indem Sie differenzierte Berechtigungen definieren, die in allen Tools und Engines für Analytik und Machine Learning (ML) durchgesetzt werden. Bringen Sie Daten aus Betriebsdatenbanken und Anwendungen durch Null-ETL-Integrationen nahezu in Echtzeit in Ihr Lakehouse. Darüber hinaus können Sie mit Verbundabfragefunktionen aus Datenquellen von Drittanbietern direkt auf Daten zugreifen und diese abfragen.

Vorteile

Vereinheitlichen Sie all Ihre Daten in Amazon S3 Data Lakes und Amazon Redshift Data Warehouses mit SageMaker Lakehouse. Bringen Sie Ihre Daten aus Betriebsdatenbanken und Anwendungen durch Null-ETL-Integrationen nahezu in Echtzeit in das Lakehouse. Sie können Hunderte von Konnektoren verwenden, um Daten aus verschiedenen Quellen zu integrieren. Darüber hinaus können Sie mit Verbundabfragefunktionen aus Datenquellen von Drittanbietern direkt auf Daten zugreifen und diese abfragen.
Mit allen Apache-Iceberg-kompatiblen Tools erhalten Sie die Flexibilität, direkt auf Ihre Daten zuzugreifen und diese abzufragen, und zwar auf einer einzigen Datenkopie. Sie können Analytik-Tools und Engines Ihrer Wahl wie SQL, Apache Spark, Business Intelligence (BI) und KI/ML-Tools verwenden und mit Daten zusammenarbeiten, die in Amazon S3 Data Lakes und Amazon Redshift Data Warehouses gespeichert sind. Verwenden Sie SageMaker Lakehouse mit Ihrer bestehenden Datenarchitektur ermöglichen Sie die Verwendung Ihrer bevorzugten Speicherformate und Abfrage-Engines, die mit Apache Iceberg kompatibel sind.
Schützen Sie Ihre Daten mit integrierten, differenzierten Zugriffskontrollen, die für all Ihre Daten in allen Analytik-Tools und Engines durchgesetzt werden. Definieren Sie Berechtigungen einmal und teilen Sie Daten vertrauensvoll in Ihrem Unternehmen.

Anwendungsfälle

Vereinheitlichen Sie all Ihre Daten in Amazon S3 Data Lakes und Amazon Redshift Data Warehouses für Ihre Analytik- und KI-Initiativen mit einer einzigen Datenkopie. Mit integrierten Zugriffskontrollen können Sie mit SageMaker Lakehouse differenzierte Berechtigungen definieren und eine einzige Datenkopie sicher im gesamten Unternehmen teilen.
Greifen Sie über Null-ETL-Integrationen nahezu in Echtzeit auf Daten aus operativen Datenbanken und Anwendungen im SageMaker Lakehouse zu. Greifen Sie direkt auf Ihre Daten zu und fragen Sie sie ab – mit einer Vielzahl von AWS-Services sowie Open-Source-Tools und Engines von Drittanbietern, die Apache Iceberg unterstützen.
Bringen Sie vorhandene Daten aus mehreren Amazon Redshift Data Warehouses in SageMaker Lakehouse, um Daten abzufragen und zu verknüpfen, die in Redshift-Clustern und Arbeitsgruppen gespeichert sind. Skalieren Sie Ihre Workloads für Prozesse von Extract, Transform, Load (ETL), BI-Berichte und Analysen nach Bedarf, ohne mehrere Datenfreigaben verwalten zu müssen.