Cloudübergreifende Datenanalysen – BigQuery Omni für AWS und Azure
Branchenstudien zeigen, dass 90 Prozent der Unternehmen eine Multi-Cloud-Strategie verfolgen. Eine Herausforderung bezüglich der Integration und Orchestrierung von Daten – und für die Governance. Zudem entstehen oftmals Datensilos. Abhilfe verspricht seit kurzem BigQuery Omni, ein Multi-Cloud-Analysedienst, mit dem Datenexperten Datensilos aufbrechen und sicher und kosteneffektiv über verschiedene Clouds hinweg analysieren können.
Multi-Cloud ist die Zukunft
Mit BigQuery Omni sind Unternehmen nun in der Lage, cloud-übergreifende Analysen von einer einzigen Oberfläche aus durchzuführen – und zwar über Google Cloud, Amazon Web Services (AWS) und Microsoft Azure. BigQuery Omni wird im vierten Quartal allen Kunden von AWS und ausgewählten Kunden von Microsoft Azure zur Verfügung stehen.
Datenanalysten können Daten direkt über die vertraute BigQuery-Benutzeroberfläche abfragen und so die Leistungsfähigkeit von BigQuery dort nutzen, wo sich die Daten befinden.
Hier sind einige Möglichkeiten, wie BigQuery Omni den aktuellen Herausforderungen mit Multi-Cloud-Umgebungen Rechnung trägt:
- Multicloud wird bleiben: Unternehmen bündeln nicht, sie erweitern ihren Daten-Stack über die Clouds hinweg. Aus finanziellen, strategischen und politischen Gründen benötigen Kunden Daten in mehreren Clouds. Die Unterstützung von Multicloud ist zu einer Mindestanforderung für Datenplattformen geworden.
- Multicloud sollte nahtlos funktionieren: Die Bereitstellung einer zentralen Übersicht über alle Datenspeicher ermöglicht es Datenanalysten, neue Erkenntnisse zu gewinnen, ohne sich neue Fähigkeiten anzueignen und sich Gedanken darüber zu machen, wo die Daten gespeichert sind. Da BigQuery Omni mit denselben APIs wie BigQuery erstellt wurde, wird der Speicherort der Daten (AWS, Azure oder Google Cloud) zu einem Implementierungsdetail.
- Konsistente Sicherheitsmuster sind bei der Skalierung von Unternehmen von entscheidender Bedeutung: Da immer mehr Datenbestände erstellt werden, kann die Bereitstellung der richtigen Zugriffsebene eine Herausforderung sein. Sicherheitsteams benötigen eine möglichst detaillierte Kontrolle über den gesamten Datenzugriff, um Zuverlässigkeit und Datensynchronisation zu gewährleisten.
- Datenqualität ermöglicht Innovation: Der Aufbau eines vollständigen Cloud-übergreifenden Stacks ist nur dann wertvoll, wenn der Endnutzer über die richtigen Daten verfügt, die er für seine Entscheidung benötigt. Mehrere Kopien, inkonsistente oder veraltete Daten führen zu schlechten Entscheidungsgrundlagen für Analysten.
Der Google Cloud-Blog zitiert den BigQuery-Kunden Johnson & Johnson, einen der ersten Anwender von BigQuery Omni auf AWS:
Wir haben festgestellt, dass BigQuery Omni deutlich schneller war als andere ähnliche Anwendungen. Wir konnten die Abfrageergebnisse problemlos in andere Cloud-Speicher zurückschreiben, und bei Mehrbenutzer- und parallelen Abfragen traten in Omni keine Leistungsprobleme auf. Wir sehen Omni als eine einzige Benutzeroberfläche, mit der wir verschiedenen Clouds verbinden und über SQL-ähnliche Abfragen auf die Daten zugreifen können.
Ausblick 2022: neue Funktionen und Features
Im Jahr 2022 wird es neue Funktionen wie cloud-übergreifende Übertragung und externe Datenquellen geben, die Analysten dabei unterstützen, geregelte, cloud-übergreifende Szenarien und Workflows über die BigQuery-Benutzeroberfläche zu steuern.
Die cloud-übergreifende Übertragung hilft, die benötigten Daten zu transferieren, um Analyse in Google Cloud abzuschließen und Erkenntnisse beispielsweise mithilfe von BigQuery ML, Looker und Dataflow zu gewinnen. Zusammen ermöglichen diese Funktionen einen vereinfachten und sicheren Zugriff über verschiedene Clouds hinweg für alle Ihre Analyseanforderungen. Nachfolgend eine kurze Demo dieser Funktionen, die für Multi-Cloud Data Analysts und Scientists relevant sind.