Azure Databricks Evolution: Lakebase GA, Genie AI und Microsoft-Integration
trending_up Trend: databricks

Azure Databricks Evolution: Lakebase GA, Genie AI und Microsoft-Integration

calendar_month 10. Juni 2026

Zusammenfassung

Auf der FabCon 2026 hat Databricks eine Reihe bedeutender Neuerungen für Azure Databricks angekündigt, die Datenanalyse und künstliche Intelligenz noch enger zusammenführen. Im Zentrum stehen die allgemeine Verfügbarkeit (GA) von Lakebase, einer serverlosen, Postgres-kompatiblen operationalen Datenbank, sowie Genie und Genie Code für konversationelle und agentische Dateninteraktionen. Darüber hinaus wird die Integration in das Microsoft-Ökosystem durch direkte Excel-Anbindung und die Spiegelung von Databricks-Katalogen in Microsoft Fabric vertieft. Diese Innovationen erleichtern es Entwicklern und Unternehmen, performante KI-Anwendungen und nahtlose Datenflüsse direkt auf dem Lakehouse zu realisieren.

Was ist passiert?

Im Rahmen der FabCon 2026 wurden für Azure Databricks folgende Plattform-Erweiterungen und Updates angekündigt:

  1. Lakebase (General Availability): Eine vollständig verwaltete, serverlose Postgres-kompatible relationale Datenbank. Lakebase ist direkt neben dem Lakehouse positioniert, um operative Workloads für KI-Anwendungen und Agenten mit minimaler Latenz zu bedienen, ohne Daten zwischen Systemen verschieben zu müssen. Sie unterstützt Features wie Skalierung auf Null, Entwicklungs-Branching und Instant-Restore.
  2. Genie und Genie Code (General Availability): Genie fungiert als konversationelle Benutzeroberfläche, über die Anwender per natürlicher Sprache Abfragen an Unternehmensdaten richten können. Der bisherige Databricks Assistant wurde in Genie Code umbenannt und erweitert, um mehrstufige, autonome Daten-Aufgaben im Agenten-Modus auszuführen.
  3. Lakeflow Connect Free Tier: Ein neues kostenloses Kontingent für Lakeflow Connect, das die tägliche Ingestion von bis zu 100 Millionen Datensätzen pro Workspace aus gängigen Quellen ermöglicht.
  4. Microsoft-Integrationen: Neben direkter Excel-Konnektivität zu governed Lakehouse-Daten steht die Spiegelung von Azure Databricks in Microsoft Fabric im Fokus. Die Absicherung dieser gespiegelten Daten erfolgt über die OneLake-Sicherheitseinstellungen in Fabric mittels Entra ID-Gruppen und Data Access Roles, da die Berechtigungen des Unity Catalogs nicht automatisch übertragen werden.

Warum es wichtig ist

  • Betriebliche Effizienz durch Co-Location: Mit Lakebase entfällt das Hin- und Herkopieren von Daten zwischen operativen Datenbanken und dem Lakehouse. Transaktionale Workloads für KI-Anwendungen laufen mit minimaler Latenz direkt auf der Plattform.
  • Demokratisierung und Agenten-Workflows: Genie Code reduziert den Programmieraufwand für komplexe Pipelines drastisch, da Daten-Ingenieure vermehrt autonome Agenten-Loops überwachen statt manuell Skripte zu schreiben.
  • Sicherheitskonsistenz im Multi-Cloud-Betrieb: Die Verknüpfung von Fabric und Databricks erfordert ein präzises Berechtigungsmanagement. OneLake Security ermöglicht eine granulare Zugriffskontrolle (Spalten- und Zeilenebene) für gespiegelte Daten, was Compliance-Anforderungen im Enterprise-Bereich absichert.

Beweise

  • Offizielle Ankündigungen: Databricks-Blogbeiträge und Microsoft Learn-Dokumentationen zur FabCon 2026 bestätigen die allgemeine Verfügbarkeit von Lakebase sowie die Einführung von Genie und Genie Code.
  • Technische Dokumentation: Die Microsoft-Dokumentation beschreibt detailliert die Einrichtung von OneLake Security für gespiegelte Azure Databricks-Daten.
  • Partnerschafts-Updates: Die erweiterte strategische Partnerschaft zwischen Microsoft und Databricks bildet das Fundament für die tiefe Integration beider Plattformen.

Analyse

Databricks vollzieht einen Wandel vom reinen Analysewerkzeug hin zu einer Full-Stack-Daten- und Anwendungsplattform. Lakebase greift klassische operative Datenbanken direkt an, indem es Transaktionen nah an den Analysedaten ermöglicht.

Die Integration in Microsoft Fabric bringt jedoch auch administrative Herausforderungen mit sich. Da Unity-Catalog-Berechtigungen nicht automatisch synchronisiert werden, entsteht durch das entkoppelte Berechtigungsmodell ein zusätzlicher Konfigurationsaufwand in Microsoft Fabric. Unternehmen müssen sicherstellen, dass Änderungen im Databricks-Berechtigungskonzept zeitnah in die OneLake-Sicherheitsrollen übertragen werden, um Datenlecks oder Zugriffsfehler zu vermeiden.

Praktische Erkenntnisse

  • Lakebase evaluieren: Entwickler von KI-Agenten oder datenintensiven Apps sollten Lakebase testen, um von der serverlosen, Postgres-kompatiblen Datenbank ohne Replikations-Overhead zu profitieren.
  • Fabric-Berechtigungsprüfung durchführen: Bei der Spiegelung von Katalogen in Microsoft Fabric müssen die Microsoft Entra ID-Gruppen abgeglichen und die Data Access Roles in Fabric OneLake explizit definiert werden.
  • Genie Code einführen: Teams im Bereich Data Science und Data Engineering sollten Genie Code für mehrstufige, repetitive Workflows einsetzen, um manuelle Programmierzeiten zu verkürzen.
  • Ingestion-Kosten senken: Nutzen Sie die neue freie Stufe von Lakeflow Connect, um bis zu 100 Millionen Records pro Tag kostenfrei zu importieren.

Offene Fragen

  • Wie stark wirken sich Latenzen bei der OneLake-Berechtigungssynchronisierung in Fabric auf dynamische Sicherheitsanforderungen aus?
  • Lassen sich die Kosten von autonomen Genie-Entwicklungsschleifen in großen Organisationen präzise kontrollieren?
  • Wie schneidet Lakebase im Performance-Vergleich zu dedizierten OLTP-Systemen bei hochfrequenten Schreibvorgängen ab?

Quellen

  1. Databricks and Microsoft Extend Strategic Partnership
  2. What’s new in Azure Databricks at FabCon 2026
  3. Secure Mirrored Azure Databricks Data in Fabric
  4. Databricks Prepay Reserved Capacity
  5. Azure Databricks Release Notes: What’s Coming
  6. Geekflare: Databricks vs Snowflake