
Auf dem Data & AI Summit 2024 kündigte Databricks die allgemeine Verfügbarkeit von “Predictive Optimization” an. Predictive Optimierung nutzt Unity Catalog und wird von der Data Intelligence Engine angetrieben, um die besten Optimierungen für Daten zu bestimmen und diese Operationen automatisch auf einer serverlosen Infrastruktur auszuführen. Die Vorteile für Data-Engineering-Teams liegen darin, dass sie die Wartungsvorgänge bisher manuell verwalten mussten. Die Data Intelligence Platform von Databricks übernimmt diese Aufgabe für Firmen, reduziert die Komplexität der Verwaltung und verbessert umgehend die Leistung und Kosteneffizienz.
Die Tabellenpflege ist eines der Schlüsselelemente zur Verbesserung der “Query Performance” und Kosteneffizienz im Data Lake. Die Herausforderung für die Unternehmen besteht darin, dass die manuelle Pflege viel technisches Know-how, manuellen Aufwand und ständige Anpassungen erfordert, wenn sich die Daten und Anwendungsfälle des Unternehmens weiterentwickeln.
Data-Engineering-Teams müssen herausfinden, welche Optimierungen sie durchführen wollen. Dann stellt sich die Frage, welche Tabellen sie optimieren müssen. Sie müssen ebenfalls herausfinden, wie häufig die Optimierungen ausgeführt werden sollen. All diese Fragen bedürfen Antworten, bevor die Data Teams den operativen Aufwand für die Durchführung dieser Optimierungen bewältigen können. Sie müssen beispielsweise die Aufträge planen, Fehlern finden und die zugrunde liegende Infrastruktur verwalten. Außerdem handelt es sich nicht um eine einmalige Einrichtung. Data Teams müssen diese Aufträge kontinuierlich aktualisieren, wenn ihre Datenmengen wachsen, neue Tabellen hinzugefügt werden und sich die Zugriffsmuster ändern. Daten- und KI-Anwendungsfälle sind in den Unternehmen geradezu explodiert. Deshalb haben viele Unternehmen zu Protokoll gegeben, dass sie mit der Optimierung von Tabellen, die aufgrund der wachsenden Geschäftsanforderungen erstellt wurden, nicht Schritt halten können.
Predictive Optimization bestimmt auf intelligente Weise den besten Zeitplan für Optimierungen, indem es den Unity Catalog und die Data Intelligence Engine nutzt. Das KI-Modell nimmt die Abfragemuster des Unternehmens und kombiniert sie mit Faktoren wie Datenlayout, Tabelleneigenschaften und Leistungsmerkmalen, um die wirksamsten Optimierungen zu ermitteln.
Preview-Kunden wie Anker berichten von einer 2-fachen Verbesserung der Abfrageleistung und Storage-Einsparungen von 50 Prozent: “Databricks Predictive Optimizations hat unseren Unity-Catalog Speicher auf intelligente Weise optimiert, wodurch wir 50 Prozent der jährlichen Speicherkosten einsparen und gleichzeitig unsere Abfragen um mehr als das Zweifache beschleunigen konnten. Die Software lernt, unsere größten und meistgenutzten Tabellen zu priorisieren. All dies geschieht automatisch, was unserem Team wertvolle Zeit spart”, erklärt Shu Li, Data Engineering Lead bei Anker.
Alessandro Caronia, Infrastructure Operations Manager und Simona Fiazza, End to End Operations Manager bei Plenitude, erklärten zu den Auswirkungen auf die Kosteneffizienz: “Databricks Predictive Optimization hilft der FinOps-Gruppe konsequent, die Speicherkosten zu minimieren. Wir haben sofort einen Rückgang der Speicherkosten um 26 Prozent festgestellt und erwarten in Zukunft weitere Einsparungen. Die Funktion hat es uns ermöglicht, Prozesse, Skripte und manuelle Wartungsvorgänge abzuschaffen, was uns eine größere Skalierbarkeit ermöglicht.”
In naher Zukunft wird Predictive Optimization standardmäßig für alle von Unity Catalog verwalteten Tabellen aktiviert sein, so dass Data Teams optimierte Datenlayouts, effiziente Speicherung und mehr erhalten. Erfahren Sie hier mehr über Predictive Optimization hier: https://www.databricks.com/blog/announcing-general-availability-predictive-optimization
Fachartikel

Cloudflare enthüllt ein komplexes KI-System zur Abwehr automatisierter Angriffe

Vorsicht vor der Absicht-Ökonomie: Sammlung und Kommerzialisierung von Absichten über große Sprachmodelle

Sicherung von SAP BTP – Die Grundlagen: Stärkung des Unternehmens ohne Einbußen bei der Sicherheit

Ghost Ransomware: Diese Sofortmaßnahmen sind nötig

Sichere und schnelle Identitätsprüfung: So gelingt effizientes Onboarding
Studien

Digitaler Verbraucherschutz: BSI-Jahresrückblick 2024

Keyfactor-Studie: 18 Prozent aller Online-Zertifikate bergen Sicherheitsrisiken – Unternehmen müssen handeln

Gartner-Umfrage: Nur 14% der Sicherheitsverantwortlichen können Datensicherheit und Geschäftsziele erfolgreich vereinen

Zunehmende Angriffskomplexität

Aufruf zum Handeln: Dringender Plan für den Übergang zur Post-Quanten-Kryptographie erforderlich
Whitepaper

Adversarial Machine Learning: Eine Klassifizierung und Terminologie von Angriffen und Gegenmaßnahmen

HP warnt: „Ich bin kein Roboter“ CAPTCHAs können Malware verbreiten

Sysdig Usage Report zeigt: 40.000-mal mehr maschinelle als menschliche Identitäten – eine Herausforderung für die Unternehmenssicherheit

eBook: Cybersicherheit für SAP
