Oracle: Branchenweit erste datenbankinterne LLMs
München – Oracle kündigt die allgemeine Verfügbarkeit von HeatWave GenAI an. Der neue Cloud-Datenbankservice umfasst die branchenweit ersten datenbankinternen Large Language Modelle (LLMs), einen automatisierten datenbankinternen Vektorspeicher, Scale-out-Vektorverarbeitung und die Möglichkeit zum Führen kontextbezogener Gespräche in natürlicher Sprache auf der Grundlage unstrukturierter Inhalte. Mit diesen neuen Funktionen können Kunden die Effizienzpotentiale generativer Künstlicher Intelligenz (KI) in ihre Unternehmensdaten integrieren – ohne dass KI-Expertise erforderlich ist oder Daten in eine separate Vektordatenbank verschoben werden müssen. HeatWave GenAI ist ab sofort in allen Oracle Cloud-Regionen, Oracle Cloud Infrastructure (OCI) Dedicated Region und Cloud-übergreifend ohne zusätzliche Kosten für HeatWave-Kunden verfügbar.
Wie ein Benchmark eines Drittanbieters mithilfe einer Reihe ähnlicher Suchabfragen für Tabellen mit einer Grösse von 1,6 GB bis 300 GB zeigt, ist HeatWave GenAI 30-mal schneller als Snowflake und kostet 25 Prozent weniger, 15-mal schneller als Databricks und kostet 85 Prozent weniger sowie 18-mal schneller als Google BigQuery und kostet 60 Prozent weniger.
Mit HeatWave GenAI können Entwickler mit Hilfe integrierter Embeddings einen Vektorspeicher für unstrukturierte Unternehmensdaten mit einem einzigen SQL-Befehl erstellen. Darüber hinaus können Benutzer mithilfe von LLMs in der Datenbank oder externen LLMs in einem einzigen Schritt Suchvorgänge in natürlicher Sprache durchführen. Die Daten verlassen die Datenbank nicht und aufgrund der hervorragenden Skalierbarkeit und Performance von HeatWave besteht keine Notwendigkeit, GPUs bereitzustellen. Dies ermöglicht Entwicklern, die Komplexität von Anwendungen zu reduzieren, die Leistung zu steigern, die Datensicherheit zu verbessern und Kosten zu senken.
„Das hohe Innovationstempo von HeatWave setzt sich mit der Ergänzung der bestehenden integrierten HeatWave-Funktionen um HeatWave GenAI fort: HeatWave Lakehouse, HeatWave Autopilot, HeatWave AutoML und HeatWave MySQL“, sagte Edward Screven, Chief Corporate Architect bei Oracle. „Die heutigen integrierten und automatisierten KI-Erweiterungen ermöglichen es Entwicklern, schneller umfangreiche generative KI-Anwendungen zu erstellen, ohne dass KI-Expertise erforderlich ist oder Daten verschoben werden müssen. Benutzer können jetzt intuitiv mit ihren Unternehmensdaten interagieren und schnell die genauen Antworten erhalten, die sie für ihr Unternehmen benötigen.“
Zu den neuen automatisierten und integrierten generativen KI-Funktionen gehören:
- Datenbankinterne LLMs vereinfachen die Entwicklung generativer KI-Anwendungen zu geringeren Kosten. Kunden können von generativer KI profitieren, ohne sich um die Komplexität der externen LLM-Auswahl und -Integration kümmern zu müssen und ohne sich Gedanken über die Verfügbarkeit von LLMs in den Data Centern verschiedener Cloud-Provider zu machen. Die in die Datenbank integrierten LLMs ermöglichen es den Kunden, Daten zu durchsuchen, Inhalte zu generieren oder zusammenzufassen und RAG (Retrieval-Augmented Generation) mit HeatWave Vector Store durchzuführen. Des Weiteren können sie generative KI mit anderen integrierten HeatWave-Funktionen wie AutoML kombinieren, um umfangreichere Anwendungen zu erstellen. HeatWave GenAI ist ausserdem in den OCI Generative AI-Service integriert, um auf vorab trainierte, Basismodelle führender LLM-Provider zuzugreifen.
- Mit dem automatisierten, datenbankinternen Vektorspeicher können Kunden generative KI mit ihren Geschäftsdokumenten nutzen, ohne Daten in eine separate Vektordatenbank zu verschieben und ohne KI Expertise. Alle Schritte zum Erstellen eines Vektorspeichers und von Vektoreinbettungen werden automatisiert und innerhalb der Datenbank ausgeführt. Das Erkennen von Dokumenten im Objektspeicher, das Parsen, das Generieren von Einbettungen in hochparalleler und optimierter Weise und das Einfügen in den Vektorspeicher machen HeatWave Vector Store effizient und benutzerfreundlich. Die Verwendung eines Vektorspeichers für RAG hilft, das Problem der Halluzinationen in LLMs zu lösen, da die Modelle proprietäre Daten mit dem entsprechenden Kontext durchsuchen können, um genauere und relevantere Antworten zu liefern.
- Die Scale-Out-Vektorverarbeitung ermöglicht es, semantische Suchergebnisse sehr schnell und ohne Einbussen bei der Genauigkeit zu erzielen. HeatWave unterstützt einen neuen, nativen VECTOR-Datentyp und eine optimierte Implementierung der Distanzfunktion, sodass Kunden semantische Abfragen mit Standard-SQL durchführen können. Die hybride In-Memory-Darstellung von Spalten und die Scale-out-Architektur von HeatWave ermöglichen die Ausführung von Vektorverarbeitung mit Near-Memory-Bandbreite und Parallelisierung über bis zu 512 HeatWave-Knoten. Dadurch erhalten Anwender schnell Antworten auf ihre Fragen. Die Benutzer können die semantische Suche auch mit anderen SQL-Operatoren kombinieren, um z. B. mehrere Tabellen mit unterschiedlichen Dokumenten zu verknüpfen und eine Ähnlichkeitssuche über alle Dokumente durchzuführen.
- HeatWave Chat ist ein Visual Code-Plug-in für MySQL Shell, das eine grafische Benutzeroberfläche für HeatWave GenAI bereitstellt und Entwicklern ermöglicht, Fragen in natürlicher Sprache oder SQL zu stellen. Der integrierte Lakehouse Navigator ermöglicht Benutzern, Dateien aus dem Objektspeicher auszuwählen und einen Vektorspeicher zu erstellen. Ausserdem können Benutzer in der gesamten Datenbank suchen oder die Suche auf einen Ordner beschränken. HeatWave pflegt den Kontext mit dem Verlauf der gestellten Fragen, den Zitaten der Quelldokumente und der Aufforderung zum LLM. Dies erleichtert eine kontextbezogene Konversation und ermöglicht Benutzern, die Quelle der vom LLM generierten Antworten zu überprüfen. Darüber hinaus wird dieser Kontext in HeatWave verwaltet und steht jeder Anwendung zur Verfügung, die HeatWave verwendet.
Benchmarks für die Erstellung von Vektorspeichern und die Vektorverarbeitung
Die Erstellung eines Vektorspeichers für Dokumente im PDF-, PPT-, WORD- und HTML-Format ist mit HeatWave GenAI bis zu 23-mal schneller und kostet nur 1/4 einer Knowledge Base für Amazon Bedrock.
Ein separater Benchmark zeigt, dass Vektorindizes in Amazon Aurora PostgreSQL mit pgvector einen hohen Grad an Ungenauigkeit aufweisen und falsche Ergebnisse liefern können. Im Gegensatz dazu liefert die Ähnlichkeitssuche von HeatWave immer genauere Ergebnisse und hat eine vorhersagbare Antwortzeit. HeatWave läuft mit annähernder Speichergeschwindigkeit und ist 10- bis 80-mal schneller als Aurora, das die gleiche Anzahl von Kernen verwendet.
„Wir freuen uns, unsere enge Zusammenarbeit mit Oracle fortzusetzen, um mit HeatWave GenAI die Performance und Produktivität von KI für kritische Unternehmens-Workloads und Datensätze bereitzustellen“, sagte Dan McNamara, Senior Vice President und General Manager der Server Business Unit von AMD. „Die gemeinsame Entwicklungsarbeit von AMD und Oracle ermöglicht Entwicklern, innovative KI-Lösungen für Unternehmen zu entwerfen, indem sie HeatWave GenAI nutzen, das durch die Kerndichte und das hervorragende Preis-Leistungs-Verhältnis der AMD EPYC-Prozessoren angetrieben wird.“
„Die technischen Innovationen von HeatWave verwirklicht weiterhin die Vision einer universellen Cloud-Datenbank“, sagte Holger Müller, Vice President und Principal Analyst bei Constellation Research. „Das Neueste ist generative KI im ‚HeatWave-Stil‘ – einschliesslich der Integration eines automatisierten, datenbankinternen Vektorspeichers und datenbankinterner LLMs direkt in den HeatWave-Kern. Dies ermöglicht Entwicklern, durch die Kombination von HeatWave-Elementen neue Anwendungsklassen zu erstellen. Sie können beispielsweise HeatWave AutoML und HeatWave GenAI in einer Anwendung zur Betrugserkennung kombinieren, die nicht nur verdächtige Transaktionen erkennt, sondern auch eine verständliche Erklärung liefert. Das alles läuft in der Datenbank, sodass die Daten nicht in externe Vektordatenbanken verschoben werden müssen, was die Sicherheit der Daten erhöht. Wie in Benchmarks der Konkurrenz gezeigt wurde, macht es HeatWave GenAI auch zu einem Bruchteil der Kosten hochleistungsfähig.“ (Oracle/mc/ps)
Weitere Ressourcen
- Edward Screven stellt neue GenAI-Erweiterungen für HeatWave vor
- Technischer Blog zu HeatWave
- Das sagen Branchenanalysten über HeatWave