Zum Inhalt springen

Dremio

STACKIT Dremio ist ein vollständig verwalteter Service, mit dem Sie Daten aus verschiedenen Quellen mit Subsekunden-Performance entdecken, verwalten und analysieren können. Basierend auf Apache Arrow bietet Dremio eine produktionsreife Plattform für Data-Lakehouse-Architekturen und ermöglicht Self-Service-Analysen sowie Datenvirtualisierung ohne die Komplexität des Verschiebens von Daten. Nutzende können Data Lakes und Datenbanken direkt mithilfe von Standard-SQL abfragen.

STACKIT Dremio stellt die volle Leistungsfähigkeit des Dremio-Ökosystems mit Enterprise-Features bereit. Der Service bietet eine vollständig verwaltete Infrastruktur, sodass Sie keine komplexen verteilten Cluster bereitstellen, konfigurieren oder warten müssen. Die Data-Reflections™-Technologie optimiert die Abfrage-Performance automatisch, während die semantische Ebene eine konsistente Datensicht für alle Nutzenden bereitstellt.

Zu den wichtigsten Funktionen gehören:

  • Intuitive Dremio-Benutzeroberfläche für Datenexploration, SQL-Bearbeitung und Lineage-Visualisierung
  • Hochperformante SQL-Engine auf Basis von Apache Arrow für extrem schnelle Analysen
  • Secure by Design: Binden Sie Ihren Identity Provider (IdP) über OIDC an – mit fein granularer Zugriffskontrolle auf Zeilen- und Spaltenebene
  • Einheitliche semantische Ebene zum Organisieren, Kennzeichnen und Absichern von Daten für den Self-Service-Zugriff
  • Erweiterte Data Reflections™ für transparente Abfragebeschleunigung ohne manuelles Indexing
  • Native Konnektoren für Object Storage (S3-kompatibel), relationale Datenbanken und NoSQL-Quellen
  • Isolierte Ausführungs-Engines zur Sicherstellung einer vorhersehbaren Performance für unterschiedliche Geschäftsbereiche
  • Nahtlose Integration in STACKIT Observability zur Überwachung der Abfragegesundheit und Ressourcennutzung
  • Unterstützung für Iceberg- und Delta-Lake-Tabellen für offene Data-Lakehouse-Architekturen
  • Dynamisch skalierte Engine-Ressourcen zur effizienten Verarbeitung von Spitzenlasten bei analytischen Workloads

Dremio verwandelt Ihren Object Storage in ein hochperformantes Data Lakehouse. Durch das direkte Abfragen von Daten in offenen Formaten wie Apache Iceberg entfällt das Laden von Daten in teure, proprietäre Data Warehouses, während gleichzeitig eine warehouseähnliche Performance erhalten bleibt.

Verknüpfen Sie Daten aus unterschiedlichen Quellen – etwa aus einer PostgreSQL-Datenbank und einem Object-Storage-Bucket – ohne aufwendige ETL-Prozesse. Dremio bietet einen zentralen Einstiegspunkt für all Ihre Daten und ermöglicht Analystinnen und Analysten die Ausführung föderierter Abfragen in Echtzeit.

Befähigen Sie Business-Analystinnen und -Analysten, Daten eigenständig zu finden und zu beschreiben. Mithilfe der semantischen Ebene können technische Teams „virtuelle Datensätze“ kuratieren, die eine fachlich verständliche Terminologie verwenden. So können auch nicht-technische Nutzende problemlos Dashboards in Power BI, Tableau oder Grafana erstellen.

Beenden Sie das Problem langsamer Dashboards. Durch den Einsatz der Data Reflections von Dremio beschleunigen Sie BI-Tools und Reporting-Anwendungen auf Subsekunden-Antwortzeiten – selbst bei sehr großen Datensätzen – ohne den Mehraufwand für das Management von Cubes oder Extrakten.

Zentralisieren Sie Sicherheitsrichtlinien über Ihre gesamte Datenlandschaft hinweg. Implementieren Sie konsistente Regeln für Datenmaskierung und Zeilen­sicherheit in Dremio, die unabhängig vom verwendeten BI-Tool oder SQL-Client beim Zugriff auf die Daten greifen.