Zum Inhalt springen

Überwachung (Monitoring)

Monitoring und Observability in Kombination mit Ihrer Datenbank sind entscheidende Faktoren, um eine gute Customer Experience zu bieten und Ihre eigenen SLAs gegenüber Ihren Kunden nachzuweisen. Mit Observability bietet STACKIT einen Managed Service an, der Observability und Monitoring abdeckt. Lesen Sie die Dokumentation zu STACKIT Observability, um zu erfahren, wie Sie den Managed Service an Ihre Bedürfnisse anpassen können.

Dieser Artikel basiert auf dem Paradigma, dass Sie Monitoring mit Schwellenwerten für bestimmte Metriken nutzen, um Situationen zu erkennen, die Ihre Aufmerksamkeit erfordern, und Observability einsetzen, um zu analysieren, wie Sie Maßnahmen ergreifen können.

MongoDB Flex bietet mehrere Metriken direkt im STACKIT Portal an. Dies ist ein zusätzlicher vorkonfigurierter Service und läuft parallel zu einer optionalen selbst konfigurierten Observability-Instanz.

Folgen Sie diesen Schritten, um auf die Metriken zuzugreifen:

  1. Klicken Sie in der Seitenleiste auf MongoDB Flex.
  2. Klicken Sie auf die Instanz, für die Sie auf die Metriken zugreifen möchten.
  3. Klicken Sie in der Seitenleiste auf Metriken.

Das Panel zeigt die aktuelle Auslastung der wichtigsten Ressourcen aller Knoten an. Konsultieren Sie Metriken von MongoDB Flex, um eine Vorstellung von der Bedeutung der Metriken zu bekommen.

Observability nutzen, um potenzielle Probleme mit Ihrem MongoDB Flex-Service zu analysieren und zu lösen

Abschnitt betitelt „Observability nutzen, um potenzielle Probleme mit Ihrem MongoDB Flex-Service zu analysieren und zu lösen“

Unabhängig davon, ob Sie die interne Observability-Lösung von STACKIT oder ein externes Tool verwenden, müssen Sie das Scraping manuell konfigurieren. Fügen Sie Ihrer Prometheus-Instanz einen Scraper hinzu, um dies zu erreichen. Fügen Sie dann ein Dashboard in Grafana hinzu, um die Metriken zu visualisieren, die Sie interessieren. Eine Liste der verfügbaren Metriken finden Sie unter Metriken von MongoDB Flex.

Die Metriken und Schwellenwerte sind wichtige Werkzeuge zur Verwaltung Ihrer Instanz. Neben dem Nachweis gegenüber Ihrem Kunden, dass Ihre SLAs eingehalten werden, erhalten Sie wichtige Informationen für das Sizing Ihrer Instanz. Es ist eine bewährte Methode, die Alarmschwellenwerte zwischen 60 % und 80 % festzulegen, abhängig von Ihrer Risikoaffinität und Reaktionszeit.

Bevor Sie mehr Ressourcen zuweisen, versuchen Sie zuerst, Ihre Datenbank und Abfragen zu optimieren. Es gibt verschiedene Muster in den Metriken, die Ihnen Hinweise auf Optimierungspotenzial geben. Lesen Sie den MongoDB Guide zur Optimierung der MongoDB-Performance und zur Abfrageoptimierung, um zu erfahren, wie Sie diese Muster erkennen und die Ursachen beheben können.

Wenn Sie sicher sind, dass Sie mehr Ressourcen benötigen, nutzen Sie ebenfalls die Metriken. Für jeden Instanztyp (Single, Replica, Sharded) gibt es drei Parameter, welche die zugewiesenen Ressourcen steuern: Datenbankgröße, Leistungsklasse und Flavor.

Wenn die Metrik DB Storage über 80 % steigt, ist es Best Practice, die Datenbankgröße zu erhöhen.

Wenn Sie Performance-Probleme beim Datenspeicher analysieren, müssen Sie zwischen zwei Parametern unterscheiden: IOPS und Disk-Bandbreite. Ersterer ist wichtiger für interne Datenbankaufgaben und die Verarbeitung vieler kleiner Abfragen, letzterer ist wichtig, wenn Sie große Bulk-Dateien mit Ihren Abfragen ausliefern.

Wenn die Metrik Disk IOPS 80 % der IOPS Ihres Leistungsklassen-Plans erreicht, ist es Best Practice, die Leistungsklasse zu upgraden. Lesen Sie Flavors und Leistungsklassen von MongoDB Flex, um nachzuschlagen, welcher Plan wie viele IOPS hat.

Wenn die Metrik Disk Util % dauerhaft 60 % erreicht, sollten Sie ein Upgrade der Leistungsklasse in Betracht ziehen.

MongoDB ist stark auf Speicher angewiesen. Als Faustregel gilt, dass Ihr RAM so groß sein sollte wie 60 % des DB Storage Ihrer MongoDB. Mit dem Parameter Flavor können Sie Ihrer Instanz mehr Speicher- und CPU-Ressourcen zuweisen.

Bei der Interpretation von Speichermetriken müssen Sie zwischen Resident- und Virtual-Memory unterscheiden. Resident-Memory ist die Menge an Speicher, die tatsächlich genutzt wird, und daher der Parameter, auf den Sie achten müssen. Wenn dieser dauerhaft über 80 % liegt, sollten Sie ein Upgrade des Flavor in Betracht ziehen.

Um den Bedarf an CPUs zu analysieren, überwachen Sie den Parameter Normalisierte System-CPU. Wenn dieser dauerhaft über 80 % liegt, sollten Sie ein Upgrade des Flavor in Betracht ziehen.