FAQ zu AI Model Experiments
Zuletzt aktualisiert am
Wir möchten unseren Kunden die Informationen geben, die sie benötigen, um STACKIT AI Model Experiments optimal zu nutzen. Dieser FAQ-Bereich beantwortet häufig gestellte Fragen. Dies hilft Ihnen dabei, schnell Lösungen zu finden und Ihre Erfahrung zu verbessern. Wir empfehlen Ihnen, diese FAQ zu lesen, bevor Sie unser Support-Team kontaktieren, da Sie hier eventuell bereits die passende Antwort finden.
-
Allgemeine Informationen
Kann ich den Service mit meinem bestehenden ML-Code nutzen?
Ja! Der Service ist kompatibel mit dem Standard MLflow™ Python SDK und der REST API. Wenn Sie MLflow™ bereits lokal nutzen, müssen Sie lediglich Ihre Umgebungsvariablen so aktualisieren, dass sie auf die STACKIT-Instanz verweisen. Um eine nahtlose Verbindung zu gewährleisten, stellen Sie sicher, dass Ihre lokale SDK-Version vom Server unterstützt wird. Dies erreichen Sie in der Regel, indem Sie eine SDK-Version verwenden, die nicht höher als die aktuelle Version des Servers ist. Dies verhindert Kompatibilitätsprobleme, bei denen neuere Client-Funktionen vom Tracking-Service noch nicht erkannt werden.
-
Aufsetzen und Konfiguration
Warum schlägt die Aktivierung fehl, wenn ich Object Storage nicht aktiviert habe?
AI Model Experiments erfordert zum Speichern Ihrer Modellartefakte STACKIT Object Storage (Object Storage). Für jede MLflow™-Instanz, die Sie erstellen, wird automatisch ein dedizierter Bucket bereitgestellt. Daher muss Object Storage zuerst in Ihrer Region aktiv sein.
Are the Object Storage buckets and credentials created automatically?
Yes. For every AI Model Experiments instance you create, STACKIT automatically provisions a dedicated bucket (model-experience-{bucket-id}) and a corresponding credential group (aiexp-{bucket-id}-client). This ensures that your model artifacts are stored securely and in isolation from your other data.
Ich sehe die aiexp-Anmeldedatengruppe, aber wo sind meine Schlüssel?
Während die Anmeldedatengruppe automatisch generiert wird, werden der eigentliche Zugriffsschlüssel (Access-Key) und der geheime Schlüssel (Secret-Key) aus Sicherheitsgründen nicht angezeigt. Sie müssen zu STACKIT Object Storage > Zugangsdaten & Gruppen navigieren, die Gruppe
aiexpauswählen und auf Zugangsdaten erstellen klicken, um die Schlüssel zu generieren, die Sie für Ihre Umgebungsvariablen AWS_ACCESS_KEY_ID und AWS_SECRET_ACCESS_KEY benötigen.Kann ich einen anderen Object Storage-Bucket anstelle des automatisch generierten verwenden?
Ja. Sie können das MLflow™-SDK so konfigurieren, dass es auf einen beliebigen S3-kompatiblen Bucket verweist, indem Sie Ihre Umgebungsvariablen ändern. Beachten Sie jedoch, dass es eine wesentliche Einschränkung gibt: Die verwaltete MLflow™-Benutzeroberfläche ist nur in den automatisch generierten model-experience-Bucket integriert. Wenn Sie einen benutzerdefinierten Bucket verwenden:
- SDK/API: Sie können Artefakte weiterhin programmgesteuert mit Ihren eigenen Tools oder der MLflow™-Python-Bibliothek protokollieren und abrufen.
- MLflow™-Benutzeroberfläche: Die Registerkarte Artefakt im gehosteten Dashboard kann Ihre Dateien (Plots, Modelle et cetera) nicht anzeigen oder in der Vorschau darstellen, da sie keine Berechtigungen oder Verbindung zu Ihren externen Buckets hat.
Was ist der Unterschied zwischen einem STACKIT Auth-Token und einem Tracking-Token?
- STACKIT Auth-Token: Wird verwendet, um mit der STACKIT API oder dem STACKIT Portal zu interagieren und den Lebenszyklus des Dienstes zu verwalten (zum Beispiel Erstellen oder Löschen von Instanzen).
- Tracking-Token: Ein für eine bestimmte MLflow™-Instanz generiertes Zugriffstoken mit eingeschränktem Gültigkeitsbereich: Entwickler verwenden dieses in ihrem Python-Code (MLFLOW_TRACKING_TOKEN), um Daten zu Experimenten zu protokollieren.
Wie finde ich meine Instanz-URI?
- Melden Sie sich im STACKIT Portal an.
- Navigieren Sie zu AI Model Experiments.
- Ihre Instanz-URI ist direkt in der jeweiligen Instanz verlinkt.
Wie finde ich ein mit einer Instanz verknüpftes Bucket?
- Melden Sie sich im STACKIT Portal an.
- Navigieren Sie zu AI Model Experiments.
- Ihr Bucket ist direkt innerhalb der spezifischen Instanz verknüpft.
Warum kann ich meinen Token-Wert nach dem Erstellen nicht mehr sehen?
Der Zugriffstoken-Wert wird aus Sicherheitsgründen nur ein einziges Mal zum Zeitpunkt der Erstellung angezeigt. STACKIT speichert den Klartext-Token nicht. Wenn Sie den Token verlieren oder er nicht mehr zugänglich ist, müssen Sie einen neuen erstellen.
-
Durchführen von Experimenten
Welche Machine-Learning-Bibliotheken werden unterstützt?
Da der Dienst standardmäßiges MLflow™ verwendet, unterstützt er alle gängigen Frameworks wie XGBoost, PyTorch, TensorFlow, Scikit-learn und weitere. Verwenden Sie das entsprechende „Flavor” (z. B.
mlflow.xgboost.log_model).Für eine vollständige und aktuelle Liste aller integrierten und von der Community unterstützten Flavors empfehlen wir den Besuch der offiziellen MLflow™ Built-in Model Flavors-Dokumentation.
Was passiert, wenn ich ein Experiment lösche?
Experimente folgen einer Soft-Delete-Richtlinie. Wenn sie gelöscht werden, werden sie zum Löschen markiert, verbleiben jedoch für eine Frist im System, die durch die Einstellung DeletedExperimentRetention definiert ist (Standardwert sind 30 Tage). Nach diesem Zeitraum werden die Daten dauerhaft bereinigt und können nicht wiederhergestellt werden.
Wie kann ich mich am Dashboard anmelden?
Sie können auf die MLflow™-Benutzeroberfläche mit Ihren Standard-STACKIT-Zugangsdaten wie folgt zugreifen:
- Im STACKIT Portal: Klicken Sie auf den direkten Link in der Instanzansicht in AI Model Experiments.
- Per API: Wenn Sie eine Instanz über die API abrufen, kopieren Sie das Feld URL aus der Antwort und fügen Sie es in Ihren Webbrowser ein.
-
Fehlerbehebung
Ich habe mein Tracking-Token verloren. Kann ich es wiederherstellen?
Nein. Aus Sicherheitsgründen werden Token nur einmal während der Erstellung angezeigt. Wenn Sie ein Token verlieren, müssen Sie das alte löschen und ein neues im STACKIT Portal oder über die API generieren.
Ich erhalte einen libxgboost.dylib-Fehler. Wie kann ich das beheben?
Dies ist ein bekanntes Problem in der lokalen Umgebung. Sie müssen die OpenMP-Runtime installieren, indem Sie abhängig von Ihrem Betriebssystem folgenden Befehl ausführen:
Sofern Sie den Paketmanager Homebrew verwenden, führen Sie bitte folgenden Befehl aus:
Terminal-Fenster brew install libompLinux (Debian/Ubuntu)
Abschnitt betitelt „Linux (Debian/Ubuntu)“Verwenden Sie das Advanced Package Tool (APT), um die Laufzeitumgebung zu installieren:
Terminal-Fenster sudo apt-get update && sudo apt-get install libomp-developmentWarum kann ich keine neue Instanz erstellen oder kein Tracking-Token generieren?
In STACKIT AI Model Experiments sind diese Aktionen auf Projektadministratoren beschränkt.
- Administratoren verwalten die Infrastruktur: Sie stellen Instanzen bereit, richten die Storage-Buckets ein und geben die Tracking-Token aus.
- Engineers konzentrieren sich auf die Experimente: Sie verwenden die vom Admin bereitgestellten Token, um Trainingsdaten zu protokollieren, und nutzen die Benutzeroberfläche zur Analyse der Ergebnisse.
Wenn Sie eine neue Umgebung oder ein neues Token benötigen, wenden Sie sich bitte an Ihren Projektadministrator.
Ich kann nicht auf die gehostete Benutzeroberfläche zugreifen und erhalte die Fehlermeldung `unauthorized`. Was soll ich tun?
Wenn Sie beim Versuch, auf die gehostete Benutzeroberfläche zuzugreifen, eine Fehlermeldung
unauthorizederhalten, liegt es wahrscheinlich daran, dass Ihrem STACKIT-Benutzerkonto die erforderlichen Berechtigungen für dieses spezifische Projekt fehlen.Stellen Sie sicher, dass Ihrem Benutzer die richtige Rolle innerhalb des STACKIT-Projekts zugewiesen wurde. Ihr Benutzer benötigt mindestens die Berechtigung “Model Experiments Reader”, um Instanzen anzuzeigen und darauf zuzugreifen. Wenn Sie ein Administrator sind, können Sie diesen Zugriff über den Bereich IAM & Access im STACKIT Portal gewähren.
Mein Tracking-Token ist abgelaufen. Kann ich es verlängern oder erneuern?
Nein, aus Sicherheitsgründen können vorhandene Token nicht verlängert oder erneuert werden, sobald sie ihr Ablaufdatum erreicht haben. Wenn Ihr Token abgelaufen ist, müssen Sie ein neues generieren.
Warum erstellt mein Code einen lokalen Ordner, anstatt eine Verbindung zum verwalteten AI Model Experiments-Server herzustellen?
Wenn ein lokaler Ordner mit demselben Namen wie Ihre MLFLOW_TRACKING_URI generiert wird, hat der MLflow™-Client Ihre Remote-Serveradresse fälschlicherweise für einen lokalen Verzeichnispfad gehalten. Dies geschieht, weil das Präfix
https://fehlt; ohne dieses geht MLflow™ davon aus, dass die URI ein lokaler Pfad und keine Netzwerkadresse ist. Um sicherzustellen, dass Ihre Daten an den verwalteten Server gesendet und nicht lokal gespeichert werden, müssen Sie das vollständige Protokoll in Ihre Tracking-URI aufnehmen:Ersetzen Sie
Abschnitt betitelt „Ersetzen Sie“Terminal-Fenster export MLFLOW_TRACKING_URI="<instance-id>.model-experiments.eu01.onstackit.cloud"Terminal-Fenster export MLFLOW_TRACKING_URI="https://<instance-id>.model-experiments.eu01.onstackit.cloud"