Architektur von AI Model Experiments
Zuletzt aktualisiert am
STACKIT AI Model Experiments bietet eine vollständig verwaltete MLflow™-Umgebung. Durch die Nutzung einer instanzbasierten Architektur können Teams eine strikte Isolierung zwischen Projekten beibehalten und gleichzeitig ermöglicht es eine nahtlose Zusammenarbeit in ihren eigenen dedizierten Umgebungen.
Instanzen
Abschnitt betitelt „Instanzen“Jede Instanz ist eine in sich geschlossene, verwaltete MLflow™-Umgebung. Dieser Multi-Instanz-Ansatz stellt sicher, dass Metadaten und Zugriff über verschiedene Teams oder Arbeitsabläufe hinweg entkoppelt sind. Jede Instanz umfasst:
- Tracking-Server: Die zentrale Orchestrierungs-Engine, die eingehende Logs über die MLflow™-REST-API und das Python-SDK verarbeitet.
- Metadaten-Datenbank: Eine von STACKIT verwaltete Datenbank, die Nicht-Blob-Daten wie Experimente, Parameter und Metriken speichert.
- MLflow™-Benutzeroberfläche: Eine dedizierte Weboberfläche, die dieser spezifischen Instanz zugewiesen ist, um Ergebnisse zu visualisieren, Läufe zu vergleichen und das Modellregister zu verwalten.
Artefakt-Speicher
Abschnitt betitelt „Artefakt-Speicher“Im Gegensatz zu den Metadaten werden Artefakte (Modelle, Bilder, große Datensätze) im eigenen STACKIT-Projektraum des Benutzers gespeichert.
- Souveränität: Sie behalten das Eigentum und die Kontrolle über Ihre Binärdaten.
- Zugriff: Die MLflow™-Benutzeroberfläche und das SDK kommunizieren direkt mit Ihrem Storage-Bucket, um diese Dateien hochzuladen und abzurufen.
Authentifizierung & Sicherheit
Abschnitt betitelt „Authentifizierung & Sicherheit“Die Sicherheit wird durch eine Kombination aus STACKIT-Berechtigungen und Token auf Anwendungsebene verwaltet:
- Verwaltung: Administratoren erstellen und verwalten die Instanzen sowie Zugriffstoken und legen Zugriffsrollen über das STACKIT Portal oder die API fest.
- Datenprotokollierung: Ingenieure verwenden Token, um das Python-SDK gegenüber dem spezifischen Instanz-URI zu authentifizieren, um ihre Trainingsdaten zu protokollieren.
- UI-Zugriff: Jede Instanz-UI ist über einen eindeutigen URI zugänglich. Der Zugriff ist über die STACKIT-Authentifizierung und die Rollen des Benutzers beschränkt.
Verwaltung
Abschnitt betitelt „Verwaltung“Sie haben die volle Kontrolle über den Lebenszyklus Ihrer MLflow™-Umgebungen über das STACKIT Portal, die STACKIT CLI (CLI), APIs oder Terraform:
- Bereitstellung: Erstellen Sie in wenigen Minuten neue dedizierte AI Model Experiments-Instanzen.
- Token-Verwaltung: Erstellen, widerrufen oder rotieren Sie Zugriffstoken für Ihr Engineering-Team.
- Benutzerzugriff: Geben Sie Ihren Benutzern Berechtigungen, um sich an der Benutzeroberfläche anzumelden.
Die Rolle des Administrators gegenüber der des Ingenieurs
Abschnitt betitelt „Die Rolle des Administrators gegenüber der des Ingenieurs“-
Der Administrator: Verantwortlich für den Lebenszyklus der Instanz. Er erstellt den Server, legt Zugriffsrollen fest und stellt dem Team Token aus.
-
Der Ingenieur: Verwendet die bereitgestellten Zugriffstoken und das Python-SDK, um Skripte zu instrumentieren, was die automatisierte Protokollierung von Parametern, Metriken und Metadaten aus lokalen Umgebungen, Remote-Notebooks oder CI/CD-Pipelines ermöglicht. Über die Datenaufnahme hinaus nutzt der Ingenieur die MLflow™-Benutzeroberfläche, um Performance-Trends zu visualisieren, Side-by-Side-Vergleiche von Läufen durchzuführen und den Modell-Lebenszyklus durch Versionierung erfolgreicher Versuchs-Kandidaten zu verwalten.