Zum Inhalt springen

Erstellen Sie Ihr erstes Intake und senden Sie Ihre Daten dorthin

Bevor Sie ein Intake erstellen, müssen Sie einige Informationen über Ihre Dremio-Instanz zusammenstellen:

  • Dremio catalog URI: Der API-Endpunkt für Ihren Dremio-Iceberg-Katalog. In der Regel: https://dremio-<Ihr-Dremio-Instanzname>-catalog.data-platform.stackit.run/iceberg/
  • Dremio warehouse: Der Name des Dremio-Iceberg-Katalog-Warehouses, mit dem eine Verbindung hergestellt werden soll. In der Regel: catalog-s3
  • Dremio token endpoint URI: Die URL zum Anfordern von Dremio-Authentifizierungstoken. In der Regel: https://dremio-<Ihr-Dremio-Instanzname>.data-platform.stackit.run/oauth/token
  • Dremio personal access token (PAT): Ihr geheimer Schlüssel für die Authentifizierung. Wie Sie diesen erhalten, erfahren Sie in dieser Anleitung

Der Intake Runner ist die Engine für die Aufnahme von Daten. Sie müssen einen Runner erstellen, bevor Sie einen STACKIT Intake erstellen können.

  1. Öffnen Sie Ihr Projekt im STACKIT Portal.
  2. Navigieren Sie zu Data & AI > Intake.
  3. Klicken Sie in der Seitenleiste auf Intake Runners.
  4. Klicken Sie in der Topbar auf Create Intake Runners.
  5. Füllen Sie die Pflichtfelder aus:
    • Name: Ein lesbarer Name für Ihren Runner.
    • Max message size: Die maximale Größe in Kibibyte für eine einzelne Nachricht.
    • Max message rate (per h): Die maximale Anzahl an Nachrichten, die der Runner pro Stunde verarbeiten kann.
  6. Klicken Sie auf Order feed-based.

So rufen Sie den aktuellen Status Ihres Runners ab:

Nach der Bestellung führt Sie das Portal zur Liste der Intake Runner.

Hier sollten Sie Ihren neu erstellten Runner im Status Reconciling sehen. Geben Sie ihm einige Minuten Zeit, um den Status Aktiv zu erreichen.

Während der Abstimmung können Sie bereits die Details Ihres Runners einsehen, indem Sie auf dessen Namen klicken. Insbesondere können Sie die Endpunkt-URI überprüfen, über die Sie Nachrichten an Ihre Intakes senden werden.

Ein Intake ist die Datenpipeline, die den Strom der aufgenommenen Daten mit Ihrer Ziel-Dremio-Iceberg-Tabelle verbindet.

  1. Öffnen Sie Ihr Projekt im STACKIT Portal.
  2. Navigieren Sie zu Data & AI > Intake.
  3. Klicken Sie in der Seitenleiste auf Intakes.
  4. Klicken Sie in der oberen Leiste auf Intake erstellen.
  5. Füllen Sie die Pflichtfelder aus:
    • Name: Ein lesbarer Name für Ihren Intake.
    • Intake-Runner: Wählen Sie den Intake Runner aus, den Sie im vorherigen Schritt erstellt haben.
    • Iceberg-Katalog-Endpoint: Die Dremio-Katalog-URL, die Sie für Ihre Dremio-Instanz erhalten haben.
    • Iceberg-Warehouse: Die Dremio-Warehouse-Kennung, die Sie für Ihre Dremio-Instanz erhalten haben.
    • Namespace der Tabelle: Lassen Sie die Einstellung auf intake.
    • Tabellenname: Lassen Sie die Einstellung auf “Generate name”.
    • Tabellen-Partitionierung: Lassen Sie die Einstellung auf “No partitioning”.
    • Dremio-Token-Endpoint: Die Dremio-Token-Endpunkt-URL, die Sie für Ihre Dremio-Instanz erhalten haben.
    • Dremio PAT: Ihr PAT für die Authentifizierung.
  6. Klicken Sie auf Create Intake.

Um den aktuellen Status eines bestimmten Intakes abzurufen:

Nachdem Sie auf Erstellen geklickt haben, führt Sie das Portal zur Liste der Intakes.

Hier sollten Sie Ihr neu erstelltes STACKIT Intake im Status Reconciling sehen. Warten Sie einige Minuten, bis es den Status Active erreicht.

Während der Abstimmung können Sie bereits die Details Ihres Intakes einsehen, indem Sie auf seinen Namen klicken. Insbesondere können Sie den Topic-Namen prüfen, über den Sie Nachrichten an Ihre Intakes senden werden.

Um Daten an Ihr Intake zu senden, müssen Sie einen Intake-Benutzer mit dem Typ „intake“ erstellen und ein sicheres Passwort vergeben (mindestens 12 Zeichen, davon mindestens ein Großbuchstabe, ein Kleinbuchstabe, ein Sonderzeichen sowie mindestens eine Zahl). Weitere Details finden Sie unter Intake-Benutzer erstellen und verwalten.

  1. Öffnen Sie Ihr Projekt im STACKIT Portal.
  2. Navigieren Sie zu Data & AI > Intake.
  3. Klicken Sie in der Seitenleiste auf Intakes.
  4. Klicken Sie auf das Intake, das Sie im vorherigen Schritt erstellt haben.
  5. Klicken Sie in der Seitenleiste auf Benutzer.
  6. Klicken Sie in der oberen Leiste auf Benutzer erstellen.
  7. Füllen Sie die Pflichtfelder aus:
    • Name: Der Name für Ihren Intake-Benutzer.
    • Rolle: Lassen Sie diese auf „Intake Writer“.
    • Passwort: Ein sicheres Passwort (mindestens 12 Zeichen, davon mindestens ein Großbuchstabe, ein Kleinbuchstabe, ein Sonderzeichen sowie mindestens eine Zahl). Sie können auch auf Neues Passwort generieren klicken, um ein sicheres Passwort für Sie erstellen zu lassen. Kopieren Sie es in diesem Fall und bewahren Sie es sicher auf.
  8. Klicken Sie auf Erstellen.

Die Antwort enthält den Anmeldenamen des erstellten Benutzers. Notieren Sie diesen für die zukünftige Verwendung mit Ihrem Kafka-Client. Die Antwort enthält außerdem Konfigurationen, die Sie für Java- oder librdkafka-Clients kopieren können.

Sie können die Details des erstellten Benutzers einsehen:

  1. Navigieren Sie im STACKIT Portal zu Data & AI > STACKIT Intake.
  2. Klicken Sie auf das Intake, das Sie im vorherigen Schritt erstellt haben.
  3. Klicken Sie in der Seitenleiste auf Benutzer.
  4. Klicken Sie auf den soeben erstellten Benutzer, um dessen Details zu sehen, einschließlich des Anmeldenamens.

Um Nachrichten zu untersuchen, bei denen die Verarbeitung fehlgeschlagen ist, erstellen Sie einen Benutzer mit schreibgeschütztem Zugriff auf die Dead Letter Queue (DLQ), indem Sie den Typ auf dead-letter setzen.

  1. Öffnen Sie Ihr Projekt im STACKIT Portal.
  2. Navigieren Sie zu Data & AI > Intake.
  3. Klicken Sie in der Seitenleiste auf Intakes.
  4. Klicken Sie auf das Intake, das Sie im vorherigen Schritt erstellt haben.
  5. Klicken Sie in der Seitenleiste auf Benutzer.
  6. Klicken Sie in der Topbar auf Benutzer erstellen.
  7. Füllen Sie die Pflichtfelder aus:
    • Name: Der Name für Ihren Dead Letter Intake-Benutzer.
    • Rolle: Setzen Sie diese auf „Dead Letter Reader“.
    • Passwort: Ein sicheres Passwort (mindestens 12 Zeichen, mit mindestens einem Großbuchstaben, Kleinbuchstaben und Sonderzeichen sowie mindestens einer Zahl). Sie können auch auf Neues Passwort generieren klicken, um ein sicheres Passwort erstellen zu lassen. Kopieren Sie es in diesem Fall unbedingt und bewahren Sie es sicher auf.
  8. Klicken Sie auf Erstellen.

Die Antwort enthält den Anmeldenamen des erstellten Benutzers. Notieren Sie diesen für die zukünftige Verwendung mit Ihrem Kafka-Client. Die Antwort enthält außerdem Konfigurationen, die Sie für Java- oder librdkafka-Clients kopieren können.

Listen Sie alle Intake-Benutzer für ein Intake in Ihrem Projekt auf:

Navigieren Sie im STACKIT Portal zu Data & AI > Intake > Intakes.

Klicken Sie auf das Intake, das Sie im vorherigen Schritt erstellt haben.

Klicken Sie in der Seitenleiste auf Benutzer.

Hier sollten Sie sowohl den Intake-Benutzer als auch den Dead Letter-Benutzer sehen, die Sie in den vorherigen Schritten erstellt haben.

Daten über Ihr Intake an eine Iceberg-Tabelle senden

Abschnitt betitelt „Daten über Ihr Intake an eine Iceberg-Tabelle senden“

Nachdem Sie die Einrichtung abgeschlossen haben, können Sie überprüfen, ob alles funktioniert, indem Sie eine Testnachricht mit einem Kafka-Client wie kcat an Ihr Intake-Topic senden.

Terminal-Fenster
echo '{"message": "hello world from kcat!", "id": 123}' | \
kcat -b $INTAKE_RUNNER_ID.intake.eu01.onstackit.cloud:9094 \
-t intake-"$INTAKE_ID" \
-P \
-X security.protocol=SASL_SSL \
-X sasl.mechanisms=SCRAM-SHA-512 \
-X sasl.username=intake-user-"$INTAKE_USER_ID" \
-X sasl.password='<IHR_SICHERES_PASSWORT_FUER_INTAKE_BENUTZER>'
Nachdem Sie die Nachricht gesendet haben, fragen Sie Ihre Ziel-Tabelle in der Dremio-Benutzeroberfläche ab, um zu bestätigen, dass der Datensatz erfolgreich aufgenommen wurde.
Sie können auch aus dem Dead-Letter-Topic lesen:
```bash
kcat -b $INTAKE_RUNNER_ID.intake.eu01.onstackit.cloud:9094 \
-t deadletter-intake-"$INTAKE_ID" \
-C \
-X security.protocol=SASL_SSL \
-X sasl.mechanisms=SCRAM-SHA-512 \
-X sasl.username=intake-user-"$INTAKE_USER_DLQ_ID" \
-X sasl.password='<IHR_SICHERES_PASSWORT_FUER_DEADLETTER_BENUTZER>'

Sie können den Intake Runner mit den folgenden Befehlen löschen. Dadurch werden auch die Intakes und Intake-Benutzer gelöscht.

  1. Öffnen Sie Ihr Projekt im STACKIT Portal.
  2. Navigieren Sie zu Data & AI > Intake
  3. Klicken Sie in der Seitenleiste auf Intake Runners.
  4. Klicken Sie auf die drei Punkte rechts neben dem von Ihnen erstellten Intake Runner.
  5. Wählen Sie Löschen.
  6. Bestätigen Sie das Löschen durch Eingabe des Namens des Intake Runners.
  7. Drücken Sie auf Löschen

Herzlichen Glückwunsch, Sie haben Ihre erste Intake-Pipeline erstellt und Daten an diese gesendet. Von hier aus können Sie sich mit Hilfe der How-Tos weiter in das Thema einarbeiten.