Release Notes

Zuletzt aktualisiert am 30. Jan. 2026

März 2026
Abschnitt betitelt „März 2026“
- announcement
  
  STACKIT AI Model Serving: New Model Release GPT-OSS 20B (Replacement for Llama-8B and Nemo)
  Abschnitt betitelt „STACKIT AI Model Serving: New Model Release GPT-OSS 20B (Replacement for Llama-8B and Nemo)“
  4. März 2026
  
  We are excited to announce that we are upgrading our model lineup by introducing openai/gpt-oss-20b, which will serve as the successor to our current Mistral-Nemo and Llama 3.1 8B offerings.
  
  By leveraging 4-bit (MXFP4) quantization, this new 20-billion parameter model provides a significant boost in reasoning capabilities while maintaining the low-latency performance our customers expect. Applications such as real-time chatbots, retrieval-augmented generation (RAG), and agentic workflows will benefit from improved tool-calling and higher throughput.
  
  Deprecation Notice
  Section titled “Deprecation Notice”
  
  As part of this transition, we are officially deprecating the following models:
  - neuralmagic/Mistral-Nemo-Instruct-2407-FP8
  - neuralmagic/Meta-Llama-3.1-8B-Instruct-FP8
  We kindly ask all customers to migrate their workloads to the new model openai/gpt-oss-20b before 4 June 2026.
  
  Explore our full model portfolio, and access detailed examples and tutorials in our documentation. Our Help Center is always at your disposal if you have any questions.
Feb. 2026
Abschnitt betitelt „Feb. 2026“
- announcement
  
  STACKIT AI Model Serving: Release des neuen Multi-Modal Embedding Modells Qwen3-VL-Embedding-8B
  Abschnitt betitelt „STACKIT AI Model Serving: Release des neuen Multi-Modal Embedding Modells Qwen3-VL-Embedding-8B“
  5. Feb. 2026
  
  Wir freuen uns, die Aufnahme von Qwen3-VL-Embedding-8B in unser Portfolio für Shared LLM-Modelle bekannt zu geben. Dies ist ein hochmodernes multimodales Embedding-Modell, das entwickelt wurde, um die Lücke zwischen visuellen und textuellen Daten zu schließen.
  
  Im Gegensatz zu herkömmlichen rein textbasierten Modellen projiziert Qwen3-VL-Embedding-8B sowohl Text als auch Bilder in einen einheitlichen semantischen Vektorraum. Diese Veröffentlichung ermöglicht leistungsstarke Cross-Modal Retrieval-Funktionen für Ihre Anwendungen, darunter die Text-zu-Bild-Suche, Bild-zu-Text-Suche sowie komplexe multimodale RAG-Workflows (Retrieval-Augmented Generation).
  
  Wichtige Upgrades Diese Generation bietet umfassende Verbesserungen bei der Vektordarstellung und der Abfragegenauigkeit:
  - Einheitliche Multimodalität: Berechnet semantische Embedding-Vektoren aus Chat-Nachrichten, die sowohl Text als auch Bilder enthalten.
  - High-Fidelity Embeddings: Verfügt über eine Ausgabedimension von 4096 und 8 Milliarden Parameter für tiefe semantische Nuancen.
  - Erweiterter Kontext: Unterstützt eine maximale Eingabe von 32.000 Token, was die Verarbeitung umfangreicher Dokumente und hochauflösender visueller Eingaben ermöglicht.
  - Mehrsprachigkeit: Optimierte Unterstützung für über 30 Sprachen.
  Entdecken Sie unser vollständiges Modellportfolio und greifen Sie auf detaillierte Beispiele und Tutorials in unserer Dokumentation zu. Unser STACKIT Help Center steht Ihnen bei Fragen jederzeit zur Verfügung.
Jan. 2026
Abschnitt betitelt „Jan. 2026“
- announcement
  
  STACKIT AI Model Serving: Release des neuen Modells Qwen3-VL-235B-A22B
  Abschnitt betitelt „STACKIT AI Model Serving: Release des neuen Modells Qwen3-VL-235B-A22B“
  19. Jan. 2026
  
  Wir freuen uns, die Veröffentlichung von Qwen3-VL-235B-A22B bekannt zu geben, dem bisher leistungsstärksten Vision-Language-Modell der Qwen-Serie, das ab sofort unser gemeinsames Portfolio an LLM-Modellen erweitert. Dieses Modell bietet einen bedeutenden Fortschritt in den Bereichen Reasoning, Tool-Calling, Zuverlässigkeit bei langen Kontexten und visuellen Fähigkeiten.
  
  Diese Generation bietet umfassende Upgrades in allen Bereichen: überlegenes Textverständnis und Texterstellung, vertieftes visuelles Verständnis und logisches Denken, erweiterte Kontextlänge, verbessertes Verständnis von räumlicher und Videodynamik sowie stärkere Interaktionsmöglichkeiten für Agenten.
  
  Entdecken Sie unser vollständiges Modellportfolio und greifen Sie auf detaillierte Beispiele und Tutorials in unserer Dokumentation zu. Unser STACKIT Help Center steht Ihnen bei Fragen jederzeit zur Verfügung.
Dez. 2025
Abschnitt betitelt „Dez. 2025“
- announcement
  
  STACKIT AI Model Serving: Neuer Modell-Release GPT-OSS-120B
  Abschnitt betitelt „STACKIT AI Model Serving: Neuer Modell-Release GPT-OSS-120B“
  10. Dez. 2025
  
  Wir freuen uns, die Aufnahme von GPT-OSS-120B, dem bisher leistungsfähigsten Modell der GPT-OSS-Familie, in unser gemeinsames LLM-Modellportfolio bekannt zu geben. Dieses Modell stellt einen bedeutenden Sprung in den Bereichen logisches Denken (Reasoning), Tool-Calling-Fähigkeiten und Zuverlässigkeit bei langen Kontexten dar.
  
  GPT-OSS-120B wurde für den Einsatz in agentenbasierten Workflows entwickelt und zeichnet sich durch das präzise Befolgen von Anweisungen sowie starke Reasoning-Fähigkeiten aus. Das Modell bietet vollständiges Chain-of-Thought (CoT) und unterstützt strukturierte Ausgaben (Structured Outputs).
  
  Entdecken Sie unser gesamtes Modellportfolio und finden Sie detaillierte Beispiele und Tutorials in unserer Dokumentation. Unser Help Center steht Ihnen bei Fragen jederzeit zur Verfügung.
Mai 2025
Abschnitt betitelt „Mai 2025“
- announcement
  
  STACKIT AI Model Serving ist ab sofort verfügbar
  Abschnitt betitelt „STACKIT AI Model Serving ist ab sofort verfügbar“
  6. Mai 2025
  
  Ab dem 6. Mai 2025 bieten wir Ihnen den neuen Service STACKIT AI Model Serving an.
  
  STACKIT AI Model Serving bietet Ihnen einfachen Pay-as-you-go-Zugriff auf bewährte GenAI-Modelle, wie Llama 3.3 oder Gemma, in einer secure environment auf der data-sovereign STACKIT Cloud. Als Baustein unserer Data & AI Plattform ermöglicht STACKIT AI Model Serving Ihnen die Nutzung verschiedener Large Language Models (LLMs) mit maximaler Datensouveränität. Ihre Daten und Ihre queries werden weder gespeichert noch zum Trainieren von Modellen verwendet. Sie wählen das LLM, das für Sie richtig ist, und erhalten dank unserer API eine seamless user experience bei der Integration in Ihre Anwendungen.
  
  Unser Help Center steht Ihnen bei Fragen jederzeit zur Verfügung.

Release Notes

März 2026

STACKIT AI Model Serving: New Model Release GPT-OSS 20B (Replacement for Llama-8B and Nemo)

Deprecation Notice

Feb. 2026

STACKIT AI Model Serving: Release des neuen Multi-Modal Embedding Modells Qwen3-VL-Embedding-8B

Jan. 2026

STACKIT AI Model Serving: Release des neuen Modells Qwen3-VL-235B-A22B

Dez. 2025

STACKIT AI Model Serving: Neuer Modell-Release GPT-OSS-120B

Mai 2025

STACKIT AI Model Serving ist ab sofort verfügbar