Zum Inhalt

Systemarchitektur

DeepExtension wurde als modulare, skalierbare und unternehmensgerechte Plattform konzipiert, um den gesamten Lebenszyklus der KI-Modellentwicklung zu verwalten – von der Datenvorbereitung bis hin zur Bereitstellung. Dieses Dokument bietet einen Überblick über die Architektur auf hoher Ebene.


Überblick

Auf einen Blick besteht DeepExtension aus den folgenden Hauptkomponenten:


1. Benutzeroberflächen

  • Webbasierte Benutzeroberfläche (Self-Hosted): Die primäre Schnittstelle für die meisten Benutzer
  • RESTful API: Für programmatischen Zugriff, CI/CD-Integration oder Automatisierung

2. Anwendungsschicht

Diese Schicht steuert die Benutzererfahrung und verarbeitet:

  • Benutzer- und Projektverwaltung
  • Aufgabenplanung (Training, Auswertung, Feintuning)
  • Modelllebenszyklus: Verfolgung von Versionen, Leistung und Nutzung
  • Datenversionierung: Unterstützt inkrementelle, gelabelte Datensätze
  • Auswertungswerkzeuge: Enthält Benchmarks, JSON-Validatoren, Geschäftsregel-Tests
  • Sicherheit: RBAC, Token-Authentifizierung, Audit-Logs

3. KI-Kernschicht

Hier wird DeepExtension KI-spezifisch:

  • GRPO-Engine: Benutzerdefinierte Logik für Reinforcement Learning mit Prompt-Optimierung
  • Trainings-Job-Orchestrator: Verwalten und steuern von LLM-Feintuning-Aufgaben
  • Anpassbare Trainingslogik: Eigener Trainingscode kann fast beliebig eingebunden werden – mit nur minimalen Anpassungen wird er von DeepExtension nahtlos ausgeführt, überwacht und nachverfolgt

4. Infrastrukturschicht

Ausführung der Berechnungs- und Speicherkomponenten:

  • CUDA-GPU-Unterstützung auf Linux oder Windows über WSL für Training und Inferenz
  • Lokale macOS-Unterstützung für Entwicklung und Vorschau
  • Docker Compose: Verwaltung aller Dienste (Datenbank, Vektorspeicher, API, UI)
  • Speicher-Backends:

  • Dateispeicher: Verwaltung von Rohdatensätzen, Modell-Checkpoints und Artefakten

  • Vektordatenbanken: Speicherung und Abfrage von Embeddings (z. B. für semantische Suche oder RAG)
  • Relationale Datenbanken (z. B. PostgreSQL): Speicherung von Metadaten, Konfigurationen und Trainingsaufzeichnungen

Integrationen

DeepExtension unterstützt Integrationen mit:

  • LLM-Anbietern: OpenAI, Qwen, Claude, SiliconFlow usw.
  • Lokale Modelltools: Reibungslose Zusammenarbeit mit Tools wie LM Studio, Ollama und anderen für lokale Modell-Experimente und -Bereitstellungen

Sicherheitsfunktionen

  • Rollenbasierte Zugriffskontrolle (RBAC)
  • Projektbasierte Berechtigungsebenen
  • Protokollierung aller Aktionen und Rückverfolgbarkeit
  • Option für isolierte (air-gapped) Bereitstellungen

Bereitstellungsoptionen

Zielumgebung Beschreibung
CUDA(Linux oder Windows über WSL) Optimiert für leistungsintensives Training
macOS (Entwicklung) Läuft über Docker (ideal für lokale Nutzung oder Schulung)
Self-hosted SaaS Vollständige Bereitstellung für interne oder externe Nutzung

Zusammenfassung

DeepExtension ist so konzipiert, dass es sich sowohl für experimentelle Forschung als auch für unternehmenskritische Anwendungen eignet. Die schichtenbasierte Architektur erleichtert die Integration in bestehende KI-Stacks und ermöglicht gleichzeitig die vollständige Kontrolle über Modell-Workflows.