Files
mission-control/ROADMAP.md
T
Hitonabi d6e0762a28 Doku: Projektstand + Deploy-Workflow fuer Uebergabe aktualisiert
- CLAUDE.md: "Entwickeln & Deployen" auf Windows->Gitea->Bosgame umgestellt
  (key-basiertes SSH als hitonabi, rsync nach /opt, sudo-Restart)
- ROADMAP.md: Projektstand-Sektion (Schritt 1 live auf :9000, Reihenfolge,
  naechster Schritt = Feature 3 mit geprueften sysfs/psutil-Quellen)
- Feature 3 + 5 Status praezisiert

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-20 21:12:45 +02:00

4.5 KiB

Mission Control — Roadmap v2

Nordstern: Den Bosgame nie wieder via SSH/Putty bedienen müssen. 100 % Automatisierung oder Klicki-Bunti.


Projektstand (Stand 2026-06-20)

Schritt 1 erledigt & live auf :9000SoC-Refactor + Design 2.0 als Fundament (Commit 3649394). Backend in Helfer + routers/* zerlegt, Frontend in ES-Module (js/core + js/panels) + ausgelagertes CSS, neues Dashboard-Layout (Sidebar-Nav, Topbar, Alert-Banner, Hero, KPI-Kacheln, Health-Signale, Modell-Listen, Aktivitäts-Stream) angelehnt an docs/mission-control-overview.png. Bestehende Funktionen 1:1 migriert, Endpoint-URLs unverändert. Architektur + Deploy-Weg stehen in CLAUDE.md.

Reihenfolge (abgestimmt): Design/Architektur zuerst (), dann Quick Wins, Security-Brocken zuletzt: 1 (✅) Fundament → [2] Feature 3 Live-Auslastung ← NÄCHSTES → Feature 6 → Feature 1 → Feature 4 → Feature 7 → Feature 2.

Arbeitsweise je Schritt: neuer routers/<x>.py + js/panels/<x>.js + Nav-Eintrag, sauber degradierend. Bauen + Smoke-Test auf Windows, dann push→pull→rsync→restart auf den Bosgame (CLAUDE.md „Entwickeln & Deployen"). Ein Commit je Schritt. Ich (KI) habe key-basierten SSH-Zugang zum Bosgame und kann selbst deployen+restarten.

→ Nächster Schritt konkret = Feature 3 (Live-Auslastung). Quellen auf dem Bosgame geprüft — amd-smi/rocm-smi fehlen, daher sysfs + psutil:

  • CPU/RAM/Disk via psutil (zu requirements.txt hinzufügen — im Prod-/opt/.venv noch nicht drin) oder /proc-Fallback.
  • GPU-Speicher: /sys/class/drm/card1/device/mem_info_{gtt,vram}_{used,total} (Bytes; GTT-Pool ≈133 GB).
  • Temperatur: hwmon mit name=amdgpu (GPU, temp1_input in m°C) bzw. k10temp (CPU).
  • ⚠️ hwmon-Index und card*-Nummer nicht hardcoden — über name/Existenz auflösen (nicht reboot-stabil).
  • Panel füllt die „n/a"-Plätze: KPI-Karte „System-Last" + „Stack-Gesundheit"-Zeile „Auslastung (RAM/GPU/Disk)".

Features

1. Server-Management ("Update-Panel 2.0")

Aktuell gibt es nur "Container aktualisieren" + "Alles aus dem Speicher". Ziel: den kompletten Server aus der UI verwalten.

  • OS-/Core-Updates (apt update/upgrade) per Knopf, mit Live-Output
  • Dienste steuern (llama-swap, mission-control: Status, Restart)
  • Reboot / Health-Übersicht
  • Referenz: altes ai-control-Skript als Funktionsvorlage
  • ⚠️ Scope-/Security-Sprung: macht MC zum Server-Admin-Panel. Rechte minimal halten (sudoers-Whitelist für genau die erlaubten Befehle, statt Vollzugriff).

2. Live-Terminal / Log via SSH

  • Live-Log-Stream im Browser (Stack-Logs, journalctl)
  • Zugang über SSH bzw. SSH-Key, sauberes Credential-Handling
  • ⚠️ Security-kritisch: SSH-Zugang in einer Web-UI — Auth + strikte LAN-Bindung Pflicht.

3. Live-Auslastung im Dashboard ← NÄCHSTER SCHRITT (Details im Projektstand oben)

  • CPU / RAM / GPU-VRAM+GTT / Temperatur live anzeigen
  • Quellen: sysfs + psutilamd-smi/rocm-smi sind auf dem Bosgame NICHT installiert! GPU-Mem: /sys/class/drm/card1/device/mem_info_*; Temp: hwmon-name amdgpu/k10temp.

4. Cookbook + "Modell holen" verschmelzen

  • Rezept-basiertes Einpflegen (Odysseus-Style): kuratierte Modell-Rezepte (Repo, Datei, ctx, Flags) per Klick installierbar
  • "Modell holen" wird Teil des Cookbooks statt separates Formular

5. Design 2.0

  • Grundgerüst + Design-Sprache in Schritt 1 umgesetzt (Sidebar-Nav, Topbar, Hero, getönte KPI-Kacheln, Health-Signale, Listen, Aktivitäts-Stream, Alert-Banner) — Tokens in css/base.css.
  • Feinschliff pro Feature (jeder neue Bereich nutzt die bestehenden Komponenten/Tokens).
  • Referenz liegt als docs/mission-control-overview.png (vom User nachzulegen; Design ist daran angelehnt).

6. Mehr LLM-Metriken

  • Fähigkeiten pro Modell anzeigen (Text / Bild / Code)
  • Tokens/Sek, Kontextgröße, Quant, Dateigröße auf Platte
  • Status pro Modell: geladen / idle / Ladezeit

7. Integrations-Anleitungen

  • Eingebaute Guides: wie man die LLMs in andere Tools bekommt (OpenCode für Windows, Cline, …)
  • Copy-Paste-fertige Configs (Base-URL, Modell-IDs)

Tech-Leitplanken

  • KISS beibehalten — kein schweres Framework, solange es ohne geht.
  • Sicherheit zuerst bei allem mit Shell-/SSH-Zugriff: LAN-only, Auth, minimale Rechte.
  • Backend-Logik in app.py, UI in static/index.html — Trennung sauber halten.