docs: add comprehensive hardware and tech stack summaries for Zora and Meldestelle
Added detailed hardware specifications for the Minisforum MS-R1 (Zora) and a complete tech stack overview for the Meldestelle project. Included session logs summarizing research findings, AI relevance, and next steps for self-hosted AI model configurations. Consolidated related reference materials for streamlined documentation.
This commit is contained in:
@@ -0,0 +1,57 @@
|
||||
---
|
||||
type: Journal
|
||||
status: DONE
|
||||
owner: Lead Architect
|
||||
date: 2026-03-07
|
||||
---
|
||||
# Session Log — Tech-Stack Zusammenfassung
|
||||
|
||||
**Datum:** 07. März 2026
|
||||
**Agent:** 🏗️ Lead Architect
|
||||
**Ziel:** Vollständige Tech-Stack-Dokumentation als Recherche-Basis für Self-Hosted AI
|
||||
|
||||
---
|
||||
|
||||
## Kontext
|
||||
|
||||
Nach der Zora-Hardware-Zusammenfassung (gleiche Session) wurde eine vollständige
|
||||
Tech-Stack-Übersicht des Projekts "Meldestelle" erstellt — optimiert als Grundlage
|
||||
für die Auswahl und Konfiguration eines Self-Hosted AI-Modells (Ollama auf Zora).
|
||||
|
||||
---
|
||||
|
||||
## Erstellte Dokumente
|
||||
|
||||
| Datei | Inhalt |
|
||||
|:------|:-------|
|
||||
| `docs/01_Architecture/Meldestelle_Tech_Stack_Zusammenfassung.md` | Vollständige Tech-Stack-Referenz |
|
||||
|
||||
---
|
||||
|
||||
## Inhalt der Zusammenfassung
|
||||
|
||||
- **Sprachen & Laufzeiten:** Kotlin 2.3, Java 25 (EA), Gradle 9.3.1, ARM64
|
||||
- **Frontend:** Compose Multiplatform 1.10, SQLDelight 2.2, Koin 4.1, Ktor 3.4
|
||||
- **Backend:** Spring Boot 3.5.9, Spring Cloud 2025.0.1, Exposed 1.0, Flyway 11
|
||||
- **Infrastruktur:** Keycloak 26.4, Consul 1.21, Valkey 8, PostgreSQL 16, Zipkin, Prometheus, Grafana
|
||||
- **CI/CD:** Gitea Actions, Docker Buildx (ARM64), Pangolin-Tunnel
|
||||
- **AI-Relevanz:** Modell-Empfehlungen, RAG-Dokument-Prioritäten, Anforderungsmatrix
|
||||
|
||||
---
|
||||
|
||||
## AI-Empfehlungen (Ergebnis)
|
||||
|
||||
| Modell | Einsatz |
|
||||
|:--------------------|:-------------------------------|
|
||||
| `qwen2.5-coder:14b` | Primär — Kotlin/Spring/SQL |
|
||||
| `qwen2.5:32b` | Architektur + Fachlogik |
|
||||
| `llama3.1:8b` | Schnell, Deutsch, Allgemein |
|
||||
|
||||
---
|
||||
|
||||
## Nächste Schritte
|
||||
|
||||
1. Proxmox LXC für AI-Stack (Ollama + Open WebUI) einrichten
|
||||
2. `qwen2.5-coder:14b` als erstes Modell laden
|
||||
3. RAG mit `/docs`-Verzeichnis in Open WebUI konfigurieren
|
||||
4. Continue.dev Plugin in IntelliJ IDEA integrieren
|
||||
@@ -0,0 +1,41 @@
|
||||
---
|
||||
type: Journal
|
||||
status: ACTIVE
|
||||
owner: Lead Architect
|
||||
date: 2026-03-07
|
||||
---
|
||||
# Session Log — 07. März 2026: Zora Hardware-Zusammenfassung
|
||||
|
||||
## Kontext
|
||||
|
||||
Samstag-Session. Ziel: Vollständige Hardware- und Konfigurations-Zusammenfassung
|
||||
von Zora (Minisforum MS-R1) als Basis für weitere Self-Hosted AI Recherchen.
|
||||
|
||||
## Durchgeführte Änderungen
|
||||
|
||||
| Datei | Aktion | Beschreibung |
|
||||
|:------|:-------|:-------------|
|
||||
| `docs/01_Architecture/Minisforum-MS-R1/Zora_Hardware_Zusammenfassung.md` | NEU | Vollständige Hardware-Referenz (CPU, GPU, NPU, RAM, Ports, Proxmox-Konfiguration, VMs/LXCs, Netzwerk, AI-Potenzial) |
|
||||
|
||||
## Inhalt der Zusammenfassung
|
||||
|
||||
Das neue Dokument konsolidiert alle relevanten Informationen aus:
|
||||
- `Spezifikation.md` — Hersteller-Specs
|
||||
- `SSoT_Konfigurations-Masterplan_Zora.md` — Proxmox-Konfiguration, VMs, Netzwerk
|
||||
- `AI_Stack_Ollama_Setup.md` — CPU-Cluster-Details, AI-Architektur-Entscheidungen
|
||||
- `MS-R1_Konfiguration&Bedienung.md` — Betriebssystem, Kernel, Netzwerk
|
||||
|
||||
## Gelernt / Erkenntnisse
|
||||
|
||||
- **CIX P1 NPU**: Aktuell kein Ollama/llama.cpp-Support — Recherche-Thema für die Zukunft
|
||||
- **64 GB RAM**: Ermöglicht 70B-Modelle vollständig im RAM (Q4 ≈ 40 GB)
|
||||
- **Tri-Cluster CPU**: Cortex-X4 (Kerne 8–11) für AI-Inferenz priorisieren
|
||||
- **Immortalis-G720**: Vulkan 1.3 vorhanden — experimentelle GPU-Beschleunigung möglich
|
||||
|
||||
## Nächste Schritte
|
||||
|
||||
- [ ] Self-Hosted AI Recherche: llama.cpp ARM64 NEON/SVE2-Optimierungen
|
||||
- [ ] CIX P1 NPU SDK recherchieren (Minisforum/CIX Community)
|
||||
- [ ] Immortalis-G720 Vulkan Compute für llama.cpp evaluieren
|
||||
- [ ] LXC 111 (ai-stack, 10.0.0.60) aufsetzen — Anleitung in `AI_Stack_Ollama_Setup.md`
|
||||
- [ ] Meldestelle-Host DevOps abschließen (Ping-Service grün verifizieren)
|
||||
Reference in New Issue
Block a user