Tag: Gpu

2 Beiträge

Self-Hosted Voice-AI-Plattform für Teams mit Datenresidenz-Anforderungen

May 21, 2026 · 3 min read · case-studies

GPU-gestützte Self-Hosted Voice AI auf Dograh: STT, LLM, TTS in EU oder kundeneigener VPC. Gemessene Latenzen, Outcome-Writeback.

Self-Hosted LLM auf Kubernetes: Produktives vLLM-Deployment

April 5, 2026 · 14 min read · blog

Vollständiger Self-Hosted-LLM-Kubernetes-Leitfaden. vLLM auf GPU-Nodes mit Manifests, HPA, Monitoring und Kostenmodell. Praktiker-Notizen inklusive. Kostenlose KI-Automatisierungs-Checkliste zum Download.