Zum Inhalt springen
Beta · Juni 2026

Deine KI. In Deutschland.
DSGVO-konform.

Kein OpenAI, kein Azure, kein Google. Qwen3-14B läuft auf einer GPU, die nur dir gehört — in einem Rechenzentrum in Nürnberg oder Falkenstein. Deine Dokumente, dein Wissen, deine Daten verlassen nie die EU.

0
US-Cloud-Komponenten
1:1
GPU pro Kunde — nie shared
100 %
EU-Hosting & DSGVO
Phase 1 · Juni 2026

Drei Features zum Beta-Start.
Die dein Team sofort spürt.

Keine Spielerei-KI, keine Hype-Features. Drei Werkzeuge, die im Büro-Alltag wirklich Zeit sparen — und DSGVO-konform sind.

01

Dokument-Summary

Lange PDFs, Verträge, Protokolle — in Sekunden zusammengefasst.

Docling extrahiert Text aus beliebigen Office- und PDF-Formaten, Qwen3-14B fasst Inhalte strukturiert zusammen. Keine Cloud-Roundtrip — alles läuft auf deiner dedizierten GPU.

Stack
DoclingQwen3-14B Q5_K_M
02

Firmen-Chatbot

Wissen, das dein Team wirklich findet.

RAG mit Qdrant + BAAI/bge-m3-Embeddings. Indexiert nur Dokumente, die User explizit freigeben. Jeder Kunde bekommt eigene Collections — keine Cross-Customer-Queries, keine Leaks.

Stack
HaystackQdrantBAAI/bge-m3
03

Meeting-Transkription

Jedes Meeting endet mit fertigem Protokoll im CRM.

Whisper Large-v3-turbo transkribiert auf Deutsch, Qwen3 extrahiert Entscheidungen, Todos und Action-Items. Per Webhook landet alles automatisch im CRM-Kontakt.

Stack
Whisper v3-turboQwen3-14BCRM-Webhook
Roadmap

Was nach dem Beta kommt.

Wir bauen KI nicht in einem Rutsch — sondern schrittweise, geprüft, mit jedem Release DSGVO-abgenommen.

Phase 2
Sept–Dez 2026
  • Email-Draft-Vorschläge
    KI schreibt Mails im Stil vergangener Korrespondenz.
  • Angebots-Generator
    Aus Kundendaten + Produktkatalog entsteht ein Angebotsentwurf.
  • Activity-Empfehlungen
    Next-Best-Action pro Kontakt auf Basis aller Touchpoints.
Phase 3
6–12 Monate
  • Rechnungs-Extraktion
    Eingangsrechnungen werden automatisch Kopf-, Positions- und Steuerdaten zugeordnet.
  • Sales-Forecasting
    Pipeline-Wahrscheinlichkeiten und Abschluss-Prognosen pro Deal.
  • Multilinguale Übersetzung
    Dokumente und Chats lokal übersetzt — ohne Google Translate.
Transparenz · Technik

Nichts versteckt. Nichts geshared.

Wir nennen dir das Modell, die Quantisierung, die GPU und das Rechenzentrum. Keine "Black Box" — Entscheidungen müssen auditierbar sein.

Die Modelle

LLM Qwen3-14B Q5_K_M

Bewusst Q5_K_M statt Q4: im Deutschen messen wir spürbaren Qualitätsverlust bei Q4. Der zusätzliche VRAM-Bedarf ist uns die Ausgabenqualität wert.

STT Whisper Large-v3-turbo

Transkription auf Deutsch mit schwäbischem, bayrischem und Schweizer Akzent getestet. Läuft auf derselben GPU wie das LLM.

EMB BAAI/bge-m3

Embeddings für die RAG-Suche. Multilingual, 1024-dimensional, in Qdrant gespeichert — eine Collection pro Kunde.

Die Infrastruktur

Dedizierte GPU pro Kunde
L4 · L40S · L40×2 je nach Tier. Nie Shared-Server — andere Kunden kommen nicht mal in die Nähe deiner Modelle.
Cosmi-Backend ≠ KI-Backend
Komplett getrennte Systeme mit eigenen Berechtigungen. Ein KI-Prompt kann dir nichts aus der Datenbank leaken — die API-Layer lässt das nicht zu.
RAG-Policy: User gibt frei
Nichts wird automatisch indexiert. User wählen bewusst Dokumente aus, die der Chatbot durchsuchen darf. Keine heimlichen Scrapes, keine Schatten-Modelle.
Hetzner · Deutschland
GPU-Instanzen in Falkenstein und Nürnberg. Meetings laufen über Jitsi auf CPX21–CPX41. Kein Byte fliegt in die USA.
KI-Cloud · Hetzner-GPU

Preise pro dedizierter GPU.

Self-Hosted-KI ist in ORBIT Station und Command bereits enthalten. Für Cloud-Kunden gibt es drei Tiers — jeder mit eigener, nicht geteilter Hardware.

Starter
Bis 10 Mitarbeiter
149 /Monat
Dedizierte L4-GPU
  • Dokument-Summary
  • Firmen-Chatbot
  • Meeting-Transkription
  • Bis 5 GB RAG-Index
  • Hetzner EU-Hosting
Auf Warteliste
Enterprise
Bis 200 Mitarbeiter
899 /Monat
Dedizierter L40×2
  • Alle Professional-Features
  • Bis 100 GB RAG-Index
  • Eigene Fine-Tunings möglich
  • Dedizierter KI-Ansprechpartner
  • SLA: 4h-Reaktion
Auf Warteliste

Alle Preise exkl. MwSt. · Monatlich kündbar · Daten-Export jederzeit.

Live-Preview · Firmen-Chatbot

So sieht der Chatbot aus,
den dein Team bekommt.

Er kennt Meetings, Dokumente und Aufgaben, die du ihm freigibst. Keine magische Allwissenheit — sondern ein gezielter Assistent auf eurer Wissensbasis.

  • Antworten mit Quellen-Nachweisen
  • KI-Disclosure direkt in der Chat-UI
  • Auf Deutsch — mit deutschem Grammatik-Gefühl
K
COSMI Assistent
Lokal · Qwen3-14B Q5_K_M
Fasse mir das Meeting „Projekt Alpha" vom 12.03. zusammen.
Aus dem Meeting-Transkript · 3 Entscheidungen
  • Deadline verschoben auf 30.04.2026
  • Zusatzbudget +15 000 € bewilligt
  • Max übernimmt Client-Teil, Lara das Backend
Meeting-Notiz · 12.03.2026 · Transkript.md
Erstelle daraus eine Aufgabe für Max.
Aufgabe wurde angelegt
Client-Teil Projekt Alpha
👤 Max 🗓 bis 30.04. ⚡ Hoch
Künstliche Intelligenz unterstützt dich. Ergebnisse bitte prüfen. · Mehr erfahren
Begrenzte Plätze · Beta Juni 2026

Bereit für KI,
die deinem Unternehmen gehört?

Wir starten mit einer kleinen Gruppe. Waitlist-Zugang sichert dir früheren Launch, Preisstabilität und direkten Draht zur Entwicklung.

Transparenz gemäß EU AI Act Art. 50 · Hetzner-AVV inkludiert · Datenexport jederzeit