Wofür · Entscheidungshilfe

Lokal & Self-Hosting

Offline/On-Device, Datenhoheit, eigene Infrastruktur. Hier die kuratierten Empfehlungen – Modelle, Werkzeuge und Tipps.

← Alle Aufgaben

Empfohlene Modelle

Alle Modelle →

DeepSeek · open-weight

DeepSeek-V4-Pro

Open-Weight-Preis-Leistung

Der Preis-Leistungs-Sieger unter den offenen Gewichten: stärkstes Coding (47) und Agentic (67) seiner Preisklasse, dabei mit Abstand am günstigsten und selbst hostbar. Erste Wahl, wo Kosten, Datenhoheit oder lange Generierungen zählen – allerdings reine Text-Modalität.

Intelligenz44

Mistral AI · open-weight

Mistral Large 3

Open-Weight für EU/Souverän

Günstigstes Flaggschiff ($0,50 / $1,50) und Apache-2.0-offen – damit self-hosted und für souveräne EU-Deployments geeignet. Unabhängige Capability-Indizes stehen noch aus (bislang nur LMArena-Elo 1416), daher solide statt Spitze.

Human-Präferenz1416

Meta · open-weight

Llama 4 Maverick

Kontext-Spezialist

Mit bis zu 10 Mio. Token das größte Kontextfenster im Katalog – aber der niedrigste Human-Präferenz-Elo (1327). Lohnt vor allem für extrem lange Kontexte und Self-Hosting, weniger für Spitzen-Antwortqualität.

Human-Präferenz1327

Google · open-weight

Gemma 4 12B

Lokal & On-Device

Nicht für Spitzenleistung gebaut, sondern für lokalen/Edge-Betrieb: läuft auf Consumer-Laptops, multimodal und Apache-2.0-offen. Empfehlung dort, wo Offline-Betrieb, Datenschutz oder Hardware-Limits wichtiger sind als Benchmark-Spitzen.

Cohere · proprietär

Command A+

Enterprise & Souveränität

Auf souveräne/Enterprise-Deployments zugeschnitten (läuft effizient auf 1× B200 oder 2× H100), mit Vision und mehrsprachiger Stärke. Kein öffentlicher Token-Preis und keine unabhängigen Benchmarks – Einordnung nur über die Anbieter-Spezifikation möglich.

Passende Werkzeuge

Alle Werkzeuge →