Google · Gemma
Gemma 4 12B
gemma-4-12b
open-weightTextBildAudio
SituativLokal & On-Device
Nicht für Spitzenleistung gebaut, sondern für lokalen/Edge-Betrieb: läuft auf Consumer-Laptops, multimodal und Apache-2.0-offen. Empfehlung dort, wo Offline-Betrieb, Datenschutz oder Hardware-Limits wichtiger sind als Benchmark-Spitzen.
- lokale/Edge-KI
- On-Device-Multimodalität
- Self-Hosting auf kleiner Hardware
- Kontextfenster
- 256 K Token
- Preis (Input / Output)
- k. A. je 1 Mio. Token
- Preis-Stand
- 2026-06-15
- Wissensstichtag
- Jan 2025
Stärken
- Offene Gewichte unter Apache-2.0-Lizenz (lokal/self-hosted)
- Encoder-freie multimodale Architektur (Text, Bild, Audio) – läuft lokal auf Laptops mit 16 GB RAM
- 256-K-Token-Kontext, konfigurierbare Thinking-Modi, natives Function-Calling
Schwächen
- Kein zentraler Token-Preis – Kosten je nach Hoster/eigener Infrastruktur
- Erreicht laut Anbieter ein größeres 26-Mrd.-MoE-Modell nur annähernd (unabhängig nicht bestätigt)
Typische Einsatzfälle
- lokale/Edge-KI
- multimodale Aufgaben auf Consumer-Hardware
- Self-Hosting
Einordnung
- Auf lokale/Edge-Nutzung ausgelegt statt auf Spitzenleistung: ~12 Mrd. Parameter, läuft laut Anbieter auf Consumer-Laptops mit 16 GB RAM (Anbieterangabe), Apache 2.0.
- Encoder-frei multimodal (Text, Bild, Audio) bei 256-K-Kontext – deutlich kleiner als die Cloud-Flaggschiffe, dafür offline/on-device betreibbar.
ℹ️ 11,95 Mrd. Parameter, 48 Layer, encoder-frei (Bild/Audio direkt in den Embedding-Raum projiziert). Apache 2.0 (offiziell, nicht die alte Gemma-Lizenz). Audio bis 30 s, Video bis 60 Frames. Verfügbar via Hugging Face, Kaggle, LM Studio, Ollama, Google AI Edge.