← Alle Modelle

Google · Gemma

Gemma 4 12B

gemma-4-12b

open-weightTextBildAudio

SituativLokal & On-Device

Nicht für Spitzenleistung gebaut, sondern für lokalen/Edge-Betrieb: läuft auf Consumer-Laptops, multimodal und Apache-2.0-offen. Empfehlung dort, wo Offline-Betrieb, Datenschutz oder Hardware-Limits wichtiger sind als Benchmark-Spitzen.

  • lokale/Edge-KI
  • On-Device-Multimodalität
  • Self-Hosting auf kleiner Hardware
Kontextfenster
256 K Token
Preis (Input / Output)
k. A. je 1 Mio. Token
Preis-Stand
2026-06-15
Wissensstichtag
Jan 2025

Stärken

  • Offene Gewichte unter Apache-2.0-Lizenz (lokal/self-hosted)
  • Encoder-freie multimodale Architektur (Text, Bild, Audio) – läuft lokal auf Laptops mit 16 GB RAM
  • 256-K-Token-Kontext, konfigurierbare Thinking-Modi, natives Function-Calling

Schwächen

  • Kein zentraler Token-Preis – Kosten je nach Hoster/eigener Infrastruktur
  • Erreicht laut Anbieter ein größeres 26-Mrd.-MoE-Modell nur annähernd (unabhängig nicht bestätigt)

Typische Einsatzfälle

  • lokale/Edge-KI
  • multimodale Aufgaben auf Consumer-Hardware
  • Self-Hosting

Einordnung

  • Auf lokale/Edge-Nutzung ausgelegt statt auf Spitzenleistung: ~12 Mrd. Parameter, läuft laut Anbieter auf Consumer-Laptops mit 16 GB RAM (Anbieterangabe), Apache 2.0.
  • Encoder-frei multimodal (Text, Bild, Audio) bei 256-K-Kontext – deutlich kleiner als die Cloud-Flaggschiffe, dafür offline/on-device betreibbar.

ℹ️ 11,95 Mrd. Parameter, 48 Layer, encoder-frei (Bild/Audio direkt in den Embedding-Raum projiziert). Apache 2.0 (offiziell, nicht die alte Gemma-Lizenz). Audio bis 30 s, Video bis 60 Frames. Verfügbar via Hugging Face, Kaggle, LM Studio, Ollama, Google AI Edge.