Google объявил о выпуске Gemma 4 — нового семейства открытых моделей искусственного интеллекта, распространяемых под лицензией Apache 2.0. Компания сообщает, что разработчики скачали модели Gemma более 400 миллионов раз с момента выхода первого поколения, а сообщество создало свыше 100 000 вариаций на их основе. В линейку Gemma 4 вошли четыре размера: Effective 2B, Effective 4B, 26B Mixture of Experts и 31B Dense. Модель 31B занимает третье место среди открытых моделей в глобальном рейтинге Arena AI по текстовым задачам, а 26B располагается на шестой позиции.
Gemma 4 получила возможности продвинутого рассуждения, поддержку агентных рабочих процессов с вызовом функций и выдачей структурированного JSON, а также генерацию кода и нативную обработку видео, изображений и аудио. Пограничные (edge) версии моделей имеют контекстное окно до 128K токенов, а более крупные варианты — до 256K, при этом обучение проводилось более чем на 140 языках. Нефактурированные веса в формате bfloat16 для моделей 26B и 31B помещаются на одном 80GB GPU NVIDIA H100, а компактные E2B и E4B оптимизированы для мобильных и IoT-устройств и могут работать офлайн на телефонах, Raspberry Pi и NVIDIA Jetson Orin Nano. Google разрабатывал пограничные модели совместно с командой Pixel, Qualcomm Technologies и MediaTek; Gemma 4 доступна через Google AI Studio, Google AI Edge Gallery и Android Studio с однодневной поддержкой платформ вроде Hugging Face, vLLM, llama.cpp, MLX, Ollama и NVIDIA NIM, а веса можно скачать с Hugging Face, Kaggle или Ollama и развёртывать через Vertex AI, Cloud Run, GKE и ускорённые TPU-сервисы Google Cloud.
