04 June 2026

Google представляет Gemma 4 12B — локальную модель ИИ для ПК

Google представила новую модель искусственного интеллекта под названием Gemma 4 12B. Технологический гигант описывает Gemma 4 12B как «унифицированный трансформатор», предназначенный для передачи агентного мультимодального интеллекта напрямую на ноутбуки.
Новая модель расположена между меньшим Gemma E4B и продвинутой моделей 26B Mixture of Experts (MoE), обеспечивая баланс производительности и эффективности.

Google также сообщила, что семейство моделей Gemma превысило 150 миллионов загрузок. Компания сообщила, что разработчики уже использовали модели Gemma для широкого спектра проектов — от носимых роботизированных рук для физической помощи до корпоративных решений по безопасности.

Google Gemma 4 12B: ключевые возможности
Одним из главных преимуществ Gemma 4 12B является то, что она может работать локально на устройствах всего с 16 ГБ оперативной памяти или видеопамяти. По данным Google, модель обладает продвинутыми возможностями рассуждения, сохраняя относительно небольшой объем памяти. Google также утверждает, что Gemma 4 12B — это первая среднеразмерная модель с поддержкой нативного аудиовхода.

В отличие от многих мультимодальных моделей ИИ, которые зависят от отдельных энкодеров для визуальной и аудиоинформации, Gemma 4 12B обрабатывает эти входы напрямую через основную основу своей языковой модели. Google описывает это как более упрощённый подход, который помогает снизить использование памяти и повысить скорость отклика.

Для обработки изображений Google заменила традиционный кодировщик видения на лёгкий модуль вложения. «Это позволяет магистрали LLM взять на себя визуальную обработку», — объяснил Google. Кроме того, вместо использования отдельного аудиокодера Gemma 4 12B проецирует сырые аудиосигналы прямо в то же пространство, где используются текстовые токены.

Google также отметил, что Gemma 4 12B оснащён драфтерами Multi-Token Prediction (MTP) для снижения задержек. По данным компании, модель демонстрирует эталонную производительность, близкую к своему более крупному аналогу 26B. Это может сделать продвинутый мультимодальный ИИ и рабочие процессы на основе агентов более доступными для разработчиков и пользователей, желающих запускать ИИ локально на повседневном оборудовании.
Сценарий от Digit
(в пересказе) 
Мнение авторов может не совпадать с мнением редакции. Cообщество журналистов. Non profit

Subscribe to this Blog via Email :