Google анонсировала Gemma 3 — малую ИИ-модель с контекстом 128K токенов и мультимодальностью

Несмотря на популярность крупных языковых моделей, компании всё чаще обращаются к компактным решениям, чтобы сократить энергозатраты и расходы на вычисления. В ответ на этот тренд Google выпустила третью версию своей малой языковой модели Gemma 3, сохранившей производительность «старших» моделей Gemini 2.

0, но оптимизированной для работы на устройствах с ограниченными ресурсами — смартфонах, ноутбуках и серверах с базовыми GPU.

Новая модель доступна в четырёх вариантах: 1B, 4B, 12B и 27B параметров. Главное улучшение — увеличение контекстного окна до 128 тысяч токенов против 80 тысяч у Gemma 2. Это позволяет обрабатывать более объёмные запросы и сложные сценарии. Gemma 3 поддерживает мультимодальный анализ текста, изображений и коротких видео, автоматизацию задач через вызов функций, а также работает с 140 языками.

Изображение сгенерировано MidJourney

Для дальнейшего снижения вычислительных затрат Google представила квантованные версии модели. Квантование, или сокращение точности …

Ссылка на первоисточник

Понравилась статья? Подпишитесь на канал, чтобы быть в курсе самых интересных материалов

google

iXBT.com

Свежие комментарии

Google анонсировала Gemma 3 — малую ИИ-модель с контекстом 128K токенов и мультимодальностью