Несмотря на популярность крупных языковых моделей, компании всё чаще обращаются к компактным решениям, чтобы сократить энергозатраты и расходы на вычисления. В ответ на этот тренд Google выпустила третью версию своей малой языковой модели Gemma 3, сохранившей производительность «старших» моделей Gemini 2.
0, но оптимизированной для работы на устройствах с ограниченными ресурсами — смартфонах, ноутбуках и серверах с базовыми GPU.Новая модель доступна в четырёх вариантах: 1B, 4B, 12B и 27B параметров. Главное улучшение — увеличение контекстного окна до 128 тысяч токенов против 80 тысяч у Gemma 2. Это позволяет обрабатывать более объёмные запросы и сложные сценарии. Gemma 3 поддерживает мультимодальный анализ текста, изображений и коротких видео, автоматизацию задач через вызов функций, а также работает с 140 языками.

Для дальнейшего снижения вычислительных затрат Google представила квантованные версии модели. Квантование, или сокращение точности …
Свежие комментарии