Модель Grok-3 Mini, разработанная компанией xAI, успешно прошла один из самых сложных тестов на логическое рассуждение. Искусственный интеллект идеально справился со всеми заданиями, при этом многие модели сталкиваются с трудностями на подобных испытаниях.
Тест включал несколько этапов с высокой степенью сложности.
Grok-3 Mini набрал 120 из 120 баллов в задании Marcus Problem, где нужно было правильно интерпретировать запутанные и перемешанные предложения.
В тесте Alice+ Problem модель получила 24 из 24 баллов, несмотря на наличие отвлекающих данных, которые обычно сбивают с толку другие ИИ. Также искусственный интеллект показал идеальный результат — 24 из 24 — в смешанных заданиях высокого уровня сложности, где даже такие модели, как GPT-4.5 и Gemini 2.5 Pro, допускают ошибки.

Илон Маск, комментируя эту новость, заявил следующее: «Скоро ИИ намного превзойдет лучших людей в рассуждениях».
Свежие комментарии