На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

iXBT.com

34 подписчика

Свежие комментарии

  • Иван Николаев
    Японцы одновременно выпустили три лимитированных серии. Вот кросстрек, плюс импреза, плюс леворг. Кросстрек, конечно,...Представлен новый...
  • Юрий Стенякин
    А если учесть что компания официально ушла с российского рынка то преимущества спорныПредставлена нова...
  • Mikhail Stepanov
    Ха-ха! В то время, как российская гиперзвуковой ракета летит со скоростью около 20 тыс. км. В час!США успешно испыт...

Семь часов автономной работы без «амнезии»: новая ИИ-модель Claude Opus 4 набрала 72,5% на тесте для разработчиков

Компания Anthropic представила модели искусственного интеллекта Claude Opus 4 и Claude Sonnet 4, которые существенно повысили автономность ИИ в сложных задачах. Флагманская Claude Opus 4 продемонстрировала способность работать над рефакторингом открытого кода в течение семи часов без вмешательства человека во время тестирования в Rakuten.

Эта «выносливость» — качественный скачок по сравнению с предыдущими моделями, которые сохраняли концентрацию лишь минуты. На бенчмарке SWE-bench Opus 4 набрал 72,5%, превзойдя GPT-4.1 от OpenAI (54,6% в апреле 2025).

Индустрия ИИ с 2025 года смещается в сторону моделей, основанных на рассуждениях. Такие системы, в отличие от шаблонного анализа данных, имитируют человеческое мышление, предварительно анализируя проблемы. Тренд поддержали Google с Gemini 2.5 Pro и функцией Deep Think, а также DeepSeek с моделью R1, которая за счёт низкой цены и эффективности увеличила долю рынка. Согласно отчёту Poe, использование ИИ с рассуждениями выросло с 2% до 10% …

Ссылка на первоисточник
наверх