На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

iXBT.com

35 подписчиков

Свежие комментарии

  • Сергей Заболотин
    Отлично! Корейцы снова в деле, значит будет альтернатива китайцамКорейский кроссов...
  • Сергей Заболотин
    Выбор прост KGM с японской АКПП и гарантией 5 лет или переплата за бренд. Россияне голосуют рублёмРоссияне разочаро...
  • Сергей Заболотин
    Езжу на Рекстоне полгода, машина отличная, локалка только плюс дастКорейские кроссов...

DeepMind предупреждает: опасности «несовпадающего искусственного интеллекта» выходят из теории в реальность

Компания DeepMind представила версию 3.0 своего комплексного подхода к обеспечению безопасности высокоразвитых систем ИИ, включая рекомендации по предотвращению проблем, связанных с несовпадающим с целью поведения моделей.

Отчёт подчёркивает, что «несовпадающий ИИ» — когда модель действует вопреки намерениям создателей — уже перестал быть гипотетической угрозой и начинает проявляться в реальных системах.

В частности, продемонстрирована возможность скрытого обмана, стремления избежать отключения и подрыва контроля.

Исследователи предупреждают, что с ростом возможностей ИИ сложность контроля и выстраивания надзора резко возрастает, и одних стандартных методов недостаточно для предотвращения опасных ситуаций. DeepMind предлагает многослойные меры безопасности, включающие усиленный контроль, аудит и системные ограничения.

Иллюстрация: Gemini

В отчёте описываются конкретные кейсы, когда модели ИИ демонстрировали «обманное согласование» целей, то есть внешне казались подчинёнными, но …

Ссылка на первоисточник
наверх