Новые возможности развития искусственного интеллекта: в России разрабатывают национальный стандарт синтеза данных

На площадке Ассоциации больших данных, Сбер и другие участники АБД разработали предварительный проект национального стандарта синтеза данных. Как рассказали в пресс-службе Сбера, стандарт призван повысить доступность, безопасность и качество данных для развития искусственного интеллекта в России.

Сгенерировано нейросетью Dall-E

В Сбере пояснили:

Одна из главных задач стандарта — описать технологию создания конфиденциальных синтетических данных для развития технологий искусственного интеллекта (AI).

Соблюдать приватность необходимо на всех этапах процесса синтезирования, который основан на методе дифференциальной приватности.

В документе приведены математические доказательства того, что при выполнении рекомендаций стандарта можно синтезировать данные без риска нарушения конфиденциальности. Фактически безопасность обеспечивается через поиск оптимального соотношения между защитой конфиденциальности и качеством получаемых наборов данных (датасетов).

Анна Серебряникова, президент Ассоциации больших данных, рассказала:

С вводом в действие национального стандарта синтеза данных будет обеспечена прозрачность процесса синтезирования, надёжность архитектуры и определены критерии качества данных. Синтетические данные становятся реальной альтернативой обезличенным данным, которые сегодня зачастую скованы излишними регуляторными ограничениями. При соблюдении требований приватности синтетические данные не несут в себе рисков и открывают прорывной путь к достижению целей по доступности данных, необходимых для обучения искусственного интеллекта. Надеемся, что с внедрением национального стандарта синтеза данных мы сможем обеспечить такие требования и ввести синтетические данные в широкий оборот в нашей стране.

В 2025 году планируется утвердить проект предварительного национального стандарта в Техническом комитете по стандартизации «Искусственный интеллект» (ТК 164).

Ссылка на первоисточник

Понравилась статья? Подпишитесь на канал, чтобы быть в курсе самых интересных материалов

анна серебряникова

технический комитет по стандартизации

iXBT.com

Свежие комментарии

Прогресс

Новые возможности развития искусственного интеллекта: в России разрабатывают национальный стандарт синтеза данных