На площадке Ассоциации больших данных, Сбер и другие участники АБД разработали предварительный проект национального стандарта синтеза данных. Как рассказали в пресс-службе Сбера, стандарт призван повысить доступность, безопасность и качество данных для развития искусственного интеллекта в России.
В Сбере пояснили:
Одна из главных задач стандарта — описать технологию создания конфиденциальных синтетических данных для развития технологий искусственного интеллекта (AI).
Соблюдать приватность необходимо на всех этапах процесса синтезирования, который основан на методе дифференциальной приватности.В документе приведены математические доказательства того, что при выполнении рекомендаций стандарта можно синтезировать данные без риска нарушения конфиденциальности. Фактически безопасность обеспечивается через поиск оптимального соотношения между защитой конфиденциальности и качеством получаемых наборов данных (датасетов).
Анна Серебряникова, президент Ассоциации больших данных, рассказала:
С вводом в действие национального стандарта синтеза данных будет обеспечена прозрачность процесса синтезирования, надёжность архитектуры и определены критерии качества данных. Синтетические данные становятся реальной альтернативой обезличенным данным, которые сегодня зачастую скованы излишними регуляторными ограничениями. При соблюдении требований приватности синтетические данные не несут в себе рисков и открывают прорывной путь к достижению целей по доступности данных, необходимых для обучения искусственного интеллекта. Надеемся, что с внедрением национального стандарта синтеза данных мы сможем обеспечить такие требования и ввести синтетические данные в широкий оборот в нашей стране.
В 2025 году планируется утвердить проект предварительного национального стандарта в Техническом комитете по стандартизации «Искусственный интеллект» (ТК 164).
Свежие комментарии