В России могут обязать раскрывать набор данных для обучения ИИ

pxhere.com
В России обсуждается инициатива обязать разработчиков отечественных моделей искусственного интеллекта раскрывать сведения о наборах данных, на которых обучались и тестировались нейросети. Об этом сообщили участники обсуждения, знакомые с подготовкой профильного законопроекта.
Предполагается, что компании должны будут указывать название набора данных, дату его создания, назначение, формат, объем и происхождение. Рассматриваются варианты создания отдельного реестра отечественного ИИ либо реестра наборов данных. Где именно будет аккумулироваться такая информация, пока не определено.
В Минцифры подтвердили, что в текущей версии рамочного законопроекта требований о раскрытии обучающих данных нет. Документ пока носит общий характер и определяет базовые подходы к регулированию отрасли. Правительство также прорабатывает критерии «российской» нейросети, вопросы авторского права, маркировки ИИ-контента, ответственности за нарушения и предотвращения использования ИИ в преступных целях. Рассматривается возможность признания применения ИИ отягчающим обстоятельством при совершении правонарушений.
Представители отрасли указывают, что полное описание массивов данных может потребовать значительных ресурсов и стать формальностью без реальной аналитической ценности. Кроме того, раскрытие информации может затронуть коммерческие интересы разработчиков и замедлить вывод новых решений на рынок. В то же время сторонники инициативы считают, что прозрачность повысит доверие к моделям, позволит независимую оценку качества и дисциплинирует работу с данными. Это также может способствовать формированию легального рынка данных и снижению рисков использования материалов без разрешения правообладателей.
Эксперты отмечают, что при введении обязательного раскрытия потребуется разработка гибких лицензионных механизмов. В международной практике подобные требования уже применяются, однако их реализация связана с юридическими и техническими сложностями. Пока окончательные решения по инициативе не приняты. Обсуждение продолжается на площадках профильных ассоциаций и ведомств, пишут Ведомости.

