Минцифры планирует в 2024 году создать центр обезличивания данных для обучения искусственного интеллекта.
Как сообщило РИА "НОВОСТИ", будет построен центр обезличивания – специальная инфраструктура внутри ГИС Минцифры. Он будет брать исходные данные и делать из них обезличенные. Перед созданием центра изготовят его макет - программно-аппаратный комплекс, и на нем проведут соответствующие исследования по обезличиванию.
Комментирует Олег Матюнин:
Обезличивание − широко применяемый с давних времен прием защиты сведений, подлежащих передаче третьим лицам. Он реализуется в науке при работе со сведениями, охраняемыми законом, в социологических, психологических, медицинских и других исследованиях. Обезличивание сопутствует формированию официальной статистики. С 2010 года при размещении судебных решений в сети «Интернет» также требуется их обезличивание. Одной из разновидностей обезличивания можно считать сокрытие данных о личности в целях обеспечения ее безопасности в уголовном процессе. Обезличивание широко применяется как технический прием при трансляции кадров оперативной и документальной фото и видеосъемки и может выражаться в ретушировании изображения, искажении голоса.
Технически необходимость обезличивания решается по-разному. Самый простой и известный способ − анонимный опрос или анонимная анкета. В этих случаях этап обезличивания преодолевается с минимальными усилиями, однако никто не снимает необходимости разработки опросников, анкет, их распространения, заполнения, сбора и последующей обработки.
Сложнее дело обстоит в случаях, когда обезличивание осуществляется путем постобработки материалов, содержащих данные, охраняемые законом. Конфиденциальные данные.
При обезличивании судебных актов иногда возникает две крайности: либо «вымарываются» не все данные, и тогда при внимательном чтении можно найти в тексте фамилию или наименование, либо наоборот − из текста исчезает чрезмерный объем данных вплоть до названий салатов («Цезарь», например).
Относительно проекта Минцифры пока вопросов больше, чем понимания.
Каков состав и объем получаемых данных? Несмотря на факт их обезличивания, исходные данные в объективной реальности распределены по обладателям, материальным носителям и охраняются правовыми режимами.
Казалось бы, банальные фамилия, имя, отчество и дата рождения, в действительности могут подпадать не только под режим персональных данных, но также входить в состав специальных и профессиональных тайн: государственной, нотариальной, врачебной, страховой, предварительного расследования, связи и многих других.
И если технически переход сведений от одного субъекта другому выглядит примерно одинаково: в зависимости от носителя информации они передаются из рук в руки либо почтовым отправлением либо по иным каналам обмена данными, то юридически всё далеко не так одинаково.
Порядок доступа к конфиденциальным сведениям, порядок их передачи, распространения, они все по-своему уникальны применительно к каждому виду охраняемых сведений. К государственной тайне применяются одни нормы и правила, к тайне усыновления (удочерения) другие.
Сейчас их в районе сотни по нашему законодательству набирается, там не только «тайны», а любые сведения, распространение которых ограничено, и в отношении которых действует особый порядок обработки. Инсайдерская информация, охраняемые информационные материалы ЕГЭ, сведения о населении, встречающиеся в переписных листах и многое, многое другое.
Поэтому, решив технологические вопросы сбора данных, Минцифры должен решить целый ряд других вопросов, которые кратко можно описать следующей логической цепочкой:
Вид данных − объем данных − обладатель − порядок передачи − возможность передачи − осуществление передачи в центр обезличивания − обработка и хранение данных в центре обезличивания − защита получаемых сведений от незаконного изменения и утечек − удаление данных после достижения целей их получения.
Таким образом, от идеи и технической возможности необходимо пройти непростой путь к юридической проработке и закреплению всех этапов и процедур, которые позволят не растерять обезличиваемую информацию и максимально защитить её.
Технически необходимость обезличивания решается по-разному. Самый простой и известный способ − анонимный опрос или анонимная анкета. В этих случаях этап обезличивания преодолевается с минимальными усилиями, однако никто не снимает необходимости разработки опросников, анкет, их распространения, заполнения, сбора и последующей обработки.
Сложнее дело обстоит в случаях, когда обезличивание осуществляется путем постобработки материалов, содержащих данные, охраняемые законом. Конфиденциальные данные.
При обезличивании судебных актов иногда возникает две крайности: либо «вымарываются» не все данные, и тогда при внимательном чтении можно найти в тексте фамилию или наименование, либо наоборот − из текста исчезает чрезмерный объем данных вплоть до названий салатов («Цезарь», например).
Относительно проекта Минцифры пока вопросов больше, чем понимания.
Каков состав и объем получаемых данных? Несмотря на факт их обезличивания, исходные данные в объективной реальности распределены по обладателям, материальным носителям и охраняются правовыми режимами.
Казалось бы, банальные фамилия, имя, отчество и дата рождения, в действительности могут подпадать не только под режим персональных данных, но также входить в состав специальных и профессиональных тайн: государственной, нотариальной, врачебной, страховой, предварительного расследования, связи и многих других.
И если технически переход сведений от одного субъекта другому выглядит примерно одинаково: в зависимости от носителя информации они передаются из рук в руки либо почтовым отправлением либо по иным каналам обмена данными, то юридически всё далеко не так одинаково.
Порядок доступа к конфиденциальным сведениям, порядок их передачи, распространения, они все по-своему уникальны применительно к каждому виду охраняемых сведений. К государственной тайне применяются одни нормы и правила, к тайне усыновления (удочерения) другие.
Сейчас их в районе сотни по нашему законодательству набирается, там не только «тайны», а любые сведения, распространение которых ограничено, и в отношении которых действует особый порядок обработки. Инсайдерская информация, охраняемые информационные материалы ЕГЭ, сведения о населении, встречающиеся в переписных листах и многое, многое другое.
Поэтому, решив технологические вопросы сбора данных, Минцифры должен решить целый ряд других вопросов, которые кратко можно описать следующей логической цепочкой:
Вид данных − объем данных − обладатель − порядок передачи − возможность передачи − осуществление передачи в центр обезличивания − обработка и хранение данных в центре обезличивания − защита получаемых сведений от незаконного изменения и утечек − удаление данных после достижения целей их получения.
Таким образом, от идеи и технической возможности необходимо пройти непростой путь к юридической проработке и закреплению всех этапов и процедур, которые позволят не растерять обезличиваемую информацию и максимально защитить её.