Правительство России стремится к регулированию новых направлений в информационных технологиях. Для регулирования, контроля или запрета использования новых технологий в России необходима разработка специального федерального законодательства. Для исследования возможности регулирования больших данных (BigData), при поддержке Правительства России и федеральных служб была создана специальная рабочая группа.
Регулирование для BIGDATA
Вопрос сбора, обработки и хранения больших данных является сейчас одним из самых актуальных для государства и интернет-индустрии в целом. Огромные возможности, которые открывают новые методы обработки информации, постоянно вызывают дискуссии о том, насколько большие данные способны раскрыть персональную информацию пользователей, и кому они должны принадлежать.
В состав рабочей группы вошли федеральные чиновники из министерства цифрового развития и Роскомнадзора, эксперты крупнейших российских интернет-брендов, таких как MAIL.Ru, Ростелеком, Megafon, торговых и рекламных площадок, операторов связи, СМИ, научных и образовательных организаций. В общей сложности в состав рабочей группы входило около 80 экспертов по различным аспектам работы больших данных.
Цели и задачи регулирования больших данных в России
Основной целью регулирования больших данных в России стала выработка отраслевых рекомендаций, которые помогли бы разработать наиболее адекватные и эффективные правовые нормы для регулирования процедур сбора, хранения и обработки больших данных, а также разработка понятийного аппарата, который позволил бы описать сущность больших данных, методы их сбора, обработки и хранения, а также использования для нужд бизнеса и государственного управления. Большие данные стратегически важная информация, которую необходимо использовать для защиты государства и граждан от внешнего негативного влияния и влияния иностранных агентов внутри страны.
Чиновники и эксперты предложили несколько подходов к разработке определения больших данных и основных понятий, которые будут использоваться при законодательном регулировании процессов их сбора, обработки и хранения. По мнению экспертов данное определение должно носить просветительский характер, призванный разъяснить обществу особенности BigData, сделать работу с большими данными проще для понимания, упростить процессы работы и регулирования в этой области.
Один из предложенных подходов основывался на подходе «все, что не является персональными данными». Следуя этому подходу, все термины можно определить по единому принципу, например:
Оригинал: персональные данные – любая информация, относящаяся к прямо или косвенно определенному или определяемому физическому лицу (субъекту персональных данных);
Предлагаемый термин: большие данные – любая информация, не относящаяся к прямо или косвенно определенному или определяемому физическому лицу (субъекту персональных данных)
Другое определение отталкивается от способа сбора и целей использования больших данных:
Большие данные – это процесс накопления, структурирования и использования больших объемов любой информации, полученной в результате пользования информационно-телекоммуникационными сетями, включая Интернет, накапливаемой, объединяемой и структурируемой различными способами в процессе использования информационно-коммуникационных сетей их пользователями для многоцелевого применения в информационных базах операторами больших данных.
Третий вариант определения, предложенный в ходе работы, отталкивался от объемов информации, подлежащей сбору и обработке:
Большие данные – структурированная и неструктурированная информация, в объемах, которые невозможно обработать вручную за разумное время, и поступающей из большого количества различных, в том числе разрозненных, слабосвязанных источников информации.
Рекомендации по законодательному регулированию больших данных (BigData)
Эксперты и чиновники пришли к консенсусу в том, что большие данные как совокупность информации и методов ее сбора, обработки и хранения не должна законодательно регулироваться в том случае, если они удовлетворяют двум условиям:
- Эти данные (результат их обработки) не позволяют однозначно идентифицировать человека, а значит не попадают в категорию персональных данных.
- Эти данные (результат их обработки) не относятся к областям, затрагивающим исключительные интересы государства, такие как основы конституционного строя, обороноспособность, территориальную целостность, а также иные сведения, свободный доступ к которым ограничен в соответствии с действующим законодательством.
Будущее BigData в России
Предполагается сосредоточиться в выработке конкретных рекомендаций по нормативному регулированию ограничений в обработке больших данных исходя из принципов, указанных выше, а так же обсудить необходимость (возможность) саморегулирования участников отношений по обработке больших данных с целью достижения прозрачности данного сегмента рынка, разработки отраслевых стандартов и добросовестных практик.
Обзор международного опыта
Обзор международного опыта в области регулирования больших данных показывает, что в настоящее время отсутствует единый подход к регулированию в различных государствах, также как отсутствуют единый терминологический словарь. В настоящее время идет процесс активного обсуждения того, какую роль в регулировании больших данных имеет государство, бизнес, общественные организации и гражданское общество.
Существуют примеры удачного сотрудничества бизнеса и государства. Так, британское правительство предоставило компании DeepMind (ИИ-подразделение Alphabet) доступ к обезличенным данным 1,6 млн пациентов, чтобы умные алгоритмы помогали врачам лечить пациентов с почечной недостаточностью.
В иностранных источниках все чаще стала появляться мысль о том, что сервисы по обработке больших данных — продукт не только разработчиков, но и тысяч пользователей, которые заполняют регистрационные формы. По мнению правозащитников, люди заслуживают более весомой компенсации, чем бесплатные сервисы. В отдельных случаях говорят даже о том, чтобы платить пользователям за эту информацию напрямую.
Европейцы предлагают создавать биржи персональных данных, которые позволят пользователям монетизировать информацию о себе. Такой подход вернет обывателям контроль над сбором и использованием сведений о них. На Западе возникла целая ниша стартапов, которые помогают людям распорядиться своими данными: CitizenMe, Datacoup, Mass Network, Hub of All Things, Cozy, Digi.me и другие. А тайваньский стартап Bitmark делает это с помощью блокчейна.
Американские соцсети LinkedIn, Facebook и Twitter тоже препятствуют анализу данных пользователей сторонними компаниями. Так, осенью Facebook запретила британским страховщикам Admiral Insurance анализировать благонадежность водителей по постам в соцсети. Хотя вообще в США торговля данными – гораздо более распространенное явление. Там даже продаются списки людей, страдающих от психических расстройств, рака и алкоголизма.
По мнению аналитиков, борьба за данные будет происходить не только на уровне компаний, но и на уровне государств. Об этом, в частности, предупреждает глава совета директоров Alphabet Эрик Шмидт.
Географическое распределение извлекаемой из данных прибыли сегодня более чем неравномерно. Большая часть дата-центров в мире находится на территории США или контролируется американскими компаниями. Европейские регуляторы время от времени издают различные предписания, которые сильно затрудняют работу американских компаний. Требования по локализации персональных данных действуют в Китае, Индии, Индонезии, Малайзии и Вьетнаме.