Институт демографии НИУ ВШЭ имени А.Г. Вишневского

№ 1037 - 1038
25 июня - 8 июля 2024

ISSN 1726-2891

первая полоса

содержание номера

архив

читальный зал приложения обратная связь доска объявлений

поиск

Газеты пишут о ... :

"Коммерсантъ" и "Новые известия" об ужесточении миграционной политики
"Новые известия" о снижении привлекательности России для мигрантов
"Независимая газета" и "ТАСС" о развитии малых городов
"Коммерсантъ" о сокращении населения Дальнего Востока
"Независимая газета" об уровне жизни россиян
"Коммерсантъ" о дефиците кадров
"Коммерсантъ" о предложении включить рак в список профзаболеваний
"Коммерсантъ" об ожирении и борьбе с ним
"Российская газета" и "ТАСС" о лекарстве от рака
"Новые известия" о вакцинации от инфекционных заболеваний
"Коммерсантъ" и "Независимая газета" об индексации пенсий работающим пенсионерам
"Новые известия" о параде многодетных семей
"ТАСС" о необходимости увеличить рождаемость
"ТАСС" о мерах повышения рождаемости

"Коммерсантъ" о бесплатном исследовании репродуктивного здоровья
"Коммерсантъ" об усложнении процедуры аборта
"Коммерсантъ" о поддержке студентов с детьми
"Новые известия" о семейной ипотеке
"Если быть точным" о паллиативной помощи
"Независимая газета" о стандартах московского здравоохранения
"Коммерсантъ" об уходе из России американского инсулина
"Независимая газета" о поддержании ментального здоровья
"Газета.Ру" о бегстве из традиционного общества
"Коммерсантъ" об окупаемости инвестиций в человеческий капитал
"Телеграф" о демографическом положении Украины
"ИА Регнум" об интеграции украинцев в чешское общество
"Если быть точным" об удалении открытых статистических данных

об удалении открытых статистических данных

76 наборов данных органы власти удалили со своих сайтов с начала года

С февраля 2022 года российские власти регулярно удаляют статистику из публичного доступа. По нашим подсчетам, в этом году удалили как минимум 76 наборов данных, а всего за 2,5 года из разделов "открытые данные" ведомственных сайтов пропало почти 600 датасетов. Теперь изучать страну журналистам и исследователям стало еще труднее. Что произошло с открытыми данными в России за последние месяцы - рассказываем в обновлении трекера "Если быть точным".
К маю 2024 года власти удалили минимум 76 датасетов из разделов "открытые данные" ведомственных сайтов. Больше всего закрыл Роструд - 26 датасетов: в них содержались данные о различных соцвыплатах, а еще административная и справочная информация. Росприроднадзор удалил 19 датасетов, а Росздрав - 15: в основном это были реестры со справочной информацией вроде списка проведенных мероприятий.
Данные о соцвыплатах ранее частично закрыл и Росстат: в 2023 году из ежегодного бюллетеня социальных выплат исчезли строки с данными о выплатах ветеранам боевых действий. Также перестали публиковать общую сумму выплат, чтобы не допустить расчета удаленного показателя. По этим данным можно было бы приблизительно оценить число военнослужащих, задействованных в боевых действиях в Украине.
Всего за 2,5 года с начала военных действий в Украине власти скрыли почти 600 наборов данных. Среди них - сведения о доходах и расходах чиновников, информация о госзакупках подсанкционных компаний, миграционная и экономическая статистика, любые показатели, по которым можно оценить потери российской армии в боевых действиях в Украине. Подробнее об этом мы рассказывали в финальном обновлении трекера за 2023 год.

Как мы считали
Мы учитывали только те датасеты, которые выкладывались в разделах "открытые данные" на сайтах ведомств. Для этого мы составили список всех федеральных ведомств, а также государственных фондов (к ним относится, например, ФОМС). Через веб-архив проверили раздел открытых данных на сайте каждого ведомства, а затем сравнили с тем, что есть на сайте сейчас (проверку проводили за первые четыре месяца 2024 года).
Файлы и веб-страницы с неструктурированными данными, разбросанные по другим разделам сайтов, не включены в расчет. Обычно это различные доклады, реестры, формы статистической отчетности и текстовые отчеты, содержащие макроэкономические, финансовые и социальные показатели. Их тоже удаляют, иногда задним числом за все предыдущие годы, но поскольку эти данные публикуют несистемно, мы не можем оценить объемы удаленного.
Также в этот расчет не включены датасеты, которые публиковались на портале открытых данных.
Удаляют не только датасеты, которые чувствительны для государства, но даже, например, реестры со справочной информацией. Общей логики в том, что именно закрывают, не прослеживается.
Приглашенный исследователь Йельского университета Кирилл Титаев считает, что данные перестают публиковать по двум причинам - это либо политическое решение, либо желание чиновников избежать проблем.
"Например, резкое затруднение доступа к данным из ЕГРН и искажение данных в самой базе - это противодействие журналистским расследованиям. Но очень часто бывает простой оппортунизм, - считает Титаев. - Чиновники видят, что внимание к этой сфере ослабло, что у них есть возможность оправдаться обеспечением безопасности государства, и перестают тратить на данные время и деньги".
Хорошая новость, по мнению эксперта, состоит в том, что подавляющее большинство тех датасетов, которые были в открытом доступе, скачаны исследователями. "Но если раньше вы шли и брали их в первоисточнике, то сейчас надо смотреть, кто публиковался на этом датасете, и писать ему с просьбой поделиться", - говорит Титаев.
В феврале 2023 года Госдума утвердила поправки в закон "Об официальном статистическом учете и системе государственной статистики в Российской Федерации". Теперь правительство может приостанавливать публикацию любых данных, собираемых в рамках федерального плана статистических работ. Первым и пока единственным прецедентом, когда данные закрыли именно со ссылкой на этот закон, стал запрет на публикацию статистики по добыче нефти и газа в 2023 году. В марте 2024 года запрет был продлен до апреля 2025-го.
Согласно новым поправкам, закрывать данные теперь можно только по распоряжению правительства. Однако это правило соблюдается далеко не всегда. Так, в мае 2024-го Минэнерго закрыло данные о производстве бензина и дизельного топлива. Но соответствующего распоряжения правительства не было. "Учитывая существующую геополитическую ситуацию, раскрытие такои? информации может стать поводом для манипулирования рынком со стороны недобросовестных его участников", - прокомментивало свои действия министерство.
Закрывают не только отдельные показатели, но и целые порталы. Так, в конце февраля 2024 года перестал работать официальный агрегатор судебных дел ГАС "Правосудие". С 2006 года он помогал ученым и журналистам изучать, как работает судебная система. Теперь доступ к судебным данным возможен только через альтернативные инструменты - например, парсер "Если быть точным", который ищет данные о судебных делах и тексты судебных решений прямо на сайтах судов общей юрисдикции.
В конце прошлого года в связи "с доработкой функциональности" перестали обновлять портал правовой статистики. До этого Генпрокуратура ежемесячно выкладывала на нем подробные данные о преступности в России - в абсолютных числах, в разрезе регионов и статей УК.
В марте 2023 года на "техническое обслуживание" закрылся портал открытых данных: на главной странице разместили "заглушку", а датасеты удалили из свободного доступа. Технической необходимости в удалении всех данных не было. Согласно открытой информации, часть работ уже выполнена, а сам портал планировалось открыть 1 июня 2024 года. Контракт обновлен 3 июня, дата исполнения работ - все также 1 июня, исполнитель платит штрафы.
"Портал для большинства данных, которые там содержались, не был единственным источником. - говорит Кирилл Титаев - Например, он выгружал данные из ЕМИСС и Центробанка, но они лежали и на сайтах производителей данных. Если мы говорим про старые данные, то это не очень большая потеря, потому что мы знаем несколько архивов, которые выкачали оттуда более-менее все. Но то, что новые данные могут перестать публиковаться, если не полностью, то частично, - это, конечно, будет очень большой сложностью для исследователей".
Однако некоторые данные размещались только на портале, и сейчас недоступны - это 362 датасета Минобороны, Минспорта, Минэкономразвития, Минюста и ФСИН.
К моменту закрытия на "техническое обслуживание" Портал содержал 27 тысяч наборов данных. Большинство из них (84%) были впервые загружены в период "Открытого правительства" , причем пик обновлений наборов данных пришелся на 2017 год.

При этом портал чаще был объектом критики со стороны исследователей, чем "флагманом" открытых данных в России. По нашим расчетам, к началу 2023 года 60% наборов данных никогда не обновлялись, 30% никогда не загружались пользователями и только 2% (470 наборов данных) были загружены сто и более раз.
После 24 февраля тенденция на закрытие данных становится все очевиднее. В июле 2022 года мы насчитали как минимум 10 ведомств, которые закрыли свою статистику. Сейчас их уже по меньшей мере 46.
Но о полной закрытости российской статистики пока говорить рано. Данные скрываются непоследовательно: в одних наборах удаляют все, в других - только отдельные файлы. При этом иногда удаленную информацию можно найти на сайтах в виде текста или таблиц.
Не стоит списывать со счетов и бюрократическую инерцию: чиновники, ответственные за открытые данные, по привычке продолжают публиковать информацию, а бюрократы среднего звена прикладывают усилия, чтобы защитить свою сферу влияния. Тем более, что некоторые данные нелегко удалить из доступа, поскольку вокруг них выстроена инфраструктура государственного регулирования и управления: налоговая статистика, решения судов, показатели для отчетности по национальным проектам, демографические данные и много что еще. Без них управлять страной и регионами будет трудно.

Борис ГИ, Даниил ГУРБАНОВ. Если быть точным, 10 июня 2024 года

<<< Назад


Вперёд >>>

Вернуться назад
Версия для печати Версия для печати
Вернуться в начало

Свидетельство о регистрации СМИ
Эл № ФС77-54569 от 21.03.2013 г.
demoscope@demoscope.ru  
© Демоскоп Weekly
ISSN 1726-2887