Цикл «Гостехнологии»

Почему искажается статистика.

Мнение социолога Ольги Моляренко о том, как в России официальные данные расходятся с реальностью и что с этим делать

Ольга Моляренко

Социолог, доцент кафедры местного самоуправления департамента политики и управления факультета социальных наук Высшей школы экономики, заместитель председателя экспертного совета Фонда поддержки социальных исследований «Хамовники»

21 сентября 2020

Должна ли официальная статистика идеально фиксировать реальность, и возможно ли это? По каким причинам в официальной статистике возникают искажения, и велик ли тут человеческий фактор? Пытается ли государство повысить качество статистики, раз его все критикуют — из недавних примеров такой критики можно, например, вспомнить историю данных по заболеваемости и смертности от коронавируса? И можно ли «вылечить» статистику саму по себе? Ответить на эти вопросы помогло исследование, базирующееся на интервью государственных и муниципальных служащих в экспедициях, которые организовали Фонд поддержки социальных исследований «Хамовники» и Высшая школа экономики.

Как возникают искажения

Упрощенно причины искажения официальных статистических данных можно разделить на три базовые группы.

Первый блок причин можно назвать онтологическим — далеко не все важные характеристики объектов, процессов и явлений вообще можно зафиксировать количественно, при этом далеко не для всех объектов, процессов и явлений вообще разработаны статистические показатели, даже если технически это выполнимо. Так, мы не сомневаемся в существовании в России феномена дачничества и его масштабности, однако нет точных данных о количестве дач (особенно с учетом размытости феномена — дачи ведь существуют не только в форме СНТ, для многих это дом в деревне, иногда квартира в двух-трехэтажном доме в небольшом райцентре с огородом на прилегающей территории), дачников, объёмах производимой на дачах продукции сельского хозяйства.

Ко второму блоку относятся методические, технические погрешности. Методы сбора информации разработаны для идеальных условий, и в реальности специалисты крайне редко могут воспроизвести их со 100% точностью. Люди не открывают двери переписчикам во время переписей населения, предприниматели не отвечают на запросы при выборочных переписях малого и среднего бизнеса (им рассылаются обычные, а не заказные письма, потому бывают проблемы с доказательством факта получения) и так далее. Для каких-то показателей вообще до сих пор не разработаны точные методики, поэтому специалисты собирают их на свое усмотрение. Кроме того, система сбора данных строго завязана на административно-территориальное устройство системы власти. Условно,

Ольга Моляренко

Социолог, доцент кафедры местного самоуправления департамента политики и управления факультета социальных наук Высшей школы экономики, заместитель председателя экспертного совета Фонда поддержки социальных исследований «Хамовники»

Должна ли официальная статистика идеально фиксировать реальность, и возможно ли это? По каким причинам в официальной статистике возникают искажения, и велик ли тут человеческий фактор? Пытается ли государство повысить качество статистики, раз его все критикуют — из недавних примеров такой критики можно, например, вспомнить историю данных по заболеваемости и смертности от коронавируса? И можно ли «вылечить» статистику саму по себе? Ответить на эти вопросы помогло исследование, базирующееся на интервью государственных и муниципальных служащих в экспедициях, которые организовали Фонд поддержки социальных исследований «Хамовники» и Высшая школа экономики.

Как возникают искажения

Упрощенно причины искажения официальных статистических данных можно разделить на три базовые группы.

Первый блок причин можно назвать онтологическим — далеко не все важные характеристики объектов, процессов и явлений вообще можно зафиксировать количественно, при этом далеко не для всех объектов, процессов и явлений вообще разработаны статистические показатели, даже если технически это выполнимо. Так, мы не сомневаемся в существовании в России феномена дачничества и его масштабности, однако нет точных данных о количестве дач (особенно с учетом размытости феномена — дачи ведь существуют не только в форме СНТ, для многих это дом в деревне, иногда квартира в двух-трехэтажном доме в небольшом райцентре с огородом на прилегающей территории), дачников, объёмах производимой на дачах продукции сельского хозяйства.

Ко второму блоку относятся методические, технические погрешности. Методы сбора информации разработаны для идеальных условий, и в реальности специалисты крайне редко могут воспроизвести их со 100% точностью. Люди не открывают двери переписчикам во время переписей населения, предприниматели не отвечают на запросы при выборочных переписях малого и среднего бизнеса (им рассылаются обычные, а не заказные письма, потому бывают проблемы с доказательством факта получения) и так далее. Для каких-то показателей вообще до сих пор не разработаны точные методики, поэтому специалисты собирают их на свое усмотрение. Кроме того, система сбора данных строго завязана на административно-территориальное устройство системы власти. Условно,

если в районе ликвидировать отдел полиции или центр занятости населения, то показатели по преступности и официальной безработице резко упадут

— в связи с отсутствием или кардинальным сокращением сотрудников, фиксирующих данные.

И вот только к третьей группе — сознательных фальсификаций — я отношу те проблемы, о которых чаще всего думают при обсуждении причин искажения статистики. Такие смещения появляются по причине ненейтральности статистических данных: статистика используется для оценки качества работы чиновников и расчета распределения бюджетных средств, а потому у задействованных лиц появляются мотивы для фальсификации.

Где больше искажений

Скорее, конечно, надо говорить не о сферах, где искажения более вероятны, а о происхождении процессов, которые фиксируются, и политизированности отдельных показателей.

Во-первых, с технической точки зрения проще всего государству фиксировать то, что производит оно само: количество школ и коек в больницах, численность бюджетников, объём выделенных на разные госпрограммы средств и так далее. Это государство может подсчитать достаточно точно. Эксцессы встречаются (так, в начале 2010-х годов у Росстата и департамента образования Москвы не сходилось количество общеобразовательных школ в столице), но тем не менее в фиксации этих показателей минимальны онтологические и технические ошибки (проблемы первой и второй групп). Смещения здесь возникают скорее по причине политизированности управленцев, оцениваемых в том числе по этим показателям. Соответственно,

сложнее государству подвергать учету то, что от него напрямую не зависит

(к примеру, показатели деятельности малого и среднего бизнеса, миграционную активность населения), и крайне сложно то, что от него намеренно прячется (в частности, теневую экономику). Несмотря на расширение использования информационных технологий и локальные успехи учета, качество статистических данных последние десять лет падает в связи с оптимизацией низовых подразделений органов государственной власти (оптимизация Росстата, МВД, налоговой и т.д.) и территориальными укрупнениями муниципальных образований.

Власть отдаляется от реальных социально-экономических процессов на местах.

Во-вторых, как я уже говорила, в рамках нашей системы статистика не является нейтральной. По статистическим данным, их динамике, территориальному сопоставлению показателей распределяются финансовые ресурсы, а также оценивается эффективность деятельности органов власти (и государственных и муниципальных учреждений) в целом и их руководителей в частности. Поэтому, например, если какой-то показатель попадает в список приоритетных, важных для центра (как в случае с майскими указами президента), а реальных возможностей для быстрого улучшения ситуации у управленцев нет, то

они зачастую прибегают к фальсификации данных во избежание возможных санкций за неисполнение указаний.

Речь тут может идти не только о личной ответственности — увольнении — управленца, но и о снижении выделяемых учреждению или территории финансовых средств. Мы знаем много довольно избитых примеров такого рода: смертность от сердечно-сосудистых заболеваний, зарплаты учителей и врачей — но вообще занижение или завышение показателей под страхом санкций или из желания «продемонстрировать» эффективную работу в той или иной мере характерны для большинства показателей.

Так, отдельные муниципалитеты предпочитали не признавать жилые дома ветхими и аварийными, если в их бюджете всё равно не было средств на расселение жителей и чиновники понимали, что получить на это дополнительные финансы от региона или федерации невозможно — а при признании дома ветхим и аварийным без последующего его расселения муниципалитет получит сначала предписания, а потом и штрафы со стороны прокуратуры.

Подпишитесь на рассылку «Проекта»

Чем опасны некачественные данные

Приведу пример из советского времени. Исследователи сходятся в мысли, что одной из важных причин голода 1931-1933 годов стало использование Совнаркомом некорректных методик, завышавших урожайность и валовые сборы зерна. Как мы знаем, принудительная коллективизация привела к масштабному забою сельскохозяйственных животных населением — чтобы не сдавать их в колхозы. Естественно, существенно сократилась и тягловая сила (поголовье лошадей). Для подсчета же валовых сборов продолжали использовать «старую» урожайность, просчитанную для определенных географических условий (это не изменилось) и определенной интенсивности обработки земли (для чего нужно достаточное количество лошадей). Условно, не на ком стало пахать и собирать урожай, что не было учтено в централизованной методике.

Серьёзность проблем, вызванных низким качеством статистики, зависит от степени вмешательства государства в экономику и общественные отношения.

Если оно минимально, то искаженные данные не могут привести к существенным проблемам. А вот если на основе статистики разрабатываются масштабные реформы или программы, предполагающие вмешательство в социально-экономические процессы, то качество данных становится критически важным.

Так, согласно нашим исследованиям, при переписи населения 2010 года в сельской местности Центральной России, Северо-Запада и Западной Сибири произошло занижение численности населения на 10-15% — в первую очередь в связи с выпадением временных трудовых возвратных мигрантов, которые должны были быть учтены по постоянному месту жительства, но этого не произошло. Трансферты муниципальным образованиям со стороны региона определяются, в том числе, с учетом численности населения муниципалитета, соответственно финансирование прежде всего депрессивных муниципальных образований (откуда уходит «в отход» население) упало, а значит, упало и качество решения муниципалитетом вопросов местного значения, снизились возможности оказания им социальных услуг. Все вместе это только ускорило отток населения с депрессивных территорий.

Критично фактическое сохранение «палочно-галочной» системы в МВД. Криминальная статистика формируется самой полицией, при этом именно на основе этой информации оценивается деятельность ведомства и его подразделений, из-за этого его сотрудники оказываются мотивированы к искажению показателей в лучшую сторону. В результате

центральная власть получает неверные сигналы, оказывается в своеобразных «розовых очках»

в то время как реальные процессы попросту не фиксируются.

Иными словами, низкое качество статистических данных негативно влияет на качество публичного управления не только из-за ухудшения информационной базы, но и из-за формирования иллюзии о подконтрольности и управляемости всех процессов, иллюзии безопасности.

Как можно повысить качество статистики

Как я уже писала выше, есть три базовых группы причин искажений количественных данных: онтологические тонкости, технические проблемы и сознательные фальсификации. Способы решения проблем — полностью или частично — в каждом случае свои.

Проблемы первой группы — не только в России, но вообще ни в одном государстве — не могут быть решены полностью и окончательно, но теоретически могут быть не столь масштабны при условии тесного взаимодействия между Росстатом и научным сообществом, желательно проводящим полевые качественные исследования — т.е. самостоятельно собирающим информацию о социально-экономических и иных процессах.

В идеальном мире ученые выявляли бы новые процессы и явления, требующие фиксации, а статистики разрабатывали бы инструментарий для учета новых сущностей.

Однако здесь появляются новые вопросы, теперь уже о качестве научной деятельности — большая часть социально-экономических исследований в России основывается как раз на данных официальной статистики и массовых опросов населения, которые не подвергаются исследователями критическому анализу и проверке.

Проблемы второй группы могут быть частично сняты за счет расширения использования информационных технологий и обеспечения плотного межведомственного обмена информацией между органами власти, желательно на уровне первичных, а не агрегированных данных. Сегодня этому препятствуют не только нормы о конфиденциальности информации и персональных данных, но и некоторое противодействие самих ведомств, которые не хотят лишаться монополии на информацию по подведомственной сфере. Гипотетически, существенный прогресс обещается в связи с внедрением национальной системы управления данными, но реалистичность намеченных достижений пока под вопросом.

Масштабы сознательных фальсификаций, безусловно, можно снизить путем изменения инструментов, применяемых для распределения финансов

и методик оценки эффективности управленцев, органов власти и бюджетных учреждений. Но здесь мы находимся в своеобразной институциональной ловушке, когда издержки на разработку и создание таких систем настолько значительны, что сохранение статуса-кво оказывается, по мнению участников системы, предпочтительным вариантом.

Нужна ли государству качественная статистика

Исходя из исторического опыта и локальных успехов в совершенствовании информационных баз в современной России можно утверждать, что резкое повышение качества данных возможно, но тогда, когда эта цель скорее вторична, а первична другая — выстраивание вертикали власти и обеспечение лояльности местных элит. Например, были случаи, когда новый для территории губернатор, перешедший из другого региона вместе со своей командой, для слома сопротивления приверженных предыдущему губернатору местных властей выстраивал так называемый

«цифровой авторитаризм» — сквозные системы привязанных к месту данных, в значительной мере обнажающих происходящие на территории процессы.

Но и в этом случае сопротивление локальных элит «опрозрачиванию» было довольно высоко.

Можно утверждать также, что федеральный центр заинтересован в повышении качества административных данных и статистики. Это подтверждает принятие тематических госпрограмм и проектов, например, проекта «Цифровое государственное управление» в рамках нацпрограммы развития цифровой экономики. Но раз за разом исполнители фактически саботируют реализацию таких программ, выстраивание единой системы сквозных показателей, поскольку не хотят лишиться монополии на информацию по подведомственной сфере и соответствующего административного веса.