Rambler's Top100

№ 567 - 568
16 - 29 сентября 2013

О проекте

Институт демографии Национального исследовательского университета "Высшая школа экономики"

первая полоса

содержание номера

читальный зал

приложения

обратная связь

доска объявлений

поиск

архив

перевод    translation

Оглавление Глазами аналитиков 

Смертность от состояний, связанных с употреблением алкоголя

Статистика алкогольной смертности в Беларуси

Смертность от болезней органов пищеварения в Украине: что изменилось?

Российский мониторинг экономического положения и здоровья населения как источник данных о смертности: возможности и ограничения

Курение в России: социальные различия и тенденции в 1990-е и 2000-е гг.

Архив раздела Глазами аналитиков


Понравилась статья? Поделитесь с друзьями:


Google
Web demoscope.ru

Российский мониторинг экономического положения и здоровья населения как источник данных о смертности: возможности и ограничения

Фурманов К.К., Чернышёва И.К.1 - специально для Демоскопа

На настоящий момент, исследования продолжительности жизни в России преимущественно опираются на агрегированные данные, отражающие уровень смертности в стране или её регионах для весьма крупных групп населения – например, Росстат публикует возрастные коэффициенты смертности в разбивке по полу и типу местности (сельская/городская). Причин опираться на агрегированные данные Росстата немало. Это и желание исследователей оценить ситуацию в целом, не копаясь в частностях, и доступность информации, и её надёжность – можно указывать на различные недостатки официальной статистики, но более точные данные брать практически неоткуда.

Что может подтолкнуть исследователя к поиску альтернативы? Во-первых, желание получить сведения о связи продолжительности жизни с характеристиками, отличными от пола, возраста и места проживания. Как различается сила смертности для групп населения с различным уровнем образования или дохода? Как связана продолжительность жизни с семейным положением? Публикуемые данные Росстата не позволяют ответить на эти вопросы.

Вторая причина – потребность в информации на индивидуальном уровне, позволяющей связать факт смерти или дожития конкретного человека с его личными характеристиками. Работа с множеством наблюдений за отдельными жизнями может оказаться намного более трудоёмкой, чем анализ заранее подготовленных агрегированных данных, но исследователь может пойти на эти неудобства в надежде глубже проникнуть в суть.

Самым обширным обследованием в России, позволяющим отследить смерть обследуемых, является Российский мониторинг экономического положения и здоровья населения (РМЭЗ ВШЭ). Обследование проводится с 1992 года и представляет собой серию ежегодных опросов нескольких тысяч домохозяйств, так что в год опрашивается более 10000 респондентов. Данные РМЭЗ имеют панельную структуру: можно отследить, как с течением времени меняется состояние конкретных домохозяйств и индивидов. Информацию о мониторинге и сами данные можно найти на странице http://www.hse.ru/rlms.

РМЭЗ – не единственный источник индивидуальных данных о смертности в России. Так, работа Chenet L. с соавторами2 опирается на данные московских отделов ЗАГС, собираемые Мосгорстатом и содержащие много больше наблюдений, чем можно получить из опросов РМЭЗ, а исследование Bobak M. и др.3 – на пространственную выборку, данные которой содержали ответы респондентов на вопросы об их старших братьях и сёстрах4, в том числе и об их  возрасте на момент смерти (если те умерли). Проблема в том, что подобная информация широкому кругу исследователей недоступна. Кроме того, данные ЗАГС содержат сведения только об умерших, в то время как факт смерти может быть лишь одним из возможных исходов, интересующих исследователя. Например, интерес может представлять здоровье индивидов и его связь с теми или иными характеристиками образа жизни или благосостояния, а смерть будет в таком случае рассматриваться как одно из проявлений ухудшения здоровья.

Нам известны только два исследования, посвящённых анализу смертности по данным РМЭЗ. Первое – работа Brainerd E. и Cutler D.M.5, в которой авторы пытаются выяснить причины резкого снижения продолжительности жизни в 90-е годы и приходят к выводу, что основную роль в том сыграли алкоголь и стресс, связанный с утратой надежды на лучшее будущее. Второе исследование – Денисовой И.А.6 подтверждает важность стресса и потребления алкоголя и указывает на некоторые другие детерминанты смертности, опираясь на значительно расширенную выборку, охватывающую период с 1994 по 2007 год.

Учитывая, что РМЭЗ - популярный источник данных и для экономистов, и для исследователей здоровья и что проблема высокой смертности очевидна, можно удивиться, сколь мало обработано такое широкое поле исследований. Однако человек, решивший приступить к анализу данных мониторинга, сразу же столкнётся с серьёзными проблемами.

Трудности, с которыми приходится сталкиваться при анализе смертности по данным РМЭЗ

Во-первых, это обработка огромного массива данных. Несмотря на то, что статистические программы позволяют быстро и легко проделывать различные операции с множеством наблюдений, остаются и «неприятные» этапы. Например, слияние файлов с индивидуальными данными с файлами, содержащими информацию о домохозяйстве в целом (именно в последних хранятся сведения о выбытии индивидов из семей – в том числе, по причине смерти).

Во-вторых, это неполнота данных и связанные с ней особенности статистического инструментария. Мы не наблюдаем человеческие жизни с начала и до конца. Попавший в выборку индивид вполне может оказаться живым на момент последнего наблюдения за ним, так что его возраст на момент смерти неизвестен. Для умерших за период обследования длительность жизни оказывается измеренной с той точностью, что даёт нам временной промежуток между опросом, в котором был зафиксирован факт смерти, и опросом, когда умерший последний раз наблюдался живым. Говоря языком статистики, наблюдения оказываются цензурированными: в некоторых случаях они дают информацию только о наименьшем возможном возрасте на момент смерти (цензурирование справа), а в некоторых – интервал, в котором заключена продолжительность жизни (интервальное цензурирование).

Другой, менее явный вид неполноты данных – усечение. Попавший в выборку индивид нечасто наблюдается с рождения, на момент первого наблюдения за ним он, вероятно, успел прожить много лет. Именно потому, что его жизнь не прекратилась ранее опроса, мы можем наблюдать его. Из-за этого распределение времени жизни в выборке оказывается искажённым: факт включения респондента в выборку уже означает, что он дожил до момента своего первого опроса. Поэтому выборка не полностью случайна и не может (без соответствующих поправок) представлять генеральную совокупность: в ней недостаточно представлены жизни с малой продолжительностью.

Неполнота данных делает нетривиальным даже расчёт описательных статистик7. Стандартный подход к построению таблиц смертности учитывает усечение и цензурирование и не предполагает наличия полной информации о продолжительности жизни, но более сложные методы (в том числе и столь любимые эконометристами методы регрессионного анализа) требуют поправки на неполноту данных. Положение исследователя здесь затрудняется и тем, что процедуры анализа усечённых и цензурированных данных ограниченно реализованы и в современном программном обеспечении. Заметим, однако, что исследование Brainerd E. и Cutler D.M.8 эти трудности обошло, так как использованная авторами модель описывала не продолжительность жизни, данные о которой подвержены неполноте, а факт смерти или дожития до следующего опроса. В работе Денисовой И.А.9 делалась поправка на цензурирование справа.

Допустим, что исследователь не побоялся возникших перед ним сложностей, подготовил данные и разобрался с их неполнотой. На этом его беды не заканчиваются.

Кого включать в выборку: особенности анализа за смертности по данным опросов

Если мы спрашиваем человека, а он отвечает, то можно с уверенностью сказать, что этот человек жив. Но тогда каким образом опрос может дать нам сведения о смерти?

Один из членов опрашиваемого домохозяйства отвечает на вопросы семейного вопросника, позволяющие отследить изменение состава семьи. Относительно каждого ранее наблюдавшегося члена домохозяйства задаётся вопрос, входит ли он в это домохозяйство до сих пор, а если нет, то почему. Таким образом, смерть человека отмечается на основании ответа члена его семьи. Если человек живёт один, то сообщить о его смерти некому. В этом случае он просто выпадает из рассмотрения, а данные не сообщают нам о причине выбытия. Мы не знаем, связано ли отсутствие наблюдений за человек с его смертью или, например, с переездом. Отсюда важное ограничение: мы не можем отслеживать смерть одиноко живущих. Значит, из анализируемой выборки наблюдения за ними нужно исключать, ведь они только искажают картину: попытайся мы оценить продолжительность жизни среди одиноких, мы получили бы, что они никогда не умирают. Впрочем, в данных РМЭЗ мы всё же нашли случай, когда смерть одиночки была зафиксирована по ответам человека, ранее жившего с ним в одной семье, но это исключение.

А что делать, если семья состоит из одного взрослого и детей? Если взрослый умрёт, то дети, возможно, не останутся в доме. Их может забрать кто-либо из родственников, либо они отправятся в приют. И в том, и в другом случае следующий опрос не застанет эту семью, так что смерть не будет отмечена в данных.

Однозначно ответить на вопрос, кого же включать в анализируемую выборку, не удалось. Мы рассматривали три критерия отбора наблюдений:

  1. включать только не одиноко живущих;
  2. включать только тех респондентов, вместе с которыми в семью входит хотя бы один совершеннолетний;
  3. включать только тех респондентов, вместе с которыми в семью входит хотя бы один совершеннолетний не старше 60 лет.

В конце концов, мы остановились на втором решении. Недостаток первого критерия уже был указан, а в третьем случае выборка значительно истощалась. В итоговой выборке, составленной из данных РМЭЗ за 2000-2009 годы, оказались наблюдения за 23535 индивидами, включающие 1091 случай смерти. Отслеживались и смерти, произошедшие в периоды выпадения семей из опроса, если длительность такого выпадения составляла не более трёх лет.

Отметим, что на невозможность отследить смерть одиноко живущих указывается и в работе Денисовой И.А.10. В ней приводятся результаты дополнительного обследования, которое показало, что из выпадающих из выборки домохозяйств лишь 1-2% приходятся на долю тех, что исчезли в результате смерти их членов, и ещё 1-2% выбывают потому, что после смерти одного из членов семьи оставшиеся переезжают к родственникам. Отсюда делается заключение, что столь малые цифры не должны приводить к искажению результатов. Но эти показатели выбытия вполне сопоставимы с уровнем смертности11 и потому не кажутся незначительными. Исследование Brainerd E. и Cutler D.M.12 опиралось только на данные домохозяйств, состоящих более чем из одного человека (критерий 1 в нашем списке).

Эта особенность ставит вопрос о генеральной совокупности: кого же именно представляет наша выборка? Без предположения, что смертность не связана с тем, проживает ли индивид один или с кем-либо, распространять результаты анализа на всё население неправильно. Предположение же это не то чтобы недопустимо, но и неубедительно. Осторожнее будет заранее оговорить, что оценки, получаемые по выборке РМЭЗ, относятся только к той части населения, которая удовлетворяют критерию, использованному при построении выборки (т.е., только к индивидам, проживающим вместе с хотя бы одним совершеннолетним членом домохозяйства). Не стоит забывать и о других особенностях РМЭЗ, не относящихся именно к анализу смертности: выборка не включает бездомных, наиболее богатые слои населения также не представлены.

Пример оценивания смертности

По данным РМЭЗ за 2000-2009 годы мы оценивали модель смертности, задаваемую соотношением:

.       (*)

Здесь h(t) – вероятность смерти в возрасте t для человека, дожившего до этого возраста,

T – продолжительность жизни,

a0, a1 – параметры модели, подгоняемые по располагаемым данным.

Две экспоненты в выражении (*) – просто математический приём, который гарантирует, что вероятность будет находиться в пределах от 0 до 1. Выбранный вид функции не претендует на точность описания – вряд ли имеет смысл пытаться по нашим данным получить детальные, аккуратные оценки зависимости смертности от возраста. Наша цель – лишь уловить общую тенденцию и определить явные различия в смертности между группами населения.

Так как  смертность в крайних возрастных группах имеет свои особенности, при оценивании использовались только наблюдения за респондентами в возрасте от 18 до 80 лет.

Для примера приведём полученные оценки для групп населения по полу и уровню образования. Исследования по различным российским данным подтверждают, что люди с высоким уровнем образования склонны жить дольше – в этом выводе сходятся работы многих исследователей13.


Рисунок 1. Вероятность смерти в зависимости от возраста для групп населения по полу и уровню образования (нет среднего, среднее, среднее профессиональное, высшее)

Оценки вероятности смерти для женщин в старших возрастных группах оказываются удивительно низкими. Одна из возможных причин – исключение одиноко живущих (для них вероятность смерти может быть относительно высокой). Кроме того, данные РМЭЗ отмечают заметно меньшее число женских смертей по сравнению с мужскими, что настораживает, даже если принять во внимание более высокую продолжительность жизни женщин. Наконец, занижение оценок может быть связано с негибкостью выбранной модели и с небольших числом наблюдений в старших возрастных группах.

Итак, рассчитанные вероятности не представляются правдоподобными. Тем не менее, мы можем обратить внимание на качественные различия между законами смертности в разных группах. Приведённые на рис. 1 графики позволяют выдвинуть предположение, что роль образования как коррелята смертности различна для мужчин и женщин. Так, среди женщин наибольшая продолжительность жизни ожидается в группах с высшим и средним профессиональным образованием, причём между этими двумя группами существенных различий не выявлено - отклонение в правой части графика вряд ли стоит считать существенным различием с учётом всех описанных неточностей и недостатков данных. Разницы между двумя менее образованными группами также не обнаружено. У мужчин же выделяется категория «высшее образование», а смертность в остальных группах выше. Качественные результаты такого рода – видимо, наибольшее, на что мы можем рассчитывать при анализе данных РМЭЗ.

На рис. 2 представлен другой пример – оценки смертности по частоте употребления алкоголя для мужчин. В младших возрастных группах полное воздержание от алкоголя соответствует наименьшей вероятности смерти (правда, на графике это мало заметно – различия в левой части графика слишком малы). Однако в пенсионном возрасте воздержание ассоциируется с относительно высокой смертностью – большей, чем среди употреблявших алкоголь несколько раз в месяц. Одно из возможных объяснений: отказ от алкоголя может быть вызван плохим здоровьем. Кроме того, в эту группу попадают и люди, неумеренно пившие раньше, но «завязавшие» - среди них вероятность смерти также относительно высока.

Рисунок 2. Вероятность смерти в зависимости от возраста для групп населения по частоте употребления алкоголя, мужчины

Это пример того, как один статистический признак может играть двоякую роль. При построении эконометрической модели исследователи склонны сводить статистическую связь смертности с какой-либо объясняющей переменной (в частности, с показателем потребления алкоголя) к одному коэффициенту, который позволял бы делать выводы в таком духе: «при прочих равных условиях среди лиц, часто употребляющих алкоголь, сила смертности выше на 30% (для примера), чем среди употребляющих не столь часто». Приведённые нами оценки показывают опасность такой редукции и пользу от графического представления результатов.

Помимо графиков вероятности смерти часто приводятся графики функций дожития, отражающие вероятность дожития до того или иного возраста – так, например, сделано в работе Денисовой И.А.14. Мы их не приводим, потому что в наших примерах рассматриваемые признаки (образование и частота употребления алкоголя) непостоянны во времени. Нет смысла рассчитывать вероятность того, что мужчина, употребляющий алкоголь 1-3 раза в неделю, доживёт, например, до 40 лет – не с рождения же он выпивает с такой частотой.

Заключение

РМЭЗ предоставляет данные впечатляющего охвата -  и по количеству обследуемых, и по продолжительности периода наблюдения, и по разнообразию сведений о каждом из респондентов. Однако, в силу редкости изучаемого события, такого множества наблюдений всё же оказывается мало для получения точных результатов при анализе смертности. Дополнительные трудности создаёт и то, что информация о смерти обследуемых берётся из ответов членов их семей - это искажает выборку, делая вероятность наблюдения смерти зависящей от состава домохозяйства. Поэтому к оценкам, полученным на основании данных мониторинга, стоит относиться со здоровым скептицизмом, рассматривая их не столько как достоверный результат, сколько как основание для выдвижения гипотез, требующих дополнительной проверки.


1 Фурманов Кирилл Константинович – к.э.н., доцент кафедры математической экономики и эконометрики НИУ ВШЭ, e-mail: furmach@menja.net.
Чернышёва Ирина Константиновна – магистр экономики, преподаватель кафедры математической экономики и эконометрики НИУ ВШЭ, e-mail: ichernysheva@hse.ru.
2 Chenet L., Leon D., McKee M., Vassin S. (1998). Deaths from Alcohol and Violence in Moscow: Socio-Economic Determinants // European Journal of Population, Vol.14 No.1, pp. 19-37.
3 Bobak M., Murphy M., Rose R., Marmot M. (2003). Determinants of Adult Mortality in Russia: Estimates from Sibling Data // Epidemiology, Vol. 14 No. 5, pp. 603-611.
4 В другой работе эти авторы опираются на ответы вдовцов (вдов) об их супругах (Bobak M., Murphy M., Pinkhart H., Martikainen P., Rose R., Marmot M. (2002). Mortality Patterns in the Russian Federation: indirect technique using widowhood data // Bulletin of the World Health Organization, Vol. 80 No.11, pp. 876-881).
5 Brainerd E., Cutler D.M. (2005). Autopsy of an Empire: Understanding Mortality in Russia and the Former Soviet Union // Journal of Economic Perspectives, Vol. 19 No. 1, pp.107-130.
6 Denisova I. (2010). Adult mortality in Russia. A microanalysis // Economics of Transition, Vol. 18(2), 333-363.
7 Детальному обзору различных видов усечения и цензурирования и методов работы с неполными данными посвящена книга (Klein J.P., Moeschberger M.L. (2005). Survival Analysis: Techniques for Censored and Truncated Data. Second Edition. Springer).
8 Brainerd E., Cutler D.M. (2005). Autopsy of an Empire: Understanding Mortality in Russia and the Former Soviet Union // Journal of Economic Perspectives, Vol. 19 No. 1, pp.107-130.
9 Denisova I. (2010). Adult mortality in Russia. A microanalysis // Economics of Transition, Vol. 18(2), 333-363.
10 Denisova I. (2010). Adult mortality in Russia. A microanalysis // Economics of Transition, Vol. 18(2), 333-363.
11 По данным Росстата коэффициент смертности за период 2000-2009 годы находился в границах от 1.41% в 2009 г. до 1.64% в 2003 г.
12 Brainerd E., Cutler D.M. (2005). Autopsy of an Empire: Understanding Mortality in Russia and the Former Soviet Union // Journal of Economic Perspectives, Vol. 19 No. 1, pp.107-130.
13 Chenet L., Leon D., McKee M., Vassin S. (1998). Deaths from Alcohol and Violence in Moscow: Socio-Economic Determinants // European Journal of Population, Vol.14 No.1, pp. 19-37; Bobak M., Murphy M., Rose R., Marmot M. (2003). Determinants of Adult Mortality in Russia: Estimates from Sibling Data // Epidemiology, Vol. 14 No. 5, pp. 603-611; Brainerd E., Cutler D.M. (2005). Autopsy of an Empire: Understanding Mortality in Russia and the Former Soviet Union // Journal of Economic Perspectives, Vol. 19 No. 1, pp.107-130; Denisova I. (2010). Adult mortality in Russia. A microanalysis // Economics of Transition, Vol. 18(2), 333-363.
14 Denisova I. (2010). Adult mortality in Russia. A microanalysis // Economics of Transition, Vol. 18(2), 333-363.

Вернуться назад
Версия для печати Версия для печати
Вернуться в начало

Свидетельство о регистрации СМИ
Эл № ФС77-39707 от 07.05.2010г.
demoscope@demoscope.ru  
© Демоскоп Weekly
ISSN 1726-2887

Демоскоп Weekly издается при поддержке:
Фонда ООН по народонаселению (UNFPA) - www.unfpa.org (c 2001 г.)
Фонда Джона Д. и Кэтрин Т. Макартуров - www.macfound.ru (с 2004 г.)
Фонда некоммерческих программ "Династия" - www.dynastyfdn.com (с 2008 г.)
Российского гуманитарного научного фонда - www.rfh.ru (2004-2007)
Национального института демографических исследований (INED) - www.ined.fr (с 2004 г.)
ЮНЕСКО - portal.unesco.org (2001), Бюро ЮНЕСКО в Москве - www.unesco.ru (2005)
Института "Открытое общество" (Фонд Сороса) - www.osi.ru (2001-2002)


Russian America Top. Рейтинг ресурсов Русской Америки.