Для цитирования: Исупова О.Г.,
Белянин А.В., Островская Ю.Е. На что жалуемся, мамочка? //Демоскоп
Weekly. 2015. № 659 - 660.
URL: http://demoscope.ru/weekly/
2015/0659/tema01.php
|
Понравилась статья? Поделитесь с друзьями:
|
|
|
|
|
|
На что жалуемся,
мамочка? |
 |
Над темой номера работали
|
 |
 |
 |
Ольга ИСУПОВА
|
Алексей БЕЛЯНИН
|
Юлия ОСТРОВСКАЯ
|
|
Как мы работали с базой данных
База данных бесплатной юридической консультации женщин
Центра трудовых прав, которую мы исследуем, содержит данные обо
всех обращениях, поступивших в эту базу с сентября 2011 по декабрь
2014 годов, в общей сложности 1317 обращений. База полностью текстовая,
несмотря на то, что она заполнялась по формализованной анкете-карточке,
для того, чтобы сделать осуществимым ее количественный анализ, вначале
было проведено многоуровневое кодирование данных.
В качестве зависимой переменной был выбран характер
(содержание) обращения, или точнее – характер нарушения трудовых
прав женщины. Статистические методы анализа, при данном размере
базы, позволяют проверить, насколько значимо влияют на эту переменную
те характеристики, которые мы также закодировали и использовали
как зависимые переменные, а именно:
- возраст,
- регион,
- наличие беременности,
- наличие детей в возрасте до трех лет,
- наличие детей в возрасте от трех до 14 лет,
- характер оформления трудовых отношений,
- характер заработной платы («белая», «серая», «черная»),
- размер предприятия,
- стаж работы на предприятии.
К сожалению, более подробные социально-демографические
данные (например, общий стаж работы, точное число детей и их точный
возраст, уровень образования, семейный статус, и т.д.) в базу изначально
заложены не были. Это обстоятельство существенно осложняет количественный
анализ, поскольку уменьшает вариацию независимых переменных даже
в тех случаях, когда получение точной оценки едва ли представляет
какие-то принципиальные сложности.
Изначально основная зависимая переменная была закодирована
50-ю кодами, которые в дальнейшем были объединены в 16 групп кодов
в целях обеспечения возможности статистического анализа. Также были
перекодированы и многие независимые переменные в целях увеличения
среди них числа порядковых и уменьшения количества категориальных,
поскольку это обеспечивало большее число независимых степеней свободы
в оцениваемых моделях. Например, везде был учтен либо точный возраст
обратившейся в годах, либо ее возраст был приведен к середине указанного
в ее карточке возрастного интервала. Аналогично, стаж работы на
предприятии был приведен к шести порядковым значениям, за основу
во всех случаях была взята середина отмеченного в карточке интервала
(в годах). Размер предприятия (количество работающих на нем) также
был перекодирован таким образом, чтобы стать порядковой переменной
(через приведение количества работающих к середине избранного в
каждом случае интервала). Наличие беременности/детей, в целях облегчения
анализа, было разложено на три дамми-переменные (со значениями 0/1)
по каждой респондентке, так, что про каждую из них в результирующей
базе отдельно сказано, есть ли у нее в момент обращения беременность,
отдельно – есть ли у нее дети в возрасте от 0 до 3 лет, и отдельно
– есть ли у нее дети в возрасте от 3 до 14 лет (3-х-летние дети
при этом имели равную вероятность оказаться учтенными как во второй,
так и в третьей группе, в связи с особенностями формулировки анкеты).
Таким образом, категориальными остались только переменные: статус
занятости, статус зарплаты, характер оформления на предприятии (наличие
или отсутствие трудового договора), и регион.
Суммарные статистики переменных приведены в табл. 1-6.
Таблица 1. Суммарные статистики по возрасту,
полу и статусу занятости обратившихся
Переменная
|
Число наблюдений
|
среднее
|
медиана
|
стандартное отклонение
|
минимум
|
максимум
|
Возраст
|
922
|
29,5
|
29
|
5,02
|
18
|
60
|
Пол*
|
1313
|
1,02
|
1
|
0,139
|
1
|
2
|
Статус занятости**
|
1312
|
1,27
|
1
|
1,32
|
1
|
7
|
* 1 - женщина, 2 –мужчина
** 1- работает 7 – отрицание трудовых отношений
Таблица 2. Распределение обратившихся по статусу
занятости
Статус занятости
|
Частота
|
Процент
|
работает в т. ч. в отпуске по уходу
|
1115
|
84,98
|
не работает, в т.ч. безработная или уволена
|
158
|
12,04
|
ИП
|
13
|
0,99
|
пенсионер
|
2
|
0,15
|
учащийся
|
15
|
1,14
|
неизвестно
|
5
|
0,38
|
отрицание трудовых отношений
|
4
|
0,30
|
Всего
|
1312
|
100,00
|
Таблица 3. Распределение обратившихся по стажу
работы на данном предприятии
(в годах)
Стаж
|
Частота
|
Процент
|
0-0,6
|
74
|
5,63
|
0,6-1
|
220
|
16,74
|
1-3
|
380
|
28,92
|
3-6
|
287
|
21,84
|
6-10
|
70
|
5,33
|
10-20
|
11
|
0,84
|
20+
|
4
|
0,3
|
Безработная
|
67
|
5,1
|
Нет данных
|
201
|
15,3
|
Всего
|
1314
|
100
|
Таблица 4. Распределение обратившихся по статусу
зарплаты
Статус зарплаты
|
Частота
|
Процент
|
«белая»
|
717
|
54,61
|
«серая»
|
270
|
20,56
|
«черная»
|
29
|
2,21
|
неизвестно
|
297
|
22,62
|
Всего
|
1313
|
100,00
|
Таблица 5. Распределение обратившихся по числу
работающих на предприятии
Число работающих
|
Частота
|
Процент
|
Менее 50 человек
|
468
|
35,64
|
От 50 до 100 человек
|
225
|
17,14
|
От 100 до 500 человек
|
137
|
10,43
|
Более 500
|
77
|
5,86
|
Неизвестно
|
406
|
30,92
|
Всего
|
1313
|
100,00
|
Таблица 6. Распределение обратившихся по регионам
Регион
|
Частота
|
Процент
|
Москва
|
292
|
22,27
|
Санкт-Петербург
|
314
|
23,95
|
Новосибирск
|
619
|
47,22
|
Калининград
|
84
|
6,41
|
Красноярск
|
2
|
0,15
|
Всего
|
1311
|
100,00
|
Далее, мы исключили из анализа некоторые единичные случаи,
не имеющие непосредственного отношения к трудовым правам (например,
вопрос о том, как установить факт рождения ребенка при домашних
родах, или можно ли предъявить справку из женской консультации о
беременности в полицию). Один из регионов, Красноярск, оказался
представлен очень незначительным количеством случаев для большинства
значимых кодов зависимой переменной, и мы объединили его в один
общий с Новосибирском регион «Сибирь».
В результате была составлена количественная база данных
с переменными, после чего (при обработке полученного числового массива
данных в программе Stata) были применены методики вариационного
и регрессионного анализа. Для целей этого анализа была задана качественная
зависимая переменная «причина обращения», кодирующая причины жалобы
изначально в 50 категорий, затем – в 17 и в конечном итоге – в 7
основных категорий, с которыми и идет дальнейшая работа.
|