Институт демографии Национального исследовательского университета "Высшая школа экономики"

№ 789 - 790
5 - 18 ноября 2018

ISSN 1726-2887

первая полоса

содержание номера

архив

читальный зал приложения обратная связь доска объявлений

поиск

Оглавление Демографический дайджест

The role of distance in online social networks: A case study of urban residents in Nanjing, China

Leveraging Facebook’s Advertising Platform to Monitor Stocks of Migrants

БОНУС: Наши в Индии


Понравилась статья? Поделитесь с друзьями:


Google
Web demoscope.ru

Автор обзора Галина Манькова
(студентка 3 курса факультета мировой экономики НИУ ВШЭ)

Рубрику ведет
Илья КАШНИЦКИЙ

Leveraging Facebook's Advertising Platform to Monitor Stocks of Migrants

Zagheni, E., Weber, I., & Gummadi, K. (2017). Leveraging Facebook's Advertising Platform to Monitor Stocks of Migrants. Population and Development Review, 43(4), 721-734. https://doi.org/10.1111/padr.12102

Для выявления, объяснения и предложения эффективных решений проблем современного общества требуется доступ к большим массивам данных, максимально подробно описывающим как население отдельных регионов, так и всё человечество в целом в текущий момент времени. К сожалению, традиционные источники данных чаще всего не соответствуют этим критериям. Эмилио Зажжени, Ингмар Вебер и Кришна Гуммади видят решение этой проблемы в использовании принципиально новых информационных источников - баз данных различных Интернет-ресурсов: социальных сетей, поисковых систем и т. д. В своей статье они рассматривают целесообразность использования данных, предоставляемых рекламной платформой Фейсбука, Adverts Manager, для наблюдения за количеством иммигрантов в разных регионах и странах.

Adverts Manager позволяет бесплатно оценить размер выборки, состоящей из активных пользователей Фейсбука за текущий месяц, которые соответствуют предварительно заданным на платформе критериям (возраст, пол, место жительства, интересы и т. д). Главные преимущества этой платформы как источника информации - большая (примерно 1,9 млрд человек) и неоднородная база данных, а также использование не только данных, указанных непосредственно пользователем в своём профиле, но и активности пользователя на Фейсбуке и партнёрских сайтах. Однако у Adverts Manager есть и существенный минус - отсутствуют чёткие определения критериев, по которым осуществляется выбор пользователей; такие определения можно найти только в статьях исследователей, работающих в Фейсбуке.

Чтобы убедиться в релевантности информации, предоставляемой Adverts Manager, авторы статьи строят модель, выявляющую схожесть оценок количества иммигрантов, полученных с помощью этой платформы, с оценками, предоставленными проверенными традиционными источниками. С помощью этой модели авторы проверяют значимость данных, необходимых для решения двух исследовательских задач: оценок количества совершеннолетних мигрантов разной национальности в штатах США и в 96 странах, имеющих более 1 млн активных пользователей Фейсбука за месяц. Традиционный источник для первой задачи - "Исследование Американского Общества" (2014) (American Community Survey (2014)), для второй задачи - оценки Всемирного Банка (2015).

Данные о количестве иммигрантов были получены из Adverts Manager с помощью категории "Иммигранты (название региона)" (Expats (*)). Алгоритм платформы определял пользователя Фейсбука как иммигранта, если он указал разные города в категориях "Текущее место проживания" и "Родной город" в своём профиле и/или как минимум двое из его друзей проживали в стране, заданной исследователем как родная, а двое - в стране, указанной как принимающая.

Результаты модели, полученные для каждой из исследовательских задач, представлены на Рисунках 1 и 2. Как видно из этих графиков, существует сильная корреляция между оценками количества иммигрантов, полученными Adverts Manager и традиционными источниками. Тем не менее, имеются незначительные смещения показателей Adverts Manager по сравнению с традиционными источниками: в первом случае наблюдается преимущественно занижение показателей, во втором случае - как занижение, так и завышение. В обоих случаях результаты модели отличаются высокой надёжностью (коэффициент детерминации для первого случая равен 0,94, а для второго - 0,6).

График 1. Согласованность оценок доли иммигрантов в штатах США, полученных Фейсбуком (2016) и "Исследованием Американского Общества" (2014)

График 2. Согласованность оценок доли иммигрантов по данным Фейсбука (2016) и Всемирного Банка (2015) в странах, имевших более 1 млн активных пользователей Фейсбука за месяц

Далее исследователи устраняют систематические ошибки модели, добавляя дамми переменные для каждой возрастной группы и национальности иммигрантов. Также авторы статьи предлагают оценивать не всю совокупность иммигрантов определённой национальности, а отдельные половозрастные группы. Усовершенствованная модель действительно оказалась надёжнее своего первоначального варианта: её средняя абсолютная ошибка составила всего 37%, тогда как для первоначальной модели этот показатель был равен 56%. Кроме того, усовершенствованная модель позволила выявить некоторые закономерности в ошибках Adverts Manager: по сравнению с традиционными источниками, платформа обычно переоценивает доли молодых (от 20 до 34 лет) иммигрантов в регионе и недооценивает доли иммигрантов в возрасте 35 - 59 лет.

Таким образом, исследователям удалось продемонстрировать адекватность демографических данных, предоставляемых Фейсбуком. Следовательно, его рекламная платформа Adverts Manager может быть использована демографами для решения самых разных задач: изучения многочисленных социально-демографических показателей, вовлечения в прохождение опросов малочисленных и/или географически удалённых от исследователя групп населения и т. д. Однако авторы статьи отмечают и недостатки использования данного источника информации: его данные могут быть недостоверными, поскольку не всё население мира имеет профиль на Фейсбуке, а имеющие его люди могут указывать не все данные о себе или указывать их неверно; отсутствуют чёткие и не меняющиеся со временем определения категорий на Adverts Manager. Кроме того, данная платформа может, к сожалению, служить не только для исследований, но и для выявления и дальнейшей дискриминации наиболее уязвимых групп населения. Решения этих проблем авторы видят в сочетании данных, предоставляемых Фейсбуком, с надёжными традиционными источниками и в создании базовых правил исследовательской этики и защиты данных пользователей Фейсбука.

Вернуться назад
Версия для печати Версия для печати
Вернуться в начало

Свидетельство о регистрации СМИ
Эл № ФС77-54569 от 21.03.2013 г.
demoscope@demoscope.ru  
© Демоскоп Weekly
ISSN 1726-2887

Russian America Top. Рейтинг ресурсов Русской Америки.