Технические и методологические проблемы сбора данных о ценах онлайн-ритейлеров
А. С. Евсеев – научный сотрудник РАНХиГС при Президенте Российской Федерации (Москва). Е-mail: Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Р. Р. Латыпов – главный экономист по России АО «Арована Капитал» (Москва). Е-mail: Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Е. А. Постолит – аналитик АО «Арована Капитал» (Москва). Е-mail: Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Е. С. Синельникова-Мурылева – старший научный сотрудник РАНХиГС при Президенте Российской Федерации, канд. экон. наук (Москва). Е-mail: Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Данные о ценах онлайн-ритейлеров обладают огромной ценностью с точки зрения экономической науки: их использование позволяет уточнять прогнозы инфляции и предвосхищать будущие тенденции в моменте, корректировать оценки жесткости цен и выводы теоретических моделей ценообразования, проверять закон единой цены и т.д. Однако в процессе сбора данных возникают серьезные трудности, которые являются неочевидными и могут угрожать как качеству собираемых данных, так и устойчивости процесса их сбора во времени.
В статье впервые подробно обсуждаются технические и методологические проблемы, которые препятствуют непрерывному сбору данных в Сети, а также представлен опыт решения этих проблем; обсуждаются плюсы и минусы таких решений.
Статья подготовлена в рамках выполнения научно-исследовательской работы государственного задания РАНХиГС при Президенте Российской Федерации на 2022 год.
Ключевые слова: цены онлайн-ритейлеров, парсинг, инфляция, альтернативные данные, big data.
JEL: C81, C82, E31, C55.