Технические и методологические проблемы сбора данных о ценах онлайн-ритейлеров

А. С. Евсеев – научный сотрудник РАНХиГС при Президенте Российской Федерации (Москва). Е-mail: Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.

Р. Р. Латыпов – главный экономист по России АО «Арована Капитал» (Москва). Е-mail: Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.

Е. А. Постолит – аналитик АО «Арована Капитал» (Москва). Е-mail: Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.

Е. С. Синельникова-Мурылева – старший научный сотрудник РАНХиГС при Президенте Российской Федерации, канд. экон. наук (Москва). Е-mail: Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.

Данные о ценах онлайн-ритейлеров обладают огромной ценностью с точки зрения экономической науки: их использование позволяет уточнять прогнозы инфляции и предвосхищать будущие тенденции в моменте, корректировать оценки жесткости цен и выводы теоретических моделей ценообразования, проверять закон единой цены и т.д. Однако в процессе сбора данных возникают серьезные трудности, которые являются неочевидными и могут угрожать как качеству собираемых данных, так и устойчивости процесса их сбора во времени.

В статье впервые подробно обсуждаются технические и методологические проблемы, которые препятствуют непрерывному сбору данных в Сети, а также представлен опыт решения этих проблем; обсуждаются плюсы и минусы таких решений.

Статья подготовлена в рамках выполнения научно-исследовательской работы государственного задания РАНХиГС при Президенте Российской Федерации на 2022 год.

Ключевые слова: цены онлайн-ритейлеров, парсинг, инфляция, альтернативные данные, big data.

JEL: C81, C82, E31, C55.