Рейтинг

Опубликовано 11/04/2017
* отмечены бары, у которых обнаружены некорректные исходные данные, что могло оказать влияние на их позицию в рейтинге.

Abstract




Данный рейтинг представляет собой попытку построения универсального объективного индикатора качества/популярности баров без использования экспертных оценок и отзывов посетителей, основывающегося лишь на физических характеристиках заведения и генерируемых вокруг него многомерных данных из социальных сетей.

В (Айвазян, 2003)RePeC указано, что в соотвествии с известным в теории управления порогом сложности человек в состоянии дать адекватную качественную оценку событию или явлению, если оно описывается не более чем 7-10 параметрами (частными критериями). В противном случае для его осмысления и обобщенных выводов необходимо использовать специальные методы уменьшения размерности (Метод главных компонентWiki).


Methodology




Поскольку исходные данные представлены как числовыми так и номинальными переменными, для снижения размерности используется Multivariate Analysis для Метода главных компонент.
Краткое описание: (Le, Josse, Husson, 2008)ResearchGate.
Реализация метода: пакет FactoMineRCran в R.

Для расчета итоговых оценок используется метод построения интегральных характеристик без обученияWiki (метод модифицированной первой главной компоненты), предложенный в (Айвазян, 2003)RePeC.


Data




В модель включены 35 параметров.

Офлайн характеристики
Источник данных: телефонные опросы и в некоторых случаях - непосредственное посещение. Актуальность: сентябрь 2016.
Количественные
  1. LifeTime - Период от открытия заведения до текущей даты (дни, на 05/04/2017)
  2. Tap - Количество кранов
  3. Seat - Количество мест
  4. WC - Количество туалетов
  5. Bartender - Численность барменов
  6. TapRatio - Количество кранов/Количество мест
  7. WCRatio - Количество туалетов/Количество мест
  8. BartenderRatio - Численность барменов/Количество мест
  9. FBhours - Рабочие часы в неделю (*данные со страниц facebook на 05/04/2017)
Качественные
  1. Card - Оплата картой (0-Нет, 1-Есть)
  2. Street - Места на улице (0-Нет, 1-Есть)
  3. Liquor - Крепкий алкоголь (0-Нет, 1-Есть)
  4. Waiter - Официанты (0-Нет, 1-Есть)
  5. WiFi - WiFi (0-Нет, 1-Есть)
  6. Cuisine - Кухня (0-Нет, 1-Есть)

Онлайн характеристики
Источник данных: соцсети. Актуальность: 05/04/2017.
Количественные
VK
  1. VKmembers - Подписчики
  2. VKsexF - Процент женщин
Facebook
  1. FBfan_count - Подписчики
  2. FBInter - Процент иностранцев
  3. FBtaggedRatio - Среднее упоминаний группы в постах за неделю
  4. FBPostRatio - Среднее постов в день (по последним 100 постам)
  5. FBlikesRatio - Среднее лайк/пост (по последним 100 постам)
  6. FBcommentsRatio - Среднее коммент/пост (по последним 100 постам)
  7. FBsharedpostsRatio - Среднее репост/пост (по последним 100 постам)
Foursquare
  1. FRSQvisits - Визиты
  2. FRSQcheckins - Чекины
  3. FRSQusers - Юзеры
  4. FRSQcheckinsActivity - Среднее чекин/юзер
  5. FRSQcheckinsRatio - Среднее чекинов в день
  6. FRSQvisitsRatio - Среднее визитов в день
Instagram
  1. INSTFollowers - Подписчики
  2. INSTRatio - Среднее постов в день (от даты открытия до 05/04/2017)
UNTAPPD
  1. UNTAPTotal - Чекины
  2. UNTAPUnique - Юзеры
  3. UNTAPMonthly - Среднее чекинов в месяц
Данные получены с использованием Web APIWiki (VK, Facebook, Foursquare) и Web scrapingWiki (Instagram, UNTAPPD).
Все расчеты выполнены в R.

Analyse




Рейтинг рассчитан для 67 объектов.
Корректировка исходных данных
Bartender
Количество барменов для указавших интервал значений посчитано как среднее с округлением вниз.
VKmembers
Количество подписчиков пересчитано без учета заблокированных/удаленных пользователей.
*Для баров, не имеющих страницу Вконтакте, VKmembers и VKsexF равны 0.
FBsharedpostsRatio
В значениях коэффициента репоста 2 аномальных значения.
FBsharedpostsRatio - SatterPlot
Причина - периодические перепосты новостей страницы в тематические группы. Переменной FBsharedpostsRatio данных баров присвоено значение 0.
INSTFollowers
В значениях количества подписчиков Instagram 2 аномальных значения.
INSTFollowers - SatterPlot
Переменной INSTFollowers данных баров присвоено медианное значение по выборке.

Model




Первые 2 компоненты для числовых переменных.
Variables - PCA
1-я главная компонента значима (объясняет 32.3% общей вариабельности признаков).
Параметры с большим значением cos2 (цветовая шкала на графике или длины векторов) вносят относительно бо́льший вклад в дисперсию интегральной характеристики.
Для рейтинга в качестве весовых коэффициентов используются факторные нагрузки cos2 1-й главной компоненты (квадраты координат по оси Dim1)*.
*Значения по оси Dim1 - коэффициенты корреляции исходных переменных с первой главной компонентой.

Первые 2 компоненты для номинальных переменных.
Ellipses - PCA
Параметры Street, Waiter и Liquor в наибольшей степени растягивают группы индивидуальных наблюдений 0/1 вдоль 1-й главной компоненты, и их факторные нагрузки значимо отличны от 0 (треугольник и эллипс - среднее и 95%-й доверительный интервал для него).

Result




Нормированные значения весов (Weighted, %).


Интегральный индикатор рассчитывается как сумма произведений весовых коэффициентов на соответствующие приведенные к единой шкале [0,1] частные критерии.

Значения итоговой оценки с высокой значимостью делятся на 3 группы.
RankStars - SatterPlot
Интервалам (-:1.5), [1.5:4), [4:+) можно присвоить соотвественно оценки ★★★, ★★★★, ★★★★★.


References




Sebastien Le, Julie Josse, Francois Husson (2008). FactoMineR: An R Package for Multivariate Analysis. Journal of Statistical Software, 25(1).PDF
Kolenikov, S., & Angeles, G. (2004). The use of discrete data in PCA: theory, simulations, and applications to socioeconomic indices. Chapel Hill: Carolina Population Center, University of North Carolina, 1-59.PDF
Айвазян, С. А. (2003). К методологии измерения синтетических категорий качества жизни населения. Журнал Экономика и математические методы (ЭММ), 39(2).PDF



Рейтинг обновляется и дополняется при поступлении новых данных.
Вопросы и комментарии по рейтингу: facebook.com/craftbeermap
Для добавления в рейтинг или уточнения данных для пересчета заполните форму.



© 2015–2017 craftbeermap.ru