Не так давно стало известно о повышении цен на проезд в общественном транспорте. Помимо всех разговоров, на эту тему вышло интересное исследование у петербуржских Городских Проектов (почитайте, если еще не), которое сподвигло, в том числе, меня встать с кровати и сделать одну интересную вещь, о которой я расскажу. Само исследование посвящено эффективности тарифов на проезд в ОТ Санкт-Петербурга, и одной из ее мер берется отношение стоимости месячного проездного к стоимости одной поездки. Это разумно: так понятна выгода покупки безлимитного билета в сравнении с покупкой одноразовых поездок, и, как следствие, стимул для покупки месячных проездных и использования общественного транспорта. Эта метрика по Санкт-Петербургу сравнивается с другими европейскими городами (Прага, Будапешт, Варшава и Москва), на фоне которых Санкт-Петербург оказывается самым невыгодным для пользователей ОТ. В этот момент мне стало интересно, как ситуация у нас сравнима с остальными городами, не только с теми, которые выбрали ГорПроекты. На помощь мне пришел сайт numbeo.com, который собирает информацию о стоимости жизни в разных городах мира. Среди информации, которую им отправляют жители городов, есть и стоимость одной поездки на транспорте и месячного проездного. Я зарядил CasperJS и скачал эти данные для всех городов мира, которые есть на сайте (всего 574), чтобы сравнить их с Петербургом. Понятно, что данные неоднозначны: есть определенная погрешность, какие-то регионы представлены лучше, какие-то хуже, они по-разному обновляются и прочее. Конкретной погрешности я не назову: это проект, который я делал полнедели на коленке, но я считаю, что главные, интересующие нас тенденции эти данные отражают. После чистки совсем уж недостоверных значений (очевидный недостаток наблюдений, другие недостатки данных и прочее) осталось 569 городов из 119 стран. Для всех я брал стоимость одной поездки и месячного проездного в долларах (конвертация на совести сайта, дата — 13.11.2016). Поделив стоимость месячного на стоимость поездки получилось интересующее нас отношение. Самое большое значение — 180, самое маленькое — 6,5. Среднее значение — 35, медиана — 30. Интересно, что предложенное ГорПроектами отношение (50 и 1800) подходит к медиане по моим данным (в этот момент я стал подозревать, что это было сделано, просто не опубликовано). Мои данные хорошо сошлись с данными ГорПроектов, кроме Варшавы (это, вероятно, связано с зональностью проездных). Самые большие значения получились в Дар-Эс-Саламе (сомнительно, конечно, но допустим), Гуанчжоу и филиппинский город Себу (отношения — 181, 152 и 146). Самые небольшие — в Хантсвиле, Алабама, Пномпене и австралийском Ньюкасле (6,5 (вау), 10 и 10,5). Теперь что касается Санкт-Петербурга. Результаты получились неожиданные и масштабнее, чем я ожидал, хотя я и предполагал, что ситуация с тарифами у нас тяжелая. Санкт-Петербург попал в топ-30 самых невыгодных городов мира, заняв 27 место (!) со значением 71. Если использовать данные ГП (76,86), Петербург обгоняет Алматы и Вишакхапатнам, попадая на 19 место в мире (!). Даже с данными по Numbeo, Петербург попадает, более того, в 95% квантиль, то есть в 5% худших городов мира (граница — 66,77). Сейчас наши "соседи" — Сан-Хосе, Коста-Рика и Кингстон, Ямайка. Более того, после подсказки Ксюши, я решил обратить внимание на распределение по континентам (грубо, но показательно). Выяснилось, что Санкт-Петербург — худший город Европы (!) для пассажиров общественного транспорта, с Одессой на втором месте. Это, вместе с 30 худшими городами, показано на первом графике, с распределением городов по континентам: в топе Азия и Африка. На втором графике видно 30 самых выгодных городов: почти все — из Европы и Америк. Для показательности я добавил еще один график, с распределением метрики по всем городам, попавшим в базу. На нем отдельно отмечен Санкт-Петербург, где видно, какое высокое место он занимает в мире. Интересно также само распределение, с загибающимся "хвостом". Все данные, которые я скачал, выложены в репозитории на Гитхаб (github.com/matthewstifler/transport-costs), если есть еще такие же нерды, которым это интересно. Дальше немного посредственной ценности фактов для информационных маньяков вроде меня. Россия неплохо выступает на общем фоне, в основном — за счет городов с низким показателем метрики: Москвы (36,5) Новосибирска (30) и Казани (29,9). Из российских городов есть еще Екатеринбург, с высоким значением в 62 (в два раза больше медианного!). Итого, среднее по России — 46. Это хорошо смотрится на фоне постсоветских стран, значения которых в основном выше: самое высокое, 66 — в Казахстане, следом за ним идут Молдова (64), Грузия, Беларусь, Армения, Азербайджан. В итоге по всем странам Россия на 36 месте по невыгодности, из 114. Самые невыгодные страны (по средним значениям) — Танзания (Дар-Эс-Салам — 180), Сирия (данные очевидно устаревшие, но 130), Панама (111), Сальвадор (100), Гватемала (98), Иран (90), Нигерия (89), Китай (84). Самые выгодные страны — Камбоджа (из-за Пномпеня), Люксембург, Эстония, Мальта и Финляндия. Близость стран с совсем другим подходом к тарифам, судя по всему, оказывает особенное влияние на масштаб дискуссии о тарифах в Петербурге. Средние значения по континентам: 49 в Африке, 47 в Азии, 35 в Северной и Южной Америке, 30 в Океании и 27 в Европе. В будущем я думаю добавить еще какие-нибудь параметры (наличие метро, например) или метрики с numbeo и посмотреть, с чем связано отношение месячного к одноразовому билету, и связано ли вообще (например, разница в цене квадратного метра в центре и на окраинах). Если у кого-то есть какие-то идеи, что еще можно тут посмотреть — пишите :) UPD: Спасибо Ире и Ксюше за помощь с графиками!