Я хочу начать это путешествие с нескольких вопросов? Как я могу обеспечить качество жизни и изменения знаний для всех сторон, связанных с AirBnB? Какой дополнительный анализ можно провести, чтобы потенциально улучшить взаимодействие с пользователем? Какую информацию можно предоставить пользователям, чтобы помочь им принять более взвешенное решение при выборе места для проживания? Какие потенциальные улучшения можно внести, чтобы упростить анализ серверной части для тех, кто занимается собственным анализом, или даже для аналитиков AirBnB?

Именно об этих вопросах я думал, когда мне представили и я начал копаться в наборе данных AirBnB для Сиэтла. Я сразу приступил к работе, делая то, что каждый аналитик делает лучше всего, — чистку.

После очистки и подготовки набора данных для анализа я начал думать о подходах к своим вопросам.

Мой первый подход заключался в создании инструмента прогнозирования цен. Этот инструмент может помочь как тем, кто размещает объявления на AirBnB, так и тем, кто ищет жилье. Мой инструмент примет информацию, представленную в листинге, и предложит цену. Этот инструмент имеет точность около 75%, что на самом деле довольно много для этого типа инструмента прогнозирования.

Этот инструмент может быть очень полезен для тех, кто делает списки, потому что они могут получить простую оценку того, какую цену они должны установить, чтобы быть конкурентоспособными с другими подобными списками на рынке.

Для тех, кто пытается найти место, они могут использовать этот инструмент, чтобы предоставить им больше информации о текущем объявлении, в котором они заинтересованы. Он немедленно сообщит им, переплачивают ли они или недоплачивают за это текущее объявление и на сколько. Это позволит пользователю принять более взвешенное решение, прежде чем арендовать место.

Следующее, что меня заинтересовало, это посмотреть, как рейтинг влияет на цену листинга. Мне было любопытно посмотреть, по мере того, как рейтинги становились все лучше и лучше, как это повлияет на цену?

Этот график выше показывает взаимосвязь между рейтингом листинга и его ценой.

Во-первых, вы можете увидеть небольшой восходящий тренд между рейтингом и ценой. Это означает, что чем больше стоимость объявления, тем больше у вас будет опыта в этом месте.

Опять же, это верно до некоторой степени. Мы видим, что люди должны избегать низких рейтингов и более дешевых предложений. Это говорит нам о том, что люди не наслаждались своим временем.

Основываясь на этом чате, мы видим, что если кто-то готов заплатить 400 долларов и выше, он почти гарантированно получит удовольствие от отпуска, в то время как те, кто тратит меньше, могут иметь самые разные мнения об отдыхе.

Моей последней идеей было помочь тем, кто хочет анализировать наборы данных, предоставленные AirBnB, или тем, кто работает в самой AirBnB. Я создал инструмент, который правильно предсказывает тип комнаты примерно в 91% случаев.

Причина, по которой это может быть очень полезно, заключается в том, что это может расширить объем данных, которые можно проанализировать. Этот инструмент можно использовать для заполнения пробелов, которые могут отсутствовать.

Другим потенциальным использованием этого инструмента может быть своего рода автозаполнение при создании листинга. Когда пользователь начинает заполнять информацию о листинге, который он хочет опубликовать, он потенциально может автоматически указать тип комнаты.