Skip to content

Latest commit

 

History

History
62 lines (50 loc) · 5.32 KB

README.md

File metadata and controls

62 lines (50 loc) · 5.32 KB

hotel-false-booking-detection

Cеть отелей начала терпеть убытки из-за того, что клиенты стали часто отменять бронь.

Цель проекта

Нужно разработать систему, которая предсказывает отказ от брони. Если модель покажет, что бронь будет отменена, то клиенту предлагается внести депозит. Размер депозита 80% от стоимости номера за одни сутки и затрат на разовую уборку. Деньги будут списаны со счёта клиента, если он всё же отменит бронь.

На разработку системы прогнозирования заложен бюджет 400 000 рублей. При этом необходимо учесть, что внедрение модели должно окупиться за год. Затраты на разработку должны быть меньше той выручки, которую система принесёт компании.

Про данные

В отеле есть несколько типов номеров. В зависимости от типа номера назначается стоимость за одну ночь. Есть также затраты на уборку. Если клиент снял номер надолго, то убираются каждые два дня.

Стоимость номеров отеля:

категория A: за ночь 1 000 рублей, разовое обслуживание 400 рублей.

категория B: за ночь 800 рублей, разовое обслуживание 350 рублей.

категория C: за ночь 600 рублей, разовое обслуживание 350 рублей.

категория D: за ночь 550 рублей, разовое обслуживание 150 рублей.

категория E: за ночь 500 рублей, разовое обслуживание 150 рублей.

категория F: за ночь 450 рублей, разовое обслуживание 150 рублей.

категория G: за ночь 350 рублей, разовое обслуживание 150 рублей.

В ценовой политике отеля используются сезонные коэффициенты: весной и осенью цены повышаются на 20%, летом на 40%.

Описание данных:

  • id — номер записи.
  • adults — количество взрослых постояльцев.
  • arrival_date_year — год заезда.
  • arrival_date_month — месяц заезда.
  • arrival_date_week_number — неделя заезда.
  • arrival_date_day_of_month — день заезда.
  • babies — количество младенцев.
  • booking_changes — количество изменений параметров заказа.
  • children — количество детей от 3 до 14 лет.
  • country — гражданство постояльца.
  • customer_type — тип заказчика:
    • Contract — договор с юридическим лицом.
    • Group — групповой заезд.
    • Transient — не связано с договором или групповым заездом.
    • Transient-party — не связано с договором или групповым заездом, но связано с бронированием типа Transient.
  • days_in_waiting_list — сколько дней заказ ожидал подтверждения.
  • distribution_channel — канал дистрибуции заказа.
  • is_canceled — отмена заказа.
  • is_repeated_guest — признак того, что гость бронирует номер второй раз.
  • lead_time — количество дней между датой бронирования и датой прибытия.
  • meal — опции заказа:
    • SC — нет дополнительных опций.
    • BB — включён завтрак.
    • HB — включён завтрак и обед.
    • FB — включён завтрак, обед и ужин.
  • previous_bookings_not_canceled — количество подтверждённых заказов у клиента.
  • previous_cancellations — количество отменённых заказов у клиента.
  • required_car_parking_spaces — необходимость места для автомобиля.
  • reserved_room_type — тип забронированной комнаты.
  • stays_in_weekend_nights — количество ночей в выходные дни.
  • stays_in_week_nights — количество ночей в будние дни.
  • total_nights — общее количество ночей.
  • total_of_special_requests — количество специальных отметок.