Дослідження ефективності застосування методів машинного навчання для прогнозування відмови бронювання номерів готелю
У роботі розглядається можливість застосування методів інтелектуального аналізу даних для прогнозування показників готельного бізнесу. Виконується порівняння ефективності низки методів прогнозування та класифікації, у тому числі методів нейромережевого моделювання, на тестової задачі прогнозування одного з важливих для кожного готелю показників – ймовірності відмови клієнта від заброньованого номера.
Високий рівень накладних витрат в індустрії готельного бізнесу все частіше змушує власників замислюватися над необхідністю установки системи, яка забезпечить чітку організацію і взаємозв’язок між різними службами організації, допоможе знизити експлуатаційні, енергетичні та операційні витрати. Для підвищення економічної ефективності готелю завжди треба прагнути, щоб було заповнено якомога більше номерів. Для досягнення цієї мети використовується попереднє бронювання номерів клієнтами.
Тому метою створення інформаційної системи є відповідь на питання: чи скасує бронювання клієнт? Актуальність обраної теми обумовлена необхідністю прогнозування рівня бронювання і, зокрема, випадків відміни бронювання, оскільки ця задача являє собою найважливішу частину оптимізації готельного бізнесу.
Таким чином значення показника, що прогнозується, має 0 або 1. Двійковість показника дозволяє застосувати для його визначення також не тільки методи прогнозування, а й класифікації.
Для дослідження ефективності прогнозування ймовірності відміни бронювання були обрані наступні методи:
- метод лінійної регресії (Linear regression);
- метод логістичної регресії (Logistic regression);
- метод найближчих сусідів (KNN);
- метод дерева прийняття рішень (Decision Tree Classifier);
- метод випадкового лісу (Random Forest Classifier);
- методи градієнтного бустінгу: XGBoost, CATBoost, LGBMClassifier;
- метод адаптивного бустінгу AGABoost;
- метод ансамблю моделей (Voting Classifier);
- багатошаровий персептрон (ANN).
Для реалізації наведених алгоритмів була розроблена інформаційна система для прогнозування показнику скасування бронювання. Для проведення аналізу та складання статистики був використаний набір даних з площадки Kaggle [1].
Аналіз даних показав, що найбільш важливими параметрами, які найбільш корелюють з відміною бронювання, є:
- час, за котрий відбувається бронювання;
- кількість спеціальних пропозицій;
- наявність місця для стоянки авто;
- чи був гість у минулому клієнтом готелю;
- це путівка або приватне бронювання.
На Рис. 1 наведені показники точності роботи моделей.
Як видно з рисунку, найкращий показник виявився у CatBoost та у багатошарового персептрону. Наслідком інтеграції розробленого програмного забезпечення у СППР готелю буде підвищення економічної ефективності готелю, що покращить позицію готелю серед конкурентів.
Література
- Kaggle: Your Machine Learning and Data Science Community https://www.kaggle.com/datasets [Електронний ресурс] (Дата звернення 06.03.2023)