Магистерская диссертация на тему "ТЮМГУ | Разработка web сервиса "прогнозирования загруженности отелей""

Работа на тему: Разработка web сервиса "прогнозирования загруженности отелей"
Оценка: отлично.
Оригинальность работы на момент публикации 50+% на антиплагиат.ру.
Ниже прилагаю все данные для покупки.
https://studentu24.ru/list/suppliers/Anastasiya1---1326

Описание работы

МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное автономное образовательное учреждение высшего образования
«ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»

ИНСТИТУТ МАТЕМАТИКИ И КОМПЬЮТЕРНЫХ НАУК
Кафедра программной и системной инженерии

РЕКОМЕНДОВАНО К ЗАЩИТЕ В ГЭК

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА
магистерская диссертация
РАЗРАБОТКА WEB СЕРВИСА "ПРОГНОЗИРОВАНИЯ ЗАГРУЖЕННОСТИ ОТЕЛЕЙ"

09.04.03 Прикладная информатика
Магистерская программа «Информационные системы анализа данных»

г. Тюмень 2023

ОГЛАВЛЕНИЕ
ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ 3
ВВЕДЕНИЕ 4
Глава 1. Постановка цели и задач 7
1.1 Описание предметной области 7
1.2 Описание цели и задач 14
Глава 2. Подготовка и описание входного набора данных 17
2.1 Архитектура интеграции сервиса 17
2.2 Извлечение данных из первичного источника 19
2.3 Анализ исходных данных 21
2.4 Разведочный анализ данных (Exploratory Data Analysis, EDA) 24
Глава 3. Формирование входных признаков модели прогнозирования 39
3.1 Реализация процедур очистки данных 39
3.2 Feature Selection и Feature Engineering 40
3.3 Формирование входного набора данных 45
Глава 4. Разработка модуля прогнозирования отмены бронирования 49
4.1 Выбор модели прогнозирования и показатели качества прогноза 49
4.1.1 Случайный лес (Random Forest, RF) 56
4.1.2 Логистическая регрессия (Logistic Regression, LG) 58
4.1.3 Метод опорных векторов (Support Vector Machine, SVM) 60
4.1.4 Классификатор голосования (Voting Classifier, VC) 61
4.2 Построение модели прогнозирования и оценка качества прогноза 62
4.3 Методы реализации модели прогнозирования в системе PMS 67
ЗАКЛЮЧЕНИЕ 70
СПИСОК ЛИТЕРАТУРЫ 71
ПРИЛОЖЕНИЕ 76

ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ
PMS – Property Management System (Система управления недвижимостью) HOS – Hotel Operating System (Система управления отелем)
PNR – Personal Name Record (Данные физического лица)
EDA – Exploratory Data Analysis (Разведочный анализ данных)
GDS – Global Distribution System (Глобальная система распределения)
ROC – Receiver Operating Characteristic (Рабочая характеристика приёмника) AUC – Area Under Curve (Площадь под кривой)
SVM – Support Vector Machine (Метод опорных векторов) RF – Random Forest (Случайный лес)
VC – Voting Classifier (Классификатор голосования) LG – Logistic Regression (Логистическая регрессия) LR – Linear Regression (Линейная регрессия)
DT – Decision Tree (Древо решений)

ВВЕДЕНИЕ
На протяжении десятилетий гостиничная индустрия была ключевой отраслью во многих развитых странах. Ожидается, что с непрерывным ростом международного туризма гостиничная индустрия будет расти устойчивыми темпами. Несмотря на эту перспективу, в отрасли давно существуют проблемы. Одной из наиболее важных проблем является отмена бронирования отелей. Данная проблема может быть серьезной для владельцев этих отелей, особенно если это происходит регулярно.
Когда клиенты отменяют бронирование в последний момент, отель может потерять значительную прибыль и иметь проблемы с управлением загрузкой номеров и точным прогнозированием своих будущих доходов. Владельцы отелей также могут столкнуться с проблемами, связанными с ухудшением репутации отеля. Если клиенты недовольны отменой бронирования или политикой возврата денег, они могут оставить отрицательный отзыв в Интернете, что может повредить имидж отеля и привести к убыткам.
Таким образом, частые отмены могут быстро стать дорогостоящими и негативно повлиять на работу отеля. И в целом, владельцы отелей должны принимать меры для снижения рисков и управления своими бронированиями более эффективно.
В свете этого были проведены исследования, чтобы предсказать, произойдет ли отмена бронирования или нет. Мы стремимся расширить такие исследования, используя методы машинного обучения, чтобы классифицировать, будет ли отменено бронирование или нет. Чтобы решить эту проблему бинарной классификации, мы используем логистическую регрессию, дерево решений, случайный лес и классификатор голосования.

Модели не только предсказывают, будет ли отменено бронирование или нет, они также предоставят дополнительную информацию о том, какие независимые переменные играют важную роль в определении того, будет ли отменено бронирование. Такая информация будет полезна менеджерам и владельцам отелей. Это позволит более точно прогнозировать доходы и эффективно применять методы управления доходами. Кроме того, эта информация может иметь ключевое значение для предотвращения будущих отмен, поскольку менеджеры будут лучше понимать переменные, которые играют роль в отмене бронирования.
Текущие практики показывают, что отели склонны использовать строгие правила отмены бронирования и стратегии чрезмерного бронирования, что, как правило, негативно сказывается на доходах и репутации отеля. Наша модель системы, основанная на машинном обучении, может помочь гостиницам преодолеть эту проблему.
В последнее время машинное обучение приобрело большое значение в мире автоматизации. Машинное обучение не только сокращает объем ручной работы, но и генерирует соответствующие результаты. Вместо жесткого кодирования машинное обучение помогает машине самой учиться, принимать решения и выдавать точные результаты. Для обработки данных для получения лучших результатов используются сценарии реального времени. После того как модель готова, ее необходимо обучить на наборе данных. Это используется для проверки точности алгоритма и способности предсказывать результат. Получив желаемые результаты, легко предпринять необходимые шаги, чтобы избежать дальнейших отмен и предложить клиентам лучший опыт.
Для успешной подготовки и защиты выпускной квалификационной работы обучающимся использовались средства и методы физической культуры и спорта с целью поддержания должного уровня физической подготовленности, обеспечивающую высокую умственную и физической работоспособность. В режим
рабочего дня включались различные формы организации занятий физической культурой (физкультпаузы, физкультминутки, занятия избранным видом спорта) с целью профилактики утомления, появления хронических заболеваний и нормализации деятельности различных систем организма.
В рамках подготовки к защите выпускной квалификационной работы автором созданы и поддерживались безопасные условия жизнедеятельности, учитывающие возможность возникновении чрезвычайных ситуаций.

СПИСОК ЛИТЕРАТУРЫ

0. Kimes S.E., Wirtz J. Has revenue management become acceptable? Findings from an International study on the perceived fairness of rate fences. Journal of Service Research, 2003. Раздел 6(2). С. 125–135.
1. Chiang W.C., Chen J.C., Xu X. An overview of research on revenue management: current issues and future research. International Journal of Revenue Management, 2007. Раздел 1(1). С. 97–128.
2. Mehrotra R., Ruttley J. Revenue management (2nd edition). Вашингтон, округ Колумбия, США: American Hotel & Lodging Association (AHLA), 2006.
3. Talluri K.T., Van Ryzin G. The theory and practice of revenue management. Бостон, Массачусетс, США: Kluwer Academic Publishers, 2004.
4. Smith S. J., Parsa H. G., Bujisic M., van der Rest J.P. Hotel cancelation policies, distributive and procedural fairness, and consumer patronage: A study of the lodging industry. Journal of Travel & Tourism Marketing, 2015. Раздел 32(7). С. 886–906.
5. Chen C.C., Xie Lijia K. Differentiation of cancellation policies in the U.S. hotel industry. International Journal of Hospitality Management, 2013. Раздел 34. С. 66–
72.
6. Chen C.C., Schwartz Z., Vargas P. The search for the best deal: How hotel cancellation policies affect the search and booking decisions of deal-seeking customers. International Journal of Hospitality Management, 2011. Раздел 30(1). С. 129–135.
7. Noone B.M., Lee C.H. Hotel overbooking: The effect of overcompensation on customers’ reactions to denied service. Journal of Hospitality & Tourism Research, 2010. Раздел 35(3). С. 334–357.
8. Morales D.R., Wang, J. Forecasting cancellation rates for services booking revenue management using data mining. European Journal of Operational Research, 2010. Раздел 202(2). С. 554–562.
9. Liu P.H. Hotel demand/cancellation analysis and estimation of unconstrained demand using statistical methods. In I. Yeoman & U. McMahon-Beattie (Eds.), Revenue management and pricing: Case studies and applications (pp. 91–101). Cengage Learning EMEA, 2004. (дата обращения: 20.05.2023)
10. Hayes D.K., Miller A.A. Revenue management for the hospitality industry. Хобокен, Нью-Джерси, США: John Wiley & Sons, Inc, 2011. (дата обращения: 20.05.2023)
11. Kimes S.E. The future of hotel revenue management. Cornell Hospitality Reports, 2010. Раздел 10(14).
12. Dhar V. Data science and prediction. Communications of the ACM, 2013. Раздел 56(12). С. 64–73.
13. O’Neil C., Schutt R. Doing data science. Севастополь, Калифорния, США: O’Reilly Media, 2013.
14. Yangyong Z., Yun X. Dataology and data science: Up to now. 2011.
15. Ivanov S., Zhechev V. Hotel revenue management–A critical literature review. Turizam: Znanstveno-Strucnicasopis, 2012. Раздел 60(2). С. 175–197.
16. Anderson C.K. The impact of social media on lodging performance. Cornell Hospitality Report, 2012. Раздел 12(15). С. 4–11.
17. Ivanov, S. Hotel revenue management: From theory to practice. Варна, Болгария: Zangador, 2014.
18. Huang H.C., Chang A.Y., Ho C.C. Using artificial neural networks to establish a customer-cancellation prediction model. Przeglad Elektrotechniczny, 2013. Раздел 89(1b). С. 178–180.
19. Yoon M.G., Lee H.Y., Song Y.S. Linear approximation approach for a stochastic seat allocation problem with cancellation & refund policy in airlines. Journal of Air Transport Management, 2012. Раздел 23. С. 41–46.
20. Phillips R.L. Pricing and revenue optimization. Стэнфорд, Калифорния, США: Stanford University Press, 2021.
21. Chen A.H., Peng N., Hackley C. Evaluating service marketing in airline industry and Its Influence on student passengers’ purchasing behavior using Taipei–London route as an example. Journal of Travel & Tourism Marketing, 2008. Раздел 25(2). С. 149– 160.
22. Park J.W., Robertson R., Wu C.L. Modelling the Impact of airline service quality and marketing variables on passengers’ future behavioral intentions. Transportation Planning and Technology, 2006. Раздел 29(5). С. 359–381.
23. Hastie T., Tibshirani R., Friedman, J. The elements of statistical learning. Springer series in statistics Springer, Berlin, 2001.
24. DeKay F., Yates B., Toh R.S. Non-performance penalties in the hotel industry. International Journal of Hospitality Management, 2004. Раздел 23(3). С. 273–286.
25. Chen T., Guestrin C. Xgboost: A scalable tree boosting system. ACM, 2016. С. 785– 794.
26. Antonio N., de Almeida A., Nunes L. Predicting hotel bookings cancellation with a machine learning classification model, 16th IEEE International Conference Machine Learning Application, IEEE, Канкун, Мексика, 2017. С. 1049–1054.
27. Microsoft, SQL Server Management Studio SSMS. Статья: 31.03.2023.
28. Antonio N., de Almeida A., Nunes L. Hotel booking demand datasets. Data Brief, 2018. Раздел 22. С. 41-49.
29. Задачи Data Mining. Классификация и кластеризация, ИНТУИТ.
30. Машинное обучение для начинающих: алгоритм случайного леса. Alex Maszanski, 2021.
31. Use Voting Classifier to improve the performance of your ML model, Satyam Kumar, 2021.
32. Логистическая регрессия (Logistic Regression), Loginom, 2023.
33. Метод опорных векторов (SVM), Интернет-вики, Студенческий командный чемпионат мира по программированию ICPC в Северной Евразии, 2022.
34. ISO 3166-3:2013 Codes for the representation of names of countries and their subdivisions, 2013.
35. James G., Witten D., Hastie T., Tibshirani R. An introduction to statistical learning, Vol. 12, Springer, 2013.
36. Fawcett T. An introduction to roc analysis, Pattern Recognition Letters, ROC Analysis in Pattern Recognition, 2006. Раздел 27(8). С. 861–874. U

НЕ НАШЛИ, ЧТО ИСКАЛИ? МОЖЕМ ПОМОЧЬ.

СТАТЬ ЗАКАЗЧИКОМ