Магистерская диссертация на тему "ТЮМГУ | Разработка сервиса автоматической обработки обращений на горячую линию МКУ "Тюменьгортранс""

Работа на тему: Разработка сервиса автоматической обработки обращений на горячую линию МКУ "Тюменьгортранс"
Оценка: хорошо.
Оригинальность работы на момент публикации 50+% на антиплагиат.ру.
Ниже прилагаю все данные для покупки.
https://studentu24.ru/list/suppliers/Anastasiya1---1326

Описание работы

МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное автономное образовательное учреждение высшего образования
«ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»

ИНСТИТУТ МАТЕМАТИКИ И КОМПЬЮТЕРНЫХ НАУК
Кафедра программного обеспечения

РЕКОМЕНДОВАНО К ЗАЩИТЕ В ГЭК

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА
магистерская диссертация
РАЗРАБОТКА СЕРВИСА АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ОБРАЩЕНИЙ НА ГОРЯЧУЮ ЛИНИЮ МКУ "ТЮМЕНЬГОРТРАНС"

02.04.03 Математическое обеспечение и администрирование информационных систем
Магистерская программа «Разработка технологий Интернета вещей и больших данных»

ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ 3
ГЛАВА 1. КЛАССИФИКАЦИЯ ТЕКСТОВ 5
1.1 ПОСТАНОВКА ЗАДАЧИ 5
1.2 ПРЕДОБРАБОТКА ТЕКСТА 7
1.3 УМЕНЬШЕНИЕ РАЗМЕРНОСТИ ПРОСТРАНСТВА ПРИЗНАКОВ 8
1.4 МЕТОД ОПОРНЫХ ВЕКТОРОВ 9
1.5 МЕТОДЫ НА ОСНОВЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ 12
1.6 ОЦЕНКА КАЧЕСТВА КЛАССИФИКАЦИИ 17
1.7 ИСПОЛЬЗУЕМЫЕ ТЕХНОЛОГИИ 18
ГЛАВА 2. РАЗРАБОТКА СИСТЕМЫ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ОБРАЩЕНИЙ 20
2.1 ИМЕЮЩИЕСЯ ДАННЫЕ 20
2.2 ПОДГОТОВКА ДАТАСЕТА 21
2.3 ПРЕДОБРАБОТКА ДАННЫХ 22
2.4 ПОДГОТОВКА ТЕКСТА 27
2.5 РАЗРАБОТКА КЛАССИФИКАТОРА ОБРАЩЕНИЙ 29
2.6 ОПРЕДЕЛЕНИЕ ИСХОДНОЙ КАТЕГОРИИ ОБРАЩЕНИЯ 37
2.7 РАЗРАБОТКА TELEGRAM БОТА 38
ЗАКЛЮЧЕНИЕ 43
СПИСОК ЛИТЕРАТУРЫ 45
ПРИЛОЖЕНИЕ 1. МОДУЛЬ ПРЕОБРАЗОВАНИЯ РЕЧИ ИЗ ЗАПИСЕЙ РАЗГОВОРОВ В ТЕКСТ 47
ПРИЛОЖЕНИЕ 2. РЕАЛИЗАЦИЯ КЛАССИФИКАТОРОВ 49
ПРИЛОЖЕНИЕ 3. КОД TELEGRAM БОТА 53

ВВЕДЕНИЕ
На сегодняшний день во многих компаниям существуют собственные горячие линии или call-центры для работы с жалобами, вопросами и обращениям вне зависимости от сферы их деятельности. При этом, все больше и больше операций по работе с вопросами звонящего автоматизируется за счет использования голосовых или чат ботов, что способствует увеличению скорости обработки обращений и снижению затрат на обучение и содержание персонала для их обработки.
В МКУ «Тюменьгортранс» уже много лет существует собственная горячая линия для работы с обращениями граждан города Тюмени по вопросам общественного транспорта, маршрутной сети и парковочного пространства. При этом зачастую горячая линия сильно загружена и звонящему приходится ждать большое количество времени в ожидании ответа освободившегося оператора. Длительное ожидание создает негативное впечатление о компании, а большое количество подряд идущих звонков создает дополнительную нагрузку на операторов горячей линии, что снижает их работоспособность.
В связи с перечисленными проблемами возникает идея использовать чат бот для перенаправления части обращений на него и последующей их автоматической обработки, то есть определение категории обращения и занесение его в систему “АСД”.
В настоящее время в области обработки естественного языка решается большое количество задач связанных с классификацией текстов и распознаванием речи. Основными подходами к решению данных задач являются: модели машинного обучения, статистические методы и нейронные сети. В результате были разработаны готовые модели, общие подходы и алгоритмы для их решения.
На текущий момент МКУ «Тюменьгортранс» обладает всеми необходимыми данными для разработки собственного чат бота, которые
позволит производить обработку обращений от граждан города Тюмени в автоматическом режиме.
Цель выпускной квалификационной работы – разработать систему для автоматической обработки и классификации по категориям поступающих обращений на горячую линию МКУ «Тюменьгортранс».
Для осуществления обозначенной цели были поставлены следующие задачи:
1. сформировать исходные тексты обращений из имеющихся записей телефонных разговоров и сделать их привязку к готовым заявкам, хранящимся в системе “АСД”;
2. разработать классификатор для соотнесения обращений к существующим категориям;
3. создать Telegram бот для получения необходимых данных от пользователя (время, место, контактные данные обратившегося, маршрут на котором что-то произошло и суть обращения) и занесения обработанной заявки в систему “АСД”;
4. проанализировать полученные результаты.

СПИСОК ЛИТЕРАТУРЫ
1. Aggarwal C. C. Data Classification. Algorithms and applications. – 2014. – С. 245- 273.
2. Батура Т. В. Методы автоматической классификации текстов //Программные продукты и системы. – 2017. – Т. 30. – №. 1. – С. 85-89.
3. Zhang X., Zhao J., LeCun Y. Character-level convolutional networks for text classification //Advances in neural information processing systems. – 2015. – Т. 28.
4. Ju R. et al. An efficient method for document categorization based on word2vec and latent semantic analysis //2015 IEEE International Conference on Computer and Information Technology; Ubiquitous Computing and Communications; Dependable, Autonomic and Secure Computing; Pervasive Intelligence and Computing. – IEEE, 2015. – С. 2276-2283.
5. Pontiki M., Galanis D., Pavlopoulos J., Papageorgiou H., Androutsopoulos I., Manandhar S. SemEval-2014 Task 4: Aspect based sentiment analysis. The 8th Intern. Workshop on Semantic Evaluation (SemEval 2014). Dublin, Ireland. 2014, C. 27–35.
6. Tarasov D. S. Deep recurrent neural networks for multiple language aspect-based sentiment analysis of user reviews //Proceedings of the 21st international conference on computational linguistics dialog. – 2015. – Т. 2. – С. 53-64.
7. Deep Learning, NLP, and Representations Posted [Электронный ресурс]
8. Лыченко Н. М., Сороковая А. В. Применение LSTM-нейронных сетей для классификации индекса качества воздуха г. Бишкек //Проблемы автоматики и управления. – 2020. – №. 1.
9. Zhao X. et al. A Deep Recurrent Neural Network for Air Quality Classification //J. Inf. Hiding Multim. Signal Process. – 2018. – Т. 9. – №. 2. – С. 346-354.
10. Официальный сайт языка Pyhon [Электронный ресурс]
11. Документация по библиотеке Pandas [Электронный ресурс]
12. Документация по библиотеке Scikit-learn [Электронный ресурс]
13. Документация по библиотеке matplotlib [Электронный ресурс]
14. Документация по фреймворку TensorFlow [Электронный ресурс]
15.Документация по библиотеке Keras [Электронный ресурс]
16. Документация по библиотеке aiogram [Электронный ресурс]
17. Hattingh C. Using Asyncio in Python: Understanding Python's Asynchronous Programming Features. – " O'Reilly Media, Inc.", 2020. – 166 c.
18. Документация по библиотеке SpeechRecognition [Электронный ресурс]
19. Документация по библиотеке Soundfile [Электронный ресурс]
20. Документация по программе FFmpeg [Электронный ресурс]
21. Документация по сервису Yandex.Cloud [Электронный ресурс]
22. Уилсон Д., Редмонд Э. Семь баз данных за семь недель. Введение в современные базы данных и идеологию NoSQL. – Litres, 2017. – 384 c.
23. Севастьянов Л. А., Щетинин Е. Ю. О методах повышения точности многоклассовой классификации на несбалансированных данных
//Информатика и её применения. – 2020. – Т. 14. – №. 1. – С. 63-70.

НЕ НАШЛИ, ЧТО ИСКАЛИ? МОЖЕМ ПОМОЧЬ.

СТАТЬ ЗАКАЗЧИКОМ