Дипломная работа на тему "ТЮМГУ | Разработка модуля рекомендаций для абитуриентов по выбору направления обучения"

Работа на тему: Разработка модуля рекомендаций для абитуриентов по выбору направления обучения
Оценка: хорошо.
Оригинальность работы на момент публикации 50+% на антиплагиат.ру.
Ниже прилагаю все данные для покупки.
https://studentu24.ru/list/suppliers/Anastasiya1---1326

Описание работы

МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное автономное образовательное учреждение высшего образования
«ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
ИНСТИТУТ МАТЕМАТИКИ И КОМПЬЮТЕРНЫХ НАУК
Кафедра программного обеспечения

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА
бакалаврская работа
РАЗРАБОТКА МОДУЛЯ РЕКОМЕНДАЦИЙ ДЛЯ АБИТУРИЕНТОВ ПО ВЫБОРУ НАПРАВЛЕНИЯ ОБУЧЕНИЯ

02.03.03 Математическое обеспечение и администрирование информационных систем
Профиль «Технологии программирования и анализа больших данных»

Тюмень 2023

ОГЛАВЛЕНИЕ
СПИСОК СОКРАЩЕНИЙ 4
ВВЕДЕНИЕ 5
ГЛАВА 1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 7
1.1. СУЩЕСТВУЮЩИЕ РЕШЕНИЯ ДЛЯ ВЫБОРА НАПРАВЛЕНИЯ ОБУЧЕНИЯ В ВУЗЕ 7
1.2. МЕТОДЫ ОБРАБОТКИ ЕСТЕСТВЕННОГО ЯЗЫКА 9
1.2.1. ПОДХОДЫ К ИЗВЛЕЧЕНИЮ КЛЮЧЕВЫХ СЛОВ 9
1.2.2. МОДЕЛИ И МЕТОДЫ ДЛЯ РАССЧЕТА МЕРЫ СЕМАНТИЧЕСКОЙ БЛИЗОСТИ 14
1.3 ПОДХОДЫ К РЕШЕНИЮ ЗАДАЧИ РАНЖИРОВАНИЯ 17
1.4 ФОРМАЛЬНАЯ ПОСТАНОВКА ЗАДАЧИ 19
ГЛАВА 2. ОПИСАНИЕ АЛГОРИТМОВ ПРЕДОБРАБОТКИ ДАННЫХ 20
2.1. ОПИСАНИЕ ИСХОДНЫХ ДАННЫХ 20
2.2. ФОРМИРОВАНИЕ МНОЖЕСТВА ТЕРМИНОВ НАПРАВЛЕНИЙ 22
2.3. РЕЗУЛЬТАТЫ ПРИМЕНЕНИЯ АЛГОРИТМОВ ИЗВЛЕЧЕНИЯ КЛЮЧЕВЫХ СЛОВ 25
2.4. АНАЛИЗ ДАННЫХ ОПРОСА СТУДЕНТОВ 27
ГЛАВА 3. ПРОЕКТИРОВАНИЕ И ПРОГРАММНАЯ РЕАЛИЗАЦИЯ МЕТОДА РНО 32
3.1. ПРОЕКТИРОВАНИЕ МЕТОДА РНО 32
3.2. ФОРМАЛЬНОЕ ОПИСАНИЕ МЕТОДА РНО 34
3.3. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ МЕТОДА РНО 37
3.4. РЕЗУЛЬТАТЫ ПРИМЕНЕНИЯ МЕТОДА РНО 40
ГЛАВА 4. ПРОЕКТИРОВАНИЕ И ПРОГРАММНАЯ РЕАЛИЗАЦИЯ ВЕБ- ПРИЛОЖЕНИЯ 43
4.1. ОПИСАНИЕ ИСПОЛЬЗУЕМЫХ ТЕХНОЛОГИЙ 43
4.2. СТРУКТУРА БАЗЫ ДАННЫХ 46
4.3. АРХИТЕКТУРА ПРИЛОЖЕНИЯ 53
4.4. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ ВЕБ-ПРИЛОЖЕНИЯ 54
4.5. ОПИСАНИЕ ПОЛЬЗОВАТЕЛЬСКОГО ИНТЕРФЕЙСА 61
4.6. ИНСТРУКЦИЯ ПОЛЬЗОВАТЕЛЯ 68
4.7. ИНТЕГРАЦИЯ МОДУЛЯ РЕКОМЕНДАЦИЙ В СИСТЕМУ P.U.P.A 69
ЗАКЛЮЧЕНИЕ 72
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 74
ПРИЛОЖЕНИЕ 1. ТЕПЛОВЫЕ КАРТЫ КОЭФФИЦИЕНТОВ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА, РАССЧИТАННЫХ МЕЖДУ ПАРАМИ ОТВЕТОВ СТУДЕНТОВ С РАЗЛИЧНЫХ НАПРАВЛЕНИЙ ИМИКН 82
ПРИЛОЖЕНИЕ 2. ПРОГРАММНЫЙ КОД МЕТОДА РНО 92
ПРИЛОЖЕНИЕ 3. КОМПОНЕНТ СТРАНИЦЫ RECOMMENDATIONPAGE. 94 ПРИЛОЖЕНИЕ 4. КОМПОНЕНТ СТРАНИЦЫ TECHNOLOGYPAGE 100

СПИСОК СОКРАЩЕНИЙ
ВКР – выпускная квалификационная работа ВУЗ – высшее учебное заведение
ИМиКН – Институт математики и компьютерных наук КС – ключевые слова
ООП – описание образовательной программы ОП – образовательная программа
ПС – профессиональный стандарт
РНО – ранжирование направлений обучения РПД – рабочие программы дисциплин
ТюмГУ – Тюменский государственный университет

ВВЕДЕНИЕ
В настоящее время абитуриентам нелегко определиться с выбором направления обучения в высшем учебном заведении (ВУЗ). Одним из факторов, затрудняющих принятие решения, является огромное количество трудной для выпускника информации о специальностях. На сайтах университетов и информационных агрегаторах приведены сухие факты об обучении с большим количеством незнакомых для школьников терминов, что усложняет восприятие и формирование представления о будущей профессии.
Токмакова Н. Л. и Данильченко О. М. в статье [1] полагают, что одним из главных факторов, влияющих на сознательный выбор специальности выпускниками школ, является всесторонняя осведомленность о будущей профессии, которую можно достичь только тщательным изучением понравившихся специальностей, количество которых может быть достаточно большим.
По данным Федеральной службы по надзору в сфере образования и науки на 2021 год в России было аккредитовано более 6,5 тысяч образовательных программ бакалавриата и специалитета [2]. По результатам исследования качества образовательной деятельности университетов на основе профильности трудоустройства выпускников ВУЗов Павлова О. Н., Казин Ф. А., Бутаков Н. А. пришли к выводу, что уровень профессиональной подготовки в российских ВУЗах различен [3]. Следовательно, близкие образовательные программы в разных университетах страны не являются идентичными, что еще в большей степени усложняет процесс выбора направления обучения абитуриентами.
В связи с этим была выявлена потребность в разработке сервиса автоматического формирования рекомендаций образовательных программ на основе интересов выпускников школ. Идея данного решения основана на предположении о том, что чем выше мера семантической близости между набором терминов, описывающих направление обучения, и словами- интересами абитуриента, тем больше это направление соответствует ожиданиям выпускника [4].

Такой подход относится к задачам NLP (Natural Language Processing, с англ. обработка текстов на естественном языке) и на сегодняшний день является перспективным направлением для научных исследований [5].
Целью данной работы стала разработка модуля рекомендаций для абитуриентов по выбору направления обучения на примере Института математики и компьютерных наук (ИМиКН) Тюменского государственного университета (ТюмГУ).
Для достижения указанной цели были поставлены следующие задачи:
1. Анализ предметной области.
а. Методы машинного обучения для работы с данными на естественном языке.
б. Подходы к решению задачи ранжирования.
2. Сбор, анализ и формирование входных данных.
3. Разработка алгоритма формирования рекомендаций.
4. Проектирование и программная реализация модуля рекомендаций. а. Разработка базы данных.
б. Разработка архитектуры.
в. Интеграция модуля в проект заказчика.
5. Функциональное тестирование модуля рекомендаций.
Для успешной подготовки и защиты выпускной квалификационной работы использовались средства и методы физической культуры и спорта с целью поддержания должного уровня физической подготовленности, обеспечивающей высокую умственную и физическую работоспособность. В режим рабочего дня включались различные формы организации занятий физической культурой (физкультпаузы, физкультминутки, занятия избранным видом спорта) с целью профилактики утомления, появления хронических заболеваний и нормализации деятельности различных систем организма.
В рамках подготовки к защите выпускной квалификационной работы авторами созданы и поддерживались безопасные условия жизнедеятельности, учитывающие возможность возникновения чрезвычайных ситуаций.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Токмакова Н. Л., Данильченко О. М. Актуальные проблемы профориентационной деятельности // Образование. Карьера. Общество. 2020. №2 (65).
2. Реестр организаций, осуществляющих образовательную деятельность по имеющим государственную аккредитацию образовательным программам.
– Текст : электронный // Федеральная служба по надзору в сфере образования и науки : официальный сайт. – 2021.
3. Павлова О. Н., Казин Ф. А., Бутаков Н. А. Профильность трудоустройства выпускников вузов: анализ данных социальных сетей // Университетское управление: практика и анализ. 2017. №3 (109).
4. Найханов Н. В., Дышенов Б. А. Определение семантической близости понятий на основе использования ссылок Википедии. // Программные системы и вычислительные методы. - 2016. - № 3 (250).
5. Цитульский А. М., Иванников А. В., Рогов И. С. NLP - обработка естественных языков // StudNet. 2020. №6.
6. Самые популярные сайты-агрегаторы вузов: исследование ШМП – Текст
: электронный // Дзен : [сайт]. – 2021.
правочно-информационное сетевое издание по видам обучения : [сайт].
8. Поступи онлайн : справочно-информационное сетевое издание по видам обучения : [сайт]. -
9. Поступай правильно : справочно-информационное сетевое издание по видам обучения : [сайт].
10. Vuzopedia : справочно-информационное сетевое издание по видам обучения : [сайт]. -
11. Навигатор поступления : справочно-информационное сетевое издание по видам обучения : [сайт].
12. Деева О. В., Шарапов А. А. Разработка интеллектуального чат-бота для абитуриентов сгугит // Интерэкспо Гео-Сибирь. 2020. №1.
13. Белоцкий Е. А., Суетин А. В. Построение рекомендательной системы по подбору высших учебных заведений для абитуриентов // Вестник СПбГУ. Серия 10. Прикладная математика. Информатика. Процессы управления. 2016. №1.
14. Куруппуге Д. М., Песоцкая Е. Ю. Рекомендательная система выбора образовательной траектории на базе массовых online курсов (MOOC) для ИТ и цифровых профессий 2020 г. [Электронный ресурс] U
15. Васильев Ю. Обработка естественного языка. Python и spaCy на практике.— СПб.: Питер, 2021. — 256 с.
16. Боярский К. К. Введение в компьютерную лингвистику. Учебное пособие. – СПб: НИУ ИТМО, 2013. – 72 с.
17. Мальчиц В. С., Гетман А. Н. Обработка данных для машинного обучения и применение метода опорных векторов для реализации классификатора новостей // Вестник Амурского государственного университета. Серия: Естественные и экономические науки. 2019. №87.
18. Barton T., Kokoev A. Text Mining in Scientific Literature Evaluation: Extraction of Keywords for Describing Content //Apply Data Science: Introduction, Applications and Projects. – Wiesbaden : Springer Fachmedien Wiesbaden, 2023. – С. 181-187.
19. Tran H. T. H. et al. The Recent Advances in Automatic Term Extraction: A survey //arXiv preprint arXiv:2301.06767. – 2023.
20. Ванюшкин А. С., Гращенко Л. А. Методы и алгоритмы извлечения ключевых слов // Новые информационные технологии в автоматизированных системах. 2016. №19.
21. Jalilifard A., Carida V. F., Mansano A. F., et al. Semantic sensitive TF-IDF to determine word relevance in documents //Advances in Computing and Network Communications: Proceedings of CoCoNet 2020, Volume 2. – Singapore : Springer Singapore, 2021. – С. 327-337.
22. Дементьева Я. Ю., Бручес Е. П., Батура Т. В. Извлечение терминов из текстов научных статей // Программные продукты и системы. 2022. №4.
23. Нгуен Б. Н., Тузовский А. Ф. Классификация текстов на основе оценки семантической близости терминов // Известия ТПУ. 2012. №5.
24. Evaluating the Performance of SOBEK Text Mining Keyword Extraction Algorithm //Machine Learning and Knowledge Extraction: 6th IFIP TC 5, TC 12, WG 8.4, WG 8.9, WG 12.9 International Cross-Domain Conference, CD- MAKE 2022, Vienna, Austria, August 23–26, 2022, Proceedings.
25. Campos, R., Mangaravite, V., Pasquali, A., Jatowt, A., Jorge, A., Nunes, C. and Jatowt, A. YAKE! Keyword Extraction from Single Documents using Multiple Local Features //In Information Sciences Journal. Elsevier. 2020. Vol 509. pp. 257–289.
26. Андриевская Н. К. Гибридная интеллектуальная мера оценки семантической близости // Проблемы искусственного интеллекта. 2021.
№1 (20).
27. Prasetya, Didik & Wibawa, Aji & Hirashima, Tsukasa The performance of text similarity algorithms //International Journal of Advances in Intelligent Informatics. – 2018. – T. 4. –№. 1. – С. 63-69.
28. Naymushin M. Word2Vec semantic model and human language processing. – Текст : электронный // Речевые технологии/Speech Technologies. – 2021. –
№1-2.
29. T. Mikolov [и др.] Distributed Representations of Words and Phrases and Their Compositionality // Proceedings of the 26th International Conference on Neural Information Processing Systems - Volume 2. –– Lake Tahoe, Nevada : Curran Associates Inc. – 2013. –– P. 3111––3119. –– (NIPS’13).
30. Гукасян Ц. Г. Векторные модели на основе символьных н-грамм для морфологического анализа текстов. – Текст : электронный // Труды ИСП РАН. –– 2020. – №2.
31. Bobadilla J., Ortega F., Hernando A., Guti?errez A. Recommender systems survey // Knowledge Based Systems. – 2013. Vol. 46. – P. 109–132.
32. Амелькин С. А., Понизовкин Д. М. Математическая модель задачи top-N для контентных рекомендательных систем – Текст : электронный // Известия МГТУ. – 2013. – №3 (17).
33. Гусев Д И., Апанович З. В. Влияние методов построения векторных представлений на подходы выравнивания сущностей. – Текст : электронный // Вестник НГУ. Серия: Информационные технологии. – 2022. – №2.
34. Семакин И. Г., Хеннер Е. К. Словарь терминов по информатике за 10 и 11 класс по учебнику И. Г. Семакина, Е. К. Хеннер, 2015.
35. Босова Л. Л., Босова А. Ю. Информатика 7–9 классы: Методическое пособие. – Москва.: Бином. Лаборатория знаний, 2016.
36. Романов А. М., Попова А. С., Леонов Г. Н. и др. Математика от А до Я: Справочное пособие. – Барнаул.: АлтГТУ, 2003.
37. Фурман О. Н. Терминологический словарь по физике для учащихся 7–9 классов: Методическая разработка. – Святославка.: 2010.
38. Национальный корпус русского языка. – Текст: электронный // Национальный корпус русского языка : официальный сайт. – 2023.
39. Дамп русской Википедии. – Текст: электронный // Викимедия: официальный сайт. – 2023.
40. PDFMiner: Extract text from a PDF using Python : [Сайт]. U
41. Re: Regular expression operations : [Сайт].
42. pymystem3: pymystem3 package : [Сайт].
43. nltk: Natural Language Toolkit : [Сайт].
44. Челышев Эдуард Артурович, Оцоков Шамиль Алиевич, Раскатова Марина Викторовна, Щеголев Павел Сравнение методов классификации русскоязычных новостных текстов с использованием алгоритмов машинного обучения // ВК. 2022. №1 (45).
45. Становов В.В., Семенкин Е.С., Шкраба А. Снижение размерности данных нейросетевым подходом с использованием метода визуализации t-SNE // Решетневские чтения. 2016. №20.
46. Ахметов Б. С., Иванов А. И., Перфилов К.А., Проценко Е.Д., Пащенко Д.С. Использование среднего геометрического, ожидаемой и наблюдаемой функций вероятности как статистического критерия оценки качества биометрических данных // НиКа. 2015. №.
47. Дергачева И. В., Сарьян А. С., Небаба А. Н. Оценка эффективности преподавательской деятельности путем определения выбросов при анализе данных автоматизированной системы управления качеством образовательного процесса. – Текст: электронный // ИВД. – 2019. – №4 (55).
48. VS code: User guide : [Сайт]. U
49. React.js: Tutorial: Intro to React : [Сайт].
50. JavaScript: JavaScript Reference: [Сайт].
51. Laravel: Usage Guide : [Сайт].
52. Python: The Python Tutorial : [Сайт].
53. MySQL: Tutorial : [Сайт].
54. DBeaver: User guide : [Сайт].

НЕ НАШЛИ, ЧТО ИСКАЛИ? МОЖЕМ ПОМОЧЬ.

СТАТЬ ЗАКАЗЧИКОМ