Дипломная работа на тему "ТЮМГУ | Информационное обеспечение анализа содержания дисциплин образовательных программ модели «2+2»"

Работа на тему: Информационное обеспечение анализа содержания дисциплин образовательных программ модели «2+2»
Оценка: отлично.
Оригинальность работы на момент публикации 50+% на антиплагиат.ру.
Ниже прилагаю все данные для покупки.
https://studentu24.ru/list/suppliers/Anastasiya1---1326

Описание работы

МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное автономное образовательное учреждение высшего образования
«ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
ИНСТИТУТ МАТЕМАТИКИ И КОМПЬЮТЕРНЫХ НАУК
Кафедра программного обеспечения

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА
бакалаврская работа
ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ АНАЛИЗА СОДЕРЖАНИЯ ДИСЦИПЛИН ОБРАЗОВАТЕЛЬНЫХ ПРОГРАММ МОДЕЛИ «2+2»

02.03.03 Математическое обеспечение и администрирование информационных систем
Профиль «Технологии программирования и анализа больших данных»

Тюмень 2023

ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ 4
ГЛАВА 1. ОПИСАНИЕ ПРЕДМЕТНОЙ ОБЛАСТИ 7
1.1. ОБРАЗОВАТЕЛЬНАЯ МОДЕЛЬ «2+2» 7
1.2. ОБЗОР СУЩЕСТВУЮЩИХ РЕШЕНИЙ 8
1.3. ОПИСАНИЕ ВХОДНЫХ ДАННЫХ 9
ГЛАВА 2. ОПИСАНИЕ МЕТОДОВ И СРЕДСТВ РЕАЛИЗАЦИИ 15
2.1. ОБЗОР МЕТОДОВ ВЫДЕЛЕНИЯ КЛЮЧЕВЫХ СЛОВ 15
2.1.1. МЕТОД RAKE 15
2.1.2. МЕТОД YAKE 16
2.2. ОБЗОР МЕТОДОВ ВЕКТОРИЗАЦИИ СЛОВ 16
2.2.1. МЕТОД TF-IDF 17
2.2.2. МЕТОД BAG OF WORDS 18
2.2.3. МЕТОД WORD2VEC 18
2.3. ОБЗОР МЕР СЕМАНТИЧЕСКОЙ БЛИЗОСТИ 20
2.3.1. МЕРА БЛИЗОСТИ ЖАККАРА 20
2.3.2. КОСИНУСНАЯ МЕРА БЛИЗОСТИ 21
2.4. ОБЗОР МЕТОДОВ КЛАСТЕРИЗАЦИИ 21
2.4.1. МЕТОД K-СРЕДНИХ 24
2.4.2. МЕТОД ИЕРАРХИЧЕСКОЙ КЛАСТЕРИЗАЦИИ 25
2.4.3. МЕТОД СПЕКТРАЛЬНОЙ КЛАСТЕРИЗАЦИИ 27
2.4.4. МЕТОД КЛАСТЕРИЗАЦИИ BISECTING K-MEANS 28
2.5. ОБЗОР МЕТОДОВ ПОИСКА ОПТИМАЛЬНОГО КОЛИЧЕСТВА КЛАСТЕРОВ 29
2.5.1. МЕТОД ЛОКТЯ 29
2.5.2. МЕТОД СИЛУЭТА 30
2.6. ОБЗОР МЕТОДОВ КЛАССИФИКАЦИИ 30
2.6.1. МЕТОД БЛИЖАЙШИХ ЦЕНТРОИДОВ 32
ГЛАВА 3. РАБОТА С ДАННЫМИ 33
3.1. ПРЕДОБРАБОТКА И НОРМАЛИЗАЦИЯ ДАННЫХ 33
3.2. ПОДГОТОВКА ДАННЫХ ПЕРЕД КЛАСТЕРИЗАЦИЕЙ 35
3.2.1. МЕШОК СЛОВ 35
3.2.2. TF-IDF 35
3.3. ВЫБОР МЕТОДА И РЕАЛИЗАЦИЯ СЕМАНТИЧЕСКОЙ БЛИЗОСТИ 35
3.4. ПОИСК ОПТИМАЛЬНОГО КОЛИЧЕСТВА КЛАСТЕРОВ 37
3.4.1. МЕТОД ЛОКТЯ 37
3.4.2. МЕТОД СИЛУЭТА 38
3.5. ВЫБОР МЕТОДА И РЕАЛИЗАЦИЯ КЛАСТЕРИЗАЦИИ 39
3.6. ВЫБОР МЕТОДА И РЕАЛИЗАЦИЯ КЛАССИФИКАЦИИ 43
ГЛАВА 4. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ 49
4.1. ИНСТРУМЕНТЫ ДЛЯ РАЗРАБОТКИ СЕРВИСА 49
4.2. АРХИТЕКТУРА СЕРВИСА 52
4.3. ПОЛЬЗОВАТЕЛЬСКИЙ ИНТЕРФЕЙС 52
ЗАКЛЮЧЕНИЕ 56
СПИСОК ЛИТЕРАТУРЫ 57
ПРИЛОЖЕНИЯ 1-8 59

ВВЕДЕНИЕ
С нового учебного 2022 года в Тюменском государственном университете была введена новая модель образования «2+2».
Эта модель дает возможность студенту выбрать направление профессиональной подготовки после 2 курса обучения, благодаря чему у обучающихся появляется дополнительное время для осознанного выбора своей дальнейшей карьеры.
Все обучение делится на два основных блока: Core и Major. Первый блок длится 4 семестра, где студенты проходят обучение осваивают базовые общеобразовательные дисциплины. Постепенно, к 3-4 семестру обучения, появляется выбор элективов, а также пререквизитов, которые необходимы для возможной будущей смены направления профессиональной подготовки, например, студент, изначально поступивший на специальность “Прикладная информатика”, пройдя общеобразовательную траекторию и, изучив дополнительные пререквизиты, после двух лет обучения может выбрать для себя другое направление [13]. Второй блок, Major, предполагает узконаправленную подготовку в соответствии с раннее выбранным профилем.
Рабочие программы дисциплин, в дальнейшем РПД, разрабатываются разными людьми, в связи с чем может быть допущено повторение тем или включение отдельных модулей дисциплин из блока Core в блок Major по образовательным программам, в дальнейшем ОП. Все динамично изменяется, и в связи с нехваткой времени возникают трудности с анализом и сопоставлением текущих рабочих программ с новыми и выявлением повторений некоторых тем или же модулей. По этой причине появляется идея помочь руководителям образовательных программ и заведующим кафедрой выявить пересечение модулей дисциплин двух блоков.
Целью выпускной квалификационной работы является разработка сервиса, позволяющего сравнивать рабочие программы дисциплин, включенных в Core и Major, между собой на схожесть. Для достижения поставленной цели необходимо выполнить следующие задачи:
1. Собрать входные данные.
a) Извлечь файлы с сайта, где хранятся РПД всех направлений подготовки [8], определить их тип и использовать соответствующий алгоритм чтения.
b) Выделить структурные блоки.
2. Подготовить считанные данные для анализа.
a) Выбрать значащие токены, привести их к нормальной форме.
b) Исключить стоп-слова.
c) Выделить ключевые слова.
3. Организовать хранение данных.
a) Организовать хранение списка блоков, списка дисциплин с необходимыми реквизитами, степень схожести между парами дисциплин.
4. Проанализировать степень схожести
a) Построить вектор TF-IDF-меры для слов и групп слов, подготовленных данных.
b) Найти косинусное расстояние между векторами.
5. Разделить РПД на кластеры.
a) Вычислить матрицу косинусных расстояний.
6. Реализовать разделение дисциплин блока Major на области знаний, которые должны быть сопоставимы с дисциплинами блока Core.
7. Спроектировать сервис для определения повторений рабочих программ дисциплин двух блоков.
Для успешной подготовки и защиты выпускной квалификационной работы использовались средства и методы физической культуры и спорта с целью поддержания должного уровня физической подготовленности, обеспечивающие высокую умственную и физическую работоспособность. В режим рабочего дня включались различные формы организации занятий физической культурой (физкультпаузы, физкультминутки, занятия избранным видом спорта) с целью
профилактики утомления, появления хронических заболеваний и нормализации деятельности различных систем организма.
В рамках подготовки к защите выпускной квалификационной работы авторами созданы и поддерживались безопасные условия жизнедеятельности, учитывающие возможность возникновении чрезвычайных ситуаций.

СПИСОК ЛИТЕРАТУРЫ
1. Campos, R., Mangaravite, V., Pasquali, A., Jorge, A.M., Nunes, C., Jatowt, A.: Yake! collection-independent automatic keyword extractor. In: European Conference on Information Retrieval. Springer : 2018. pp. 806–810.
2. Rose S.J., Cowley W.E., Crow V., и др. Rapid Automatic Keyword Extraction for Information Retrieval and Analysis. - 2011. - Т. 1. - No 19.
3. Scikit-learn: документация: [сайт].
4. Steinbach, M., Karypis, G., & Kumar, V. (2007). «Bisecting k-means: A fast and efficient data clustering algorithm.» In Proceedings of the SIAM International Conference on.
5. Бенгфорт Б., Билбро Р., Охеда Т. Прикладной анализ текстовых данных на Python. Машинное обучение и создание приложений обработки естественного языка. - СПб.: Питер, 2019. - 368 с.
6. Большакова Е.И., Клышинский Э.С., Ландэ Д.В., Носков А.А., Пескова О.В., Ягунова Е.В. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика. М.: МИЭМ, 2011. — 272 с.
7. Ершов К.С., Романова Т.Н. Анализ и классификация алгоритмов кластеризации / О. Н. Янина, А. А. Федосеева. - Текст : электронный // Математические науки. - 2016.
8. Информация об описании образовательной программы- Текст : электронный // Тюменский государственный университет: официальный сайт.
9. Киреев В.С., Федоренко В.И. Использование методов векторизации текстов на естественном языке для повышения качества контентных рекомендаций фильмов // Современные наукоемкие технологии. - 2018. - № 3. - С. 102-106.
10. Компонент преобразования слов в векторы: [сайт]
11. Лейсн Хобсон, Хапке Ханнес, Ховард Коул. Обработка естественного языка в действии. — СПб.: Питер, 2020. — 576 с.: ил. — (Серия
«Для профессионалов»). – текст: непосредственный.
12. Смирнов А.А., Салып Б.Ю. анализ программных моделей для определения меры смысловой близости предложений естественного языка// Научнообразовательный журнал для студентов и преподавателей «StudNet»
№5/2022: текст электронный [сайт]
13. Тюменский государственный университет: [сайт]. Тюмень.

НЕ НАШЛИ, ЧТО ИСКАЛИ? МОЖЕМ ПОМОЧЬ.

СТАТЬ ЗАКАЗЧИКОМ