Дипломная работа на тему "ТЮМГУ | Разработка сервиса для сбора и обработки заявок/предложений студентов для определения тематики учебных IТ-проектов"

Работа на тему: Разработка сервиса для сбора и обработки заявок/предложений студентов для определения тематики учебных IТ-проектов
Оценка: отлично.
Оригинальность работы на момент публикации 50+% на антиплагиат.ру.
Ниже прилагаю все данные для покупки.
https://studentu24.ru/list/suppliers/Anastasiya1---1326

Описание работы

Федеральное государственное автономное образовательное учреждение высшего образования
«ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
ИНСТИТУТ МАТЕМАТИКИ И КОМПЬЮТЕРНЫХ НАУК
Кафедра программного обеспечения

РЕКОМЕНДОВАНО К ЗАЩИТЕ В ГЭК

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА
бакалаврская работа
РАЗРАБОТКА СЕРВИСА ДЛЯ СБОРА И ОБРАБОТКИ ЗАЯВОК/ПРЕДЛОЖЕНИЙ СТУДЕНТОВ ДЛЯ ОПРЕДЕЛЕНИЯ ТЕМАТИКИ
УЧЕБНЫХ IТ-ПРОЕКТОВ

02.03.03 Математическое обеспечение и администрирование информационных систем
Профиль «Технологии программирования и анализа больших данных»

Тюмень 2023

ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ 3
ГЛАВА 1. АНАЛИЗ НАУЧНО-ТЕХНИЧЕСКИХ ТЕКСТОВ: ЗАДАЧИ, МЕТОДЫ И ТЕХНОЛОГИИ 6
1.1 ОПИСАНИЕ ПРЕДМЕТНОЙ ОБЛАСТИ 6
1.2 ПРОБЛЕМАТИКА ПОИСКА ТЕМЫ И НАУЧНОГО РУКОВОДИТЕЛЯ . 7 1.3 ЗАДАЧА РАСПОЗНАВАНИЯ ТЕРМИНОВ 9
1.4 ЗАДАЧА СВЯЗЫВАНИЯ СУЩНОСТЕЙ 12
1.5 ЗАДАЧА ПОСТРОЕНИЯ РЕКОМЕНДАЦИЙ 17
ГЛАВА 2. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ 20
2.1 АРХИТЕКТУРА СЕРВИСА 20
2.2 СТРУКТУРА БАЗЫ ДАННЫХ 21
2.3 ФОРМАЛЬНАЯ ПОСТАНОВКА ЗАДАЧИ 24
2.4 ИСХОДНЫЕ ДАННЫЕ И ИХ ПРЕДОБРАБОТКА 25
2.5 МОДУЛЬ РАСПОЗНАВАНИЯ ТЕРМИНОВ 27
2.6 МОДУЛЬ СВЯЗЫВАНИЯ СУЩНОСТЕЙ 29
2.7 ИНТЕГРАЦИЯ ДАННЫХ С WIKIDATA 31
2.8 ПОСТРОЕНИЕ СИСТЕМЫ РЕКОМЕНДАЦИЙ 34
ГЛАВА 3. ОПИСАНИЕ РЕЗУЛЬТАТОВ 37
3.1 РЕЗУЛЬТАТЫ РАСПОЗНАВАНИЯ ТЕРМИНОВ 37
3.2 РЕЗУЛЬТАТЫ СВЯЗЫВАНИЯ СУЩНОСТЕЙ 38
3.3 ОПИСАНИЕ ПОЛУЧЕННОЙ ОНТОЛОГИИ 39
3.4 ФУНКЦИОНАЛ СЕРВИСА 42
ЗАКЛЮЧЕНИЕ 45
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 47
ПРИЛОЖЕНИЕ 1. ВИЗУАЛЬНОЕ ПРЕДСТАВЛЕНИЕ ГРАФА РАБОТЫ 50
ПРИЛОЖЕНИЕ 2. МЕТОД ИЗВЛЕЧЕНИЯ ТЕКСТА PDF-ДОКУМЕНТА 51
ПРИЛОЖЕНИЕ 3. КЛАСС РАСПОЗНАВАНИЯ ТЕРМИНОВ В ТЕКСТЕ 53
ПРИЛОЖЕНИЕ 4. ФУНКЦИЯ ПОЛУЧЕНИЯ ОТНОШЕНИЙ WIKIDATA 54

ВВЕДЕНИЕ
В настоящее время для технических специальностей вузов широко распространены учебные проекты, они имитируют будущую профессиональную деятельность и развивают у студентов как универсальные, так и узкопрофессиональные компетенции. На протяжении всего времени обучения студенты выполняют курсовые, квалификационные и научно-исследовательские работы. Определение темы и научного руководителя является важным этапом любой проектной деятельности, поскольку от этого зависит качество и проработанность самого проекта, а также эффективность роста студенческих компетенций [21].
В современном взаимодействии студентов и преподавателей существует проблема выбора темы из предложенных, так как формулировка темы не может в полной мере отразить суть работы. Также у автора темы могут быть определенные требования по используемым методам и технологиям, которые не могут быть определены явно из названия и которые обязательны к выполнению, например, для последующей интеграции результатов работы в существующие системы. Лишь имея полное представление о предстоящей работе, студент способен добиться высоких результатов в своей проектной деятельности.
В случае предложения учащимся инициативной темы возникают трудности с поиском научного руководителя, наиболее компетентного в данной предметной области. Именно такой руководитель способен помочь понять проблему, дать ей научное толкование и направить работу в нужную сторону. Наиболее явно эти проблемы проявляются у студентов IT-направлений. Многообразие информационных технологий и методологий позволяет решать одну и ту же проблему множеством различных способов, а также усложняет поиск научного руководителя, имеющего опыт в предметной области выбранного решения.
Вследствие подобной разобщенности ожидания обеих сторон зачастую не оправдываются: студент недоволен выбранной темой или непривычными для него технологиями, а научный руководитель – незаинтересованным в работе над проектом студентом. В качестве рекомендаций в работе [21] предлагается принимать во внимание интересы и компетенции студентов при выборе темы и направленности ВКР, а также отмечается важность соответствия тем научным направлениям выпускающей кафедры.
Выпускные квалификационные работы студентов и преподавателей, а также их научно-исследовательские статьи являются одними из наиболее ценных источников данных о их компетенциях и интересах. Учебные заведения ежегодно накапливают данные, которые могут быть полезны для организации проектной деятельности, но не осуществляют их анализ. Предметные области решений работ могут характеризовать интересы научных руководителей, а также могут быть описаны набором методов и технологий – дескрипторов. Таким образом, с их помощью можно будет описывать IT-проекты и сферы интересов участников данных проектов.
В настоящее время широко используются рекомендательные системы на основе пользовательских предпочтений, они используются в социальных сетях, стриминговых сервисах и интернет-магазинах. Научная среда не является исключением – одним из современных инструментов для рекомендации научных активностей является веб-сервис ResearchGate [11], позволяющий находить ученых с близкими предпочтениями и статьи, которые могут быть интересны, на основе анализа профиля пользователя.
Возможным вариантом решения может стать веб-сервис, который позволит агрегировать весь вышеописанный функционал для удобства студентов и преподавателей. Он будет предоставлять конструктор с использованием выделенных методов и технологий из ранее реализованных IT- проектов, благодаря чему каждый пользователь сможет описать тему или набор своих компетенций наиболее подробно и формализовано. В единую базу данных будет вноситься информация о пользователях, темах и связанных с ними дескрипторах. С их помощью будет производиться ранжирование. Использование иерархических баз знаний при формировании списка методов и технологий может позволить достичь наиболее точных рекомендаций.
Целью работы является разработка веб-сервиса для сбора и обработки заявок и предложений студентов для определения тематики учебных IT- проектов, позволяющего производить ранжирование научных руководителей и предлагаемых тем согласно запросу студента в виде набора методов и технологий.
Для достижения цели необходимо решить следующие задачи:
1. Изучить подходы к извлечению информации из текстов и разработке рекомендательных систем.
2. Спроектировать архитектуру сервиса.
3. Сформировать онтологию информационных технологий.
3.1. Разработать модуль предобработки исторических данных.
3.2. Разработать модуль распознавания терминов.
3.3. Разработать модуль для связывания терминов с сущностями внешней базы знаний.
3.4. Реализовать интеграцию данных из внешней базы знаний.
4. Разработать рекомендательную систему для ранжирования научных руководителей и тем работ согласно интересам студентов.
5. Разработать серверную и клиентскую часть для управления темами и использования рекомендательной системы.
Для успешной подготовки и защиты выпускной квалификационной работы использовались средства и методы физической культуры и спорта с целью поддержания должного уровня физической подготовленности, обеспечивающую высокую умственную и физическую работоспособность. В режим рабочего дня включались различные формы организации занятий физической культурой (физкультпаузы, физкультминутки, занятия избранным видом спорта) с целью профилактики утомления, появления хронических заболеваний и нормализации деятельности различных систем организма.
В рамках подготовки к защите выпускной квалификационной работы авторами созданы и поддерживались безопасные условия жизнедеятельности, учитывающие возможность возникновении чрезвычайных ситуаций.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. A Survey on Deep Learning for Named Entity Recognition. / J. Li, A. Sun,
J. Han, C. Li // arXiv. Computer Science. Computation and Language: [сайт]. 2018.
2. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. / J. Devlin, M. Chang, K. Lee, K. Toutanova // arXiv. Computer Science. Computation and Language: [сайт]. 2018.
3. Bolshakova E., Efremova N., Ivanov K. Terminological Information Extraction from Russian Scientific Texts: Methods and Applications. // Proceedings of Third Workshop "Computational linguistics and language science". 2019. P. 95–106.
4. Cucerzan S. Large-scale named entity disambiguation based on Wikipedia data. // In Proc. of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning (EMNLP- CoNLL). 2007. P. 708–716.
5. DeepPavlov: an open source conversational AI framework [сайт].
6. Entity Recognition and Relation Extraction from Scientific and Technical Texts in Russian. / E. Bruches, A. Pauls, T. Batura, V. Isachenko. // arXiv. Computer Science. Computation and Language: [сайт]. 2020.
7. Gensim: Topic modelling for humans [сайт].
8. Joint entity linking with deep reinforcement learning / Z. Fang, Y. Cao,
D. Zhang [и др.] // The world wide web conference. 2019. С. 438–447.
9. Miller E. An Introduction to the Resource Description Framework // Bul. Am. Soc. Info. Sci. Tech., 25. 1998. P. 15–19.
10. React: The library for web and native user interfaces [сайт].
11. ResearchGate: Find and share research [сайт].
12. SciNER: Extracting Named Entities from Scientific Literature. / Z. Hong,
R. Tchoua, K. Chard, I. Foster // Computational Science – ICCS 2020. ICCS 2020. Lecture Notes in Computer Science, vol 12138. Springer, Cham.
13. Transformers: State-of-the-Art Natural Language Processing / T. Wulf, L. Debut, V. Sanh [и др.] // Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing: System Demonstrations. 2020. P. 38–45.
14. Wikidata: Free and open knowledge base [сайт].
15. Zhu G., Iglesias C. Computing semantic similarity of concepts in knowledge graphs // IEEE Transactions on Knowledge and Data Engineering. 2016. Т. 29, №. 1. P. 72–85.
16. Волкова И.А., Шамаева Е.Д. Экскурс в графы знаний // International Journal of Open Information Technologies. 2023. Т. 11, №. 3. С. 75–83.
17. Городецкий В.И., Тушканова О.Н. Онтологии и персонификация профиля пользователя в рекомендующих системах третьего поколения // Онтология проектирования. 2014. №3. С. 7–31.
18. Руководство к cводу знаний по управлению проектами (Руководство PMBOK): Шестое издание. 2017. С. 75–78.
19. Мезенцева А.А., Бручес Е.П., Батура Т.В. Автоматическое связывание терминов из научных текстов с сущностями базы знаний // Вестник НГУ. Серия: Информационные технологии. 2021. Т. 19, № 2. С. 65–75.
20. Мезенцева А.А., Бручес Е.П., Батура Т.В. Методы и подходы к автоматическому связыванию сущностей на русском языке // Труды ИСП РАН. 2022. Т. 34, № 4. С. 187–200.
21. Михелькевич В.Н., Кравцов П.Г. Выбор тематики, структуры и содержания выпускной квалификационной работы в условиях неопределенности
//Ч-39 Человек в условиях неопределенности: сборник научных трудов в 2-х т./Под. 2018. С. 147.
22. Онтологии математического знания и рекомендательная система для коллекций физико-математических документов / А.М. Елизаров, А.Б. Жижченко, Н.Г. Жильцов [и др.] // Доклады РАН. 2016. Т. 467, № 4. С. 392–395.

НЕ НАШЛИ, ЧТО ИСКАЛИ? МОЖЕМ ПОМОЧЬ.

СТАТЬ ЗАКАЗЧИКОМ