Дипломная работа на тему "ТЮМГУ | Wев-приложение протоколирования мероприятий с помощью автореферирования аудиозаписей"

0
Похожие работы
Работа на тему: Wев-приложение протоколирования мероприятий с помощью автореферирования аудиозаписей
Оценка: отлично.
Оригинальность работы на момент публикации 50+% на антиплагиат.ру.
Ниже прилагаю все данные для покупки.
https://studentu24.ru/list/suppliers/Anastasiya1---1326

Описание работы

МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное автономное образовательное учреждение высшего образования
«ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
ИНСТИТУТ МАТЕМАТИКИ И КОМПЬЮТЕРНЫХ НАУК
Кафедра информационных систем

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА
бакалаврская работа
WЕВ-ПРИЛОЖЕНИЕ ПРОТОКОЛИРОВАНИЯ МЕРОПРИЯТИЙ С ПОМОЩЬЮ АВТОРЕФЕРИРОВАНИЯ АУДИОЗАПИСЕЙ

09.03.02 Информационные системы и технологии Профиль «Интернет-технологии и разработка WЕВ-приложений»

Тюмень 2023

ОГЛАВЛЕНИЕ
СПИСОК СОКРАЩЕНИЙ И УСЛОВНЫХ ОБОЗНАЧЕНИЙ 4
ВВЕДЕНИЕ 5
ГЛАВА 1. ОПИСАНИЕ ПРЕДМЕТНОЙ ОБЛАСТИ 6
1.1. ФОРМУЛИРОВКА ПРОБЛЕМЫ 6
1.2. ЦЕЛЕВАЯ АУДИТОРИЯ 8
1.3. ВЫЯВЛЕНИЕ ФУНКЦИЙ И ВОЗМОЖНОСТЕЙ ПРИЛОЖЕНИЯ 8
1.4. КОНКУРЕНТНЫЙ АНАЛИЗ 11
ГЛАВА 2. ПРОЕКТИРОВАНИЕ ПРИЛОЖЕНИЯ 20
2.1. ДИАГРАММА ПРЕЦЕДЕНТОВ 20
2.2. МОДЕЛЬ БИЗНЕС-ПРОЦЕССОВ 21
2.3. ЛОГИЧЕСКАЯ МОДЕЛЬ БАЗЫ ДАННЫХ 22
2.4. ПРОЕКТИРОВАНИЕ ИНТЕРФЕЙСА 24
2.5. ПРОЕКТИРОВАНИЕ ОБЩЕЙ АРХИТЕКТУРЫ 38
ГЛАВА 3. ВЫБОР ИНСТРУМЕНТОВ И МЕТОДОВ РЕАЛИЗАЦИИ 40
3.1. ВЫБОР ПОДХОДА И МЕТОДОВ РЕАЛИЗАЦИИ СИСТЕМЫ РАСПОЗНАВАНИЯ РЕЧИ 40
3.2. ВЫБОР ПОДХОДА И МЕТОДА РЕАЛИЗАЦИИ СИСТЕМЫ АВТОРЕФЕРИРОВАНИЯ 42
3.3. ВЫБОР ИНСТРУМЕНТОВ ДЛЯ РЕАЛИЗАЦИИ WEB-ПРИЛОЖЕНИЯ 43
ГЛАВА 4. ЭТАП РЕАЛИЗАЦИИ 47
4.1. СБОР И ОБРАБОТКА ДАННЫХ ДЛЯ СИСТЕМЫ РАСПОЗНАВАНИЯ РЕЧИ 47
4.2. ИЗВЛЕЧЕНИЕ ПРИЗНАКОВ ДЛЯ ОБУЧЕНИЯ АКУСТИЧЕСКОЙ МОДЕЛИ 48
4.3. АНАЛИЗ И РЕАЛИЗАЦИЯ АКУСТИЧЕСКОЙ МОДЕЛИ 50
4.4. РЕАЛИЗАЦИЯ ЯЗЫКОВОЙ МОДЕЛИ 57
4.5. МЕТРИКИ КАЧЕСТВА МОДЕЛЕЙ РАСПОЗНАВАНИЯ РЕЧИ 57
4.6. АНАЛИЗ И РЕАЛИЗАЦИЯ СИСТЕМЫ АВТОРЕФЕРИРОВАНИЯ 58
4.7. РЕАЛИЗАЦИЯ МОДУЛЯ ДЛЯ РАБОТЫ С МОДЕЛЯМИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА 61
4.8. РЕАЛИЗАЦИЯ WEB-ПРИЛОЖЕНИЯ 65
ЛИЧНЫЙ ВКЛАД КАЖДОГО УЧАСТНИКА В ВЫПОЛНЕНИЕ ВКР 68
ЗАКЛЮЧЕНИЕ 71
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 73
ПРИЛОЖЕНИЕ 1. ПРЕДСТАВЛЕНИЕ МОДЕЛИ БИЗНЕС-ПРОЦЕССОВ 76
ПРИЛОЖЕНИЕ 2. СОДЕРЖИМОЕ КОНФИГУРАЦИОННОГО ФАЙЛА АКУСТИЧЕСКОЙ МОДЕЛИ 77
ПРИЛОЖЕНИЕ 3. ПРИМЕРЫ ПРОГРАММНОЙ РЕАЛИЗАЦИИ СИСТЕМ РАСПОЗНАВАНИЯ РЕЧИ И АВТОРЕФЕРИРОВАНИЯ 79
ПРИЛОЖЕНИЕ 4. ПРИМЕРЫ ПРОГРАММНОЙ РЕАЛИЗАЦИИ КОНТРОЛЛЕРОВ МОДУЛЯ ДЛЯ РАБОТЫ С МОДЕЛЯМИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА 82
ПРИЛОЖЕНИЕ 5. ПРИМЕРЫ ПРОГРАММНОЙ РЕАЛИЗАЦИИ ВЕБ- ПРИЛОЖЕНИЯ 83

СПИСОК СОКРАЩЕНИЙ И УСЛОВНЫХ ОБОЗНАЧЕНИЙ
BERT – Bidirectional Encoder Representations from Transformers CER – Character error rate
CNN – Convolutional neural network
CTC – Connectionist temporal classification DNN – Deep neural network
HMM – Hidden Markov model MLM – Masked language processing NER – Named entity recognition NLP – Natural language processing NSP – Next sentence prediction ReLU – Rectified linear unit
RNN – Recurrent neural network VAD – Voice activity detection WER – Word error rate
БД – База данных
ИИ – Искусственный интеллект
СУБД – Система управления базами данных

ВВЕДЕНИЕ
В современном мире задача протоколирования мероприятий является одной из значимых, так как протокол содержит в себе последовательную запись обсуждения вопросов и принятия решений в различных отраслях. С увеличением количества проводимых мероприятий, которые необходимо протоколировать каким-либо способом, а также с увеличением объема окружающей нас информации, становятся актуальными задачи ускорения и автоматизации данных процессов. С приходом цифровых и информационных технологий появилась возможность записывать аудиозаписи, которые в дальнейшем можно обрабатывать, извлекая из них текст и реферировать его автоматически.
Целью данной выпускной квалификационной работы является разработка WEB-приложения протоколирования мероприятий с помощью автореферирования аудиозаписей.
Данное приложение будет направлено на сокращение времени, затрачиваемого на подготовку протоколов, конспектирование лекций и протоколирование иных мероприятий.
В связи с поставленной целью сформулирован следующий перечень
задач:
? сформулировать проблему;
? изучить рынок (выделить целевую аудиторию, рассмотреть аналоги);
? выделить функционал приложения;
? спроектировать приложение с точки зрения функционала;
? спроектировать базу данных приложения;
? спроектировать интерфейс приложения;
? реализовать модели машинного обучения;
? реализовать веб-приложение в соответствии с выделенным функционалом и проектированием.
Для достижения поставленной цели необходимо решить вышеприведенный перечень задач.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Adaptation of Deep Bidirectional Multilingual Transformers for Russian Language / Yuri Kuratov, Mikhail Arkhipov // arXiv:1905.07213v1, 2019.
2. An Intuitive Explanation of Connectionist Temporal Classification: [сайт].
3. Attention Is All You Need / Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, Illia Polosukhin
// arXiv:1706.03762v5, 2017.
4. Automatic Summarization of Russian Texts: Comparison of Extractive and Abstractive Methods / V. S. Goloviznina, E. V. Kotelnikov // arXiv:2206.09253v1, 2022.
5. Axios. Getting Started: [сайт].
6. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding / Jacob Devlin, Ming-Wei Chang, Kenton Lee, Kristina Toutanova // arXiv:1810.04805v2, 2019.
7. Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks / Alex Graves, Santiago Fernandez, Faustino Gomez, Jurgen Schmidhuber // Proceedings of the 23rd international conference on Machine learning. — ACM. 2006. — С. 369—376.
8. Fine-tune BERT for Extractive Summarization / Yang Liu // arXiv:1903.10318v2, 2019.
9. Getting to Know the Mel Spectrogram: [сайт].
10. PostgreSQL: Documentation: [сайт].
11. Quartznet: Deep automatic speech recognition with 1D time-channel separable convolutions / Samuel Kriman, Stanislav Beliaev, Boris Ginsburg, Jocelyn Huang, Oleksii Kuchaiev, Vitaly Lavrukhin, Ryan Leary, Jason Li, Yang Zhang
// arXiv:1910.10261v1, 2019.
12. Sequelize v7. Documentation: [сайт].
13. SpecAugment: A Simple Data AugmenRL
14. State of the Art Audio Data Augmentation with Google Brain’s SpecAugment and Pytorch: [сайт].
15. Text Summarization with Pretrained Encoders / Yang Liu, Mirella Lapata // arXiv:1908.08345v2, 2019.
16. Transkriptor: convert audio or video to text: [сайт].
17. UML Distilled Second Edition A Brief Guide to the Standard Object Modeling Language/ Martin Fowler, Kendall Scott// ISBN: 0-201-65783-X, 1999.
18. Word Beam Search: A CTC Decoding Algorithm: [сайт].
20. Аксёнов О. Д., Логин В.М. Метод мел-частотных кепстральных коэффициентов в задаче распознавания речи: 55-я юбилейная научная конференция аспирантов, магистрантов и студентов БГУИР. 2019. С. 45— 46.
21. Бахтизин В.В., Глухова Л. А. Технологии разработки программного обеспечения: Учебное пособие. Минск: БГУИР, 2010. 267 с.
22. Введение в библиотеку Transformers и платформу Hugging Face: [сайт].
23. Репин Владимир. Моделирование бизнес-процессов в нотации BPMN: Пособие для начинающих. Часть I. [б. м.]: Издательские решения, 2019. 84 с.
24. Документация. Nodejs: [сайт].
25. Документация. Reactjs: [сайт].
26. Руководство по аутентификации в Node.js без passport.js и сторонних сервисов: [сайт].
27. Сервис перефразирования, бесплатный синонимайзер: [сайт].
28. Синонимайзер Neural Writer: [сайт]
29. Система автопротоколирования SumMeet 2.0: [сайт].

НЕ НАШЛИ, ЧТО ИСКАЛИ? МОЖЕМ ПОМОЧЬ.

СТАТЬ ЗАКАЗЧИКОМ