Дипломная работа на тему "ТЮМГУ | Разработка системы поиска аномалий во временных рядах температуры воздуха в помещениях"

Работа на тему: Разработка системы поиска аномалий во временных рядах температуры воздуха в помещениях
Оценка: отлично.
Оригинальность работы на момент публикации 50+% на антиплагиат.ру.
Ниже прилагаю все данные для покупки.
https://studentu24.ru/list/suppliers/Anastasiya1---1326

Описание работы

МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное автономное образовательное учреждение высшего образования
«ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
ИНСТИТУТ МАТЕМАТИКИ И КОМПЬЮТЕРНЫХ НАУК
Кафедра программного обеспечения

РЕКОМЕНДОВАНО К ЗАЩИТЕ В ГЭК

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА
бакалаврская работа
РАЗРАБОТКА СИСТЕМЫ ПОИСКА АНОМАЛИЙ ВО ВРЕМЕННЫХ РЯДАХ
ТЕМПЕРАТУРЫ ВОЗДУХА В ПОМЕЩЕНИЯХ

02.03.03 Математическое обеспечение и администрирование информационных систем
Профиль «Технологии программирования и анализа больших данных»

Тюмень 2023

ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ 4
ГЛАВА 1. ОБЗОР ПРЕДМЕТНОЙ ОБЛАСТИ 7
1.1. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ 7
1.2. ОПРЕДЕЛЕНИЕ АНОМАЛИИ 7
1.3. АЛГОРИТМ СГЛАЖИВАНИЯ 8
1.4. МОДЕЛИ ПОИСКА АНОМАЛИЙ 10
1.4.1. RNN 10
1.4.2. LSTM 11
1.4.3. SARIMA 12
1.4.4. TadGAN 13
1.4.5. XGBoost 15
1.4.6. CatBoost 16
1.4.7. Isolation Forest 16
1.4.8. Holt-winters 17
1.5. МЕТРИКИ ОЦЕНКИ МОДЕЛЕЙ 18
1.5.1. PR 19
1.5.2. ROC 19
1.5.3. F1 19
ГЛАВА 2. РАЗРАБОТКА 20
2.1. ПОСТАНОВКА ЗАДАЧИ 20
2.2. ИСХОДНЫЕ ДАННЫЕ 20
2.3. ПРЕДОБРАБОТКА ИСХОДНЫХ ДАННЫХ 21
2.3.1. ЗАПОЛНЕНИЕ ПРОПУСКОВ 21
2.3.2. ГЕНЕРАЦИЯ СИНТЕТИЧЕСКИХ АНОМАЛИЙ 21
2.4. ИНСТРУМЕНТЫ И ТЕХНОЛОГИИ 22
2.5. АРХИТЕКТУРА ПРИЛОЖЕНИЯ 22
ГЛАВА 3. СРАВНИТЕЛЬНЫЙ АНАЛИЗ 24
3.1. ПОЛЬЗОВАТЕЛЬСКИЙ ИНТЕРФЕЙС 24
3.2. ПРОВЕДЕНИЕ ЭКСПЕРИМЕНТОВ 25
3.2.1. RNN 25
3.2.2. LSTM 28
3.2.3. TadGAN 32
3.2.4. SARIMA 34
3.2.5. Holt-winters 39
3.2.6. XGBoost 40
3.2.7. CatBoost 45
3.2.8. Isolation Forest 47
3.3. СРАВНЕНИЕ РЕЗУЛЬТАТОВ 49
ЗАКЛЮЧЕНИЕ 53
СПИСОК ЛИТЕРАТУРЫ 54
ПРИЛОЖЕНИЯ 1-6 56

ВВЕДЕНИЕ
Современные технологии позволяют осуществлять управление отоплением зданий с помощью интеллектуальных систем. Данные системы имеют различные источники данных, такие как счетчики коммунального потребления, контроллеры технологических процессов и датчики микроклимата в помещениях. Благодаря внедрению технологий Интернета вещей (IoT) в эти системы можно получить множество данных о различных параметрах, влияющих на общие условия обогрева в здании. Этот обширный набор данных позволяет провести тщательную оценку системы отопления, что помогает быстро выявить любые случаи странного поведения температурных данных. Такое поведение может выражаться в виде внезапных всплесков и падений температуры или в виде общей тенденции, несовместимой с нормальными сезонными закономерностями. Это также может быть выражено как необычно длительный период температур выше среднего или ниже среднего.
Возможные причины такого поведения могут включать неисправное или поврежденное оборудование, неправильные настройки системы отопления, заблокированные вентиляционные отверстия, слабую изоляцию или отсутствие надлежащего обслуживания. Другие факторы, такие как изменения погодных условий или возраст системы, также могут способствовать необычному поведению температурных данных. Для решения подобных проблем прибегают к различным методам анализа данных, обычно это статистические модели и нейронные сети.
Нейронные сети в отличие от статистических моделей больше подходят для обнаружения нелинейных закономерностей в данных временных рядов. Они могут учиться на основе набора данных и выявлять отклонения, которые нелегко обнаружить статистическими методами. Кроме того, нейронные сети способны обнаруживать отклонения в течение более длительных периодов времени, чем традиционные статистические модели, которые могут обнаруживать только краткосрочные изменения.
Разные модели нейронных сетей подходят для разных задач, в зависимости от сложности задачи и доступных данных. Тип данных также является определяющим фактором, какая модель лучше всего подходит для решения конкретной проблемы. При выборе модели нейронной сети важно учитывать как поставленную задачу, так и доступные данные, чтобы определить, какая модель обеспечит оптимальные результаты.
Цель работы: провести сравнительный анализ моделей машинного обучения для поиска аномалий.
Задачи:
? Изучение существующих моделей машинного обучения для решения задачи поиска аномалий во временных рядах;
? Разработка и применение алгоритмов заполнения пропусков и генерации синтетических аномалий для предобработки данных;
? Разработка модулей, реализующих модели для поиска аномалий;
? Проведение обучения моделей и настройка гиперпараметров;
? Оценка результатов моделей с помощью метрик;
? Проведение сравнительного анализа результатов моделей с использованием выбранных метрик качества и критериев сравнения.
Для успешной подготовки и защиты выпускной квалификационной работы использовались средства и методы физической культуры и спорта с целью поддержания должного уровня физической подготовленности, обеспечивающую высокую умственную и физическую работоспособность. В режим рабочего дня включались различные формы организации занятий физической культурой (физкультпаузы, физкультминутки, занятия избранным видом спорта) с целью профилактики утомления, появления хронических заболеваний и нормализации деятельности различных систем организма.
В рамках подготовки к защите выпускной квалификационной работы авторами созданы и поддерживались безопасные условия жизнедеятельности, учитывающие возможность возникновении чрезвычайных ситуаций.

СПИСОК ЛИТЕРАТУРЫ
1. Chapter 8 ARIMA models // otexts.com
2. Cho, Kyunghyun; van Merrienboer, Bart; Gulcehre, Caglar; Bahdanau, Dzmitry; Bougares, Fethi; Schwenk, Holger; Bengio, Yoshua. Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation. arXiv:1406.1078, 2014.
3. Dukka Karun Kumar Reddy, H. S. Behera. CatBoosting Approach for Anomaly Detection in IoT-Based Smart Home Environment
4. Fei Tony Liu, Kai Ming Ting. Isolation forest
5. Guo, Fangzhou. "Fault Detection and Diagnosis for Residential HVAC Systems using Transient Cloud-based Thermostat Data." Texas A&M University
6. Holt-Winters’ seasonal method // otexts.com
7. Hyndman, R.J., & Athanasopoulos, G. (2018) Forecasting: principles and practice, 2nd edition, OTexts: Melbourne, Australia. [сайт] URL: OTexts.com/fpp2 (дата обращения: 20.05.2023).
8. Multiclass Receiver Operating Characteristic (ROC) // scikit-learn.org
9. Precision-Recall // scikit-learn.org
10. Recurrent neural network // en.wikipedia.org
11. Sepp Hochreiter and Jurgen Schmidhuber. Long short-term memory. Neural Comput., 9(8):1735– 1780, November 1997. ISSN 0899-7667. doi:
10.1162/neco.1997.9.8.1735.
12. sklearn.metrics.f1_score // scikit-learn.org
13. TadGAN: Time Series Anomaly Detection Using Generative Adversarial Networks
// arxiv.org
15. Yue Zhao, Maciej K. Hryniewicki. XGBOD: Improving Supervised Outlier Detection with Unsupervised Representation Learning.
16. Антипов С. Г., Фомина М. В. Проблема обнаружения аномалий в наборах временных рядов // Программные продукты и системы. 2012. №2.
17. Б.Л. Курилин*, В.Я. Киселевская-Бабинина, Н.А. Карасёв, И.В. Киселевская- Бабинина, Е.В.Кислухина, В.А. Васильев Выбор метода прогнозирования основных статистических показателей работы ГБУЗ «НИИ СП им. Н.В. Склифосовского Департамента здравоохранения города Москвы»

НЕ НАШЛИ, ЧТО ИСКАЛИ? МОЖЕМ ПОМОЧЬ.

СТАТЬ ЗАКАЗЧИКОМ