Магистерская диссертация на тему "ТЮМГУ | Создание и программная реализация модели прогнозирования результатов поверки метрологического оборудования [ID 22442]"

Эта работа представлена в следующих категориях:

Информационные системы ТЮМГУ-Тюменский государственный университет Год сдачи: 2023

Работа на тему: Создание и программная реализация модели прогнозирования результатов поверки метрологического оборудования
Оценка: хорошо.
Оригинальность работы на момент публикации 50+% на антиплагиат.ру.
Ниже прилагаю все данные для покупки.
https://studentu24.ru/list/suppliers/Anastasiya1---1326

Демо работы

Описание работы

МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное автономное образовательное учреждение высшего образования
«ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
ИНСТИТУТ МАТЕМАТИКИ И КОМПЬЮТЕРНЫХ НАУК
Кафедра программного обеспечения

РЕКОМЕНДОВАНО К ЗАЩИТЕ В ГЭК

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА
магистерская диссертация
СОЗДАНИЕ И ПРОГРАММНАЯ РЕАЛИЗАЦИЯ МОДЕЛИ ПРОГНОЗИРОВАНИЯ РЕЗУЛЬТАТОВ ПОВЕРКИ МЕТРОЛОГИЧЕСКОГО ОБОРУДОВАНИЯ

02.04.03 Математическое обеспечение и администрирование информационных систем
Магистерская программа «Разработка технологий Интернета вещей и больших данных»

Тюмень 2023

ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ 3
ГЛАВА 1. РАБОТА С ДАННЫМИ 8
1.1. ОПИСАНИЕ ИСХОДНЫХ ДАННЫХ 8
1.2. РАСШИРЕНИЕ НАБОРА ДАННЫХ 9
1.3. ФОРМИРОВАНИЕ НОВЫХ ПРИЗНАКОВ 12
1.4. ОПРЕДЕЛЕНИЕ КОРРЕЛЯЦИИ ПРИЗНАКОВ 14
ГЛАВА 2. ОБОСНОВАНИЕ ВЫБОРА МЕТОДОВ ПРОГНОЗИРОВАНИЯ 17
2.1. ОПРЕДЕЛЕНИЯ ЗАКОНА РАСПРЕДЕЛЕНИЯ ДАННЫХ 17
2.2. СПОСОБ ОПРЕДЕЛЕНИЯ ВЕРОЯТНОСТИ 20
2.3. ИСПОЛЬЗУЕМЫЕ АРХИТЕКТУРЫ НЕЙРОННОЙ СЕТИ 24
2.4. ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ 26
ГЛАВА 3. СОЗДАНИЕ МОДЕЛЕЙ МАШИННОГО ОБУЧЕНИЯ 27
3.1. ПОЛНОСВЯЗНЫЕ СКРЫТЫЕ СЛОИ 29
3.1.1. МОДЕЛЬ С ПАКЕТНОЙ ОБРАБОТКОЙ 31
3.1.2. МОДЕЛЬ С ВАЛИДАЦИОННОЙ ВЫБОРКОЙ 32
3.2. МОДЕЛИ, КОТОРЫЕ ИСПОЛЬЗУЮТ LSTM-ЯЧЕЙКИ 35
3.2.1. МОДЕЛЬ С ОДНИМ LSTM-СЛОЕМ 35
3.2.2. МОДЕЛЬ СО СКРЫТЫМ BILSTM-СЛОЕМ 38
3.3. РЕЗУЛЬТАТЫ ГЛАВЫ 41
ГЛАВА 4. ИССЛЕДОВАНИЕ ВЛИЯНИЯ ОТДЕЛЬНЫХ ПРИЗНАКОВ НА РЕЗУЛЬТАТ ПРОГНОЗИРОВАНИЯ 42
4.1. ОПИСАНИЕ МЕТОДА 42
4.2. ПРИМЕНЕНИЕ МЕТОДА 43
ГЛАВА 5. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ ИНСТРУМЕНТА 45
5.1. АРХИТЕКТУРА 45
5.2. МОДУЛЬ ПОДГОТОВКИ МОДЕЛЕЙ 46
ГЛАВА 6. ОЦЕНКА ЭФФЕКТИВНОСТИ ПРИМЕНЕНИЯ ИНСТРУМЕНТА 48 ЗАКЛЮЧЕНИЕ 51
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 52
ПРИЛОЖЕНИЕ. РЕАЛИЗАЦИЯ МОДЕЛИ НА ЯЗЫКЕ ПРОГРАММИРОВАНИЯ PYTHON 55

ВВЕДЕНИЕ
В России существует процесс поверки, представляющий собой совокупность операций по подтверждению соответствия метрологических характеристик рабочих средств измерений (СИ) путем сравнения фактических значений со значениями эталона [1]. Суть поверки в следующем:
1) СИ признается годным к работе в течение определенного межповерочного интервала, если поверка подтвердила соответствие метрологическим характеристикам, указанным в паспорте СИ [2].
2) Если средство измерений признано непригодным, то оно направляется в ремонт, для восстановления необходимых метрологических характеристик, а затем снова проходит процедуру поверки, но уже более серьезной (первичной поверки). В случае, если СИ не подлежит ремонту, то заменяется новым.
Данный процесс схематично представлен на рисунке 1.
Практически все компании, которые используют различные счетчики, манометры, датчики и т.д. должны соблюдать 184 федеральный закон о техническом регулировании. Он устанавливает обеспечение защиты здоровья и
жизни населения, флоры и фауны, окружающей среды, как основную цель. Охрана осуществляется от разного рода действий, которые могут нанести ущерб или ввести в заблуждение. Главными инструментами являются стандартизация и метрология. [3]
Поэтому все средства измерения, которые используются в производственном процессе косвенно или непосредственно, обязаны иметь свидетельство о поверке. Данный процесс крайне затратный с точки зрения бизнеса, так как на время поверки необходимо останавливать процесс, в котором состоит данное средство измерение. Крупные компании, конечно, так не делают
– они заменяют тот или иной прибор на «запасной» на время проведения поверки, таким образом практически не прерывая производственный процесс. Однако в таком случае компании нужно проводить поверку (а иногда и ремонт) двух приборов на одно и то же место, что соответственно увеличивает стоимость в 2 раза.
Актуальность выбранной темы обосновывается необходимостью прогноза будущих результатов поверки (определение параметров, которые на него влияют) для составления экономического плана предприятия по обеспечению единства измерений, потому что процедура поверки/ремонта или замены СИ в промышленных масштабах имеет большую финансовую нагрузку для предприятий, которые используют СИ в производственном процессе.
Научная новизна исследования состоит в применении методов машинного обучения для получения вероятностной оценки применительно к результатам будущей поверки технологических приборов учета.
Основной целью работы было исследование эффективности математических методов, которые позволяют получить вероятностную оценку результатов поверки. Практическая значимость состояла в том, что найденный метод будет использоваться в модуле поддержки принятия решения для комплексной оценки вероятности результатов поверки СИ, которая предназначена для работников участвующих в составлении годового плана закупок (ГПЗ) предприятия.
Работа выполнялась на данных, которые были получены на предприятии ООО «Газпромнефть-Автоматизация».
Исследование данной темы позволит рациональнее распределить временные и материальные ресурсы предприятия-владельца СИ, что в свою очередь будет способствовать повышению прибыли и/или экономии бюджетных средств. Поскольку государство регулирует большинство сфер жизни, конечный продукт данного исследования будет полезен во многих областях, например, в таких, как нефтегазовая, фармацевтическая, пищевая и др.
Для достижения поставленной цели были обозначены следующие задачи:
1) Работа с бизнес требованиями:
a. Определение сути проблемы, ответ на вопросы;
i. Что мы хотим получить?
ii. Для чего нам это нужно?
b. Определение средств и инструментов;
2) Работа с данными:
a. Описание и подготовка имеющихся данных;
i. Объединить значения отдельных признаков схожих по смыслу, но различных в написании;
ii. Посчитать текущие отклонения измерений;
iii. Определить выбросы;
iv. Оценить корреляцию признаков друг с другом;
v. Сконструировать новые признаки.
b. Определение необходимости использования сложных моделей;
3) Разработка:
a. Создание моделей машинного обучения;
i. Оценить точность;
ii. Сформулировать выводы о результатах;
iii. Сравнить и выбрать модель, которая удовлетворяет поставленным требованиям.
b. Объяснение поведения выбранной модели.
Суть исследования – это построение математической модели, которая позволяет оценить вероятность результатов следующей поверки СИ. Метод математического моделирования предполагает создание наглядно-образной характеристики, например, с помощью схем и математических формул. Эффективным инструментом для такого моделирования стали методы машинного обучения. Одним из которых является регрессия.
Определить следующий результат поверки можно с помощью регрессионной модели, которая описывает зависимость параметров СИ от погрешности измерений. Цель регрессии — это подобрать такую математическую функцию, которая будет описывать связь всех переменных, характеризующих различные состояния одного объекта по формуле:
! = #(%) + (,
где y – целевая переменная, x – вектор признаков,
( – случайная величина.
Задача регрессии на практике – это прогнозирование значения целевой переменной по известному набору параметров. Пример регрессионной зависимости представлен на рисунке 2.
Сейчас машинное обучение активно применяется на практике в различных сферах, в том числе и на производстве. Но в большинстве случаев его применение ограничивается задачами классификации. Задача классификации – это присвоение меток (классов) объектам классификации на основе их сходства с известными классами объектов, но в отличии от задачи регрессии в классификации мы получаем ответ с определенной вероятностью.
Классическая модель регрессии выдает нам только предсказанное значение целевой переменной, а вот модель классификации выдает метку класса и вероятность, с которой данный объект относится к выбранному классу.
С точки зрения бизнеса, нам было необходимо создать основу инструмента, который позволил бы получить вероятность, с которой значение погрешности следующего результата измерения войдет в диапазон допустимых значений (вероятность необходима, потому что, в конечном итоге, решение будет принимать человек).
Предположительно, для подобной реализации понадобятся следующие технологии:
Для реализации моделей машинного обучения:
1) Язык программирования высокого уровня Python версии 3.10;
2) Открытая программная библиотека глубокого обучения TensorFlow. Для создания пользовательского интерфейса:
1) Объектно-ориентированный язык JavaScript;
2) React – JavaScript-библиотека для создания интерфейсов.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Федеральный закон от 26.06.2008 № 102-ФЗ «Об обеспечении единства измерений». КонсультантПлюс.
2. ПР 50.2.006-94. Правила по метрологии. Государственная система обеспечения единства измерений. Порядок проведения поверки средств измерений. издание официальное: утвержден и введен в действие Приказом Федерального агентства по техническому регулированию и метрологии от 18.07.1994 г. № 125 / разработан Всероссийским научно-исследовательским институтом метрологической службы Госстандарта России. – Москва: Стандартинформ, 2017. – 43 с. – Текст: непосредственный.
3. Федеральный закон от 27.12.2002 № 184-ФЗ «О техническом регулировании». КонсультантПлюс.
4. Kanter, J. M. Deep feature synthesis: Towards automating data science endeavors / J. M. Kanter, K. Veeramachaneni. – IEEE International Conference on Data Science and Advanced Analytics (DSAA), Paris, 2015. – 10 с.
5. Pearson correlation coefficient. Википедия. Свободная энциклопедия.
6. Casella, G. Statistical inference. Vol. 2. / G. Casella, R. L Berger. – Duxbury Pacific Grove, CA, 2002. – 686 c. – Текст: непосредственный.
7. Q-Q Plots. Хабрахабр. Экосистема для развития людей, вовлеченных в IT.
8. PDF is not a probability. Medium.
9. Bishop, C. M. Mixture Density Networks / C. M. Bishop. – Aston University, Brimingham, U.K., 1994. – 26 c. –
10. Вентцель, Е. С. Теория вероятностей / Е. С. Вентцель. – 10-е изд. – М.: Высш. Шк., 2006. – 575 с. – Текст: непосредственный.
11. Clevert, D. A. Fast and Accurate Deep Network Learning by Exponential Linear Units / D. A. Clevert, T. Unterthiner, S. Hochreiter. – ArXiv.
12. Agrawal, S. Hyperparameters in Deep Learning / S. Agrawal. – Medium.
13. Osborne, M. R. Least squares and maximum likelihood / M. R. Osborne.
14. Hochreite, S. Long short-term memory / S. Hochreite, J. Schmidhuber. – Neural Computation, 1997. – 55 c.
15. Как легко понять логистическую регрессию. Хабрахабр. Экосистема для развития людей, вовлеченных в IT.
16. Fawcett, T. An Introduction to ROC Analysis / T. Fawcett. – Institute for the Study of Learning and Expertise, USA, 2006. – 14 c.
17. Выбор слоя активации в нейронных сетях: как правильно выбрать для вашей задачи. Хабрахабр. Экосистема для развития людей, вовлеченных в
18. Murphy, K. P. Probabilistic Machine Learning: An Introduction. / K. P. Murphy – MIT Press, 2022. – 864 с. – Текст: непосредственный.
19. Claude, S. Encyclopedia of Machine Learning / S. Claude, G. I. Webb. – Springer. – 578 c. – Текст: непосредственный.
20. Schuster, M. Bidirectional recurrent neural networks / M. Schuster, K. K. Paliwal – В: IEEE Transactions on Signal Processing 45.11, 1997. – 9 c.
21. Dropout: A Simple Way to Prevent Neural Networks from Overfitting /
N. Srivastava, G. Hinton, A. Krizhevsky, I. Sutskever, R. Salakhutdinov. – Journal of Machine Learning Research, 2014. – 30 c.
22. Aas, K. Explaining individual predictions when features are dependent: more accurate approximations to shapley values / K. Aas, M. Jullum, A. Løland. – ArXiv.
23. Чашкин, Ю.Р. Математическая статистика. Анализ и обработка данных: Учебное пособие / Ю.Р. Чашкин. – Д: Феникс, 2017. – 236 c. – Текст непосредственный.
24. Deisenroth, M. P. Mathematics for machine learning / M. P. Deisenroth,
A. A. Faisal, S. C. Ong. – Cambridge University Press, 2020. – 395 с. – Текст: непосредственный.
25. Библиотека для построения нейросетевых моделей TensorFlow: An open-source machine learning framework for everyone.
26. Python documentation