Дипломная работа на тему "ТЮМГУ | Разработка подсистемы для обработки информации о клиентах с возможностью определения их кредитоспособности для ООО "Стройпроект""

Работа на тему: Разработка подсистемы для обработки информации о клиентах с возможностью определения их кредитоспособности для ООО "Стройпроект"
Оценка: хорошо.
Оригинальность работы на момент публикации 50+% на антиплагиат.ру.
Ниже прилагаю все данные для покупки.
https://studentu24.ru/list/suppliers/Anastasiya1---1326

Описание работы

МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное автономное образовательное учреждение высшего образования
«ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
ИНСТИТУТ МАТЕМАТИКИ И КОМПЬЮТЕРНЫХ НАУК
Кафедра программного обеспечения

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА
бакалаврская работа
РАЗРАБОТКА ПОДСИСТЕМЫ ДЛЯ ОБРАБОТКИ ИНФОРМАЦИИ О КЛИЕНТАХ С ВОЗМОЖНОСТЬЮ ОПРЕДЕЛЕНИЯ ИХ КРЕДИТОСПОСОБНОСТИ ДЛЯ ООО "СТРОЙПРОЕКТ"

02.03.03 Математическое обеспечение и администрирование информационных систем

Тюмень 2022 год

ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ 4
ГЛАВА 1. ИССЛЕДОВАНИЕ ПРЕДМЕТНОЙ ОБЛАСТИ 6
1.1 ОПИСАНИЕ ИСПОЛЬЗУЕМЫХ ДАННЫХ 6
1.2 РАЗВЕДОЧНЫЙ АНАЛИЗ И ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ДАННЫХ 7
1.2.1 РАЗВЕДОЧНЫЙ АНАЛИЗ ДАННЫХ 7
1.2.2 ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ДАННЫХ 11
1.2.3 АНАЛИЗ ОБРАБОТАННЫХ ДАННЫХ 13
1.3 ПРИМЕНЕНИЕ МАШИННОГО ОБУЧЕНИЯ ДЛЯ РЕШЕНИЯ ЗАДАЧИ КРЕДИТНОГО СКОРИНГА 15
1.4 ОПИСАНИЕ ИСПОЛЬЗУЕМЫХ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ 17
1.4.1. АЛГОРИТМ LOGISTIC REGRESSION 17
1.4.2 АЛГОРИТМ DECISION TREE 19
1.4.3. АЛГОРИТМ RANDOM FOREST 20
1.4.4. АЛГОРИТМ K NEAREST NEIGHBORS 21
ГЛАВА 2. РАЗРАБОТКА ПРОГРАММНОГО ПРОДУКТА 23
2.1 ТРЕБОВАНИЯ К РАЗРАБАТЫВАЕМОМУ ПРОДУКТУ И ИСПОЛЬЗУЕМЫЕ ТЕХНОЛОГИИ 23
2.2 АРХИТЕКТУРА РАЗРАБАТЫВАЕМОГО ПРИЛОЖЕНИЯ 24
2.3 ПРОЕКТИРОВАНИЕ И РАЗРАБОТКА БАЗЫ ДАННЫХ 26
2.4 РЕАЛИЗАЦИЯ И СРАВНЕНИЕ РЕЗУЛЬТАТОВ МОДЕЛЕЙ МАШИННОГО ОБУЧЕНИЯ 28
2.4.1 ОБЗОР МЕТРИК КАЧЕСТВА КЛАССИФИКАЦИИ 29
2.4.2 ПРЕДВАРИТЕЛЬНАЯ НАСТРОЙКА АЛГОРИТМОВ КЛАССИФИКАЦИИ 32
2.5 РАЗРАБОТКА ПОЛЬЗОВАТЕЛЬСКОЙ ЧАСТИ ПРИЛОЖЕНИЯ 35
2.5.1. ОБЗОР ИСПОЛЬЗУЕМЫХ ИНСТРУМЕНТОВ И БИБЛИОТЕК 35
2.5.2 ВИЗУАЛИЗАЦИЯ ДАННЫХ О КЛИЕНТЕ И БИЗНЕС ПРОЦЕССОВ КОМПАНИИ 36
ЗАКЛЮЧЕНИЕ 41
СПИСОК ЛИТЕРАТУРЫ 42
ПРИЛОЖЕНИЕ 1. ОБРАБОТКА ДАННЫХ 44
ПРИЛОЖЕНИЕ 2. НАСТРОЙКА КЛАССИФИКАТОРА RANDOM FOREST 45
ПРИЛОЖЕНИЕ 3. ОПИСАНИЕ МЕТРИК РАССТОЯНИЯ МЕЖДУ ОБЪЕКТАМИ В АЛГОРИТМЕ K NEAREST NEIGHBORS. 46
ПРИЛОЖЕНИЕ 4. ОПИСАНИЕ ДОСТУПНЫХ ДЛЯ НАСТРОЙКИ ПАРАМЕТРОВ МОДЕЛЕЙ МАШИННОГО ОБУЧЕНИЯ 47

ВВЕДЕНИЕ
В основе бизнес-решений любой компаний лежит информация. Она приравнивается к стратегическому ресурсу, от которого зависит положение компании на рынке. Компания может иметь множество источников информации
– от отзывов клиентов о производимой этой компании продукции до отчетов сотрудников компании. Для извлечения полезных сведений из различных источников данные необходимо обработать и проанализировать.
Обработка данных — это процесс, при котором необработанные данные, накопленные из различных источников, синхронизируются и приводятся в вид, наиболее удобный для понимания человеком. Информация представляется в виде отчетов, диаграмм и графиков. Такой подход помогает прогнозировать тенденции и принимать более обоснованные бизнес-решения и стратегии, прежде чем инвестировать в ресурсы, тем самым повышая производительность и эффективность. Полученные данные также могут быть сохранены для дальнейшего использования. Также необходимо обработать данные, поскольку они могут стать основой для составления планов по улучшению стратегии, обслуживания и продаж.
После обработки информации необходимо проанализировать данные [2], чтобы понять, какие решения необходимо принимать в соответствии с поставленной задачей. В зависимости от объема, поставленной задачи этап исследований может оказаться довольно затратным, так как включает в себя, по меньшей мере, временные затраты внутренних, а иногда и внешних, ресурсов и, возможно, некую дополнительную проверку правильности результатов анализов посредством дальнейших исследований.
В последнее время, в связи с широким распространением искусственного интеллекта, задачу анализа данных возлагают на компьютер. Действительно, искусственный интеллект применяется во многих сферах жизнедеятельности человека, в том числе, и в бизнесе [3]. Например, российский банк "Сбербанк" использует алгоритмы машинного обучения для принятия решения о выдаче
клиенту кредита. Сюда же можно отнести системы рекомендаций в онлайн- кинотеатрах (Netflix, Кинопоиск), и интернет-магазинах (Wildberries, Ситилинк). Целью данной работы является разработка подсистемы для обработки информации о клиентах с возможностью определения их кредитоспособности
для компании ООО "Стройпроект".
Для достижения цели требуется решить следующие задачи:
? Изучить структуру данных о клиентах компании.
? Изучить методы анализа и обработки данных в контексте поставленной задачи.
? Спроектировать базу данных для хранения данных о клиентах.
? Разработать элемент подсистемы, представляющий данные о клиентах в виде, используемым аналитическим отделом компании.
? Реализовать и сравнить различные алгоритмы машинного обучения для оценки кредитоспособности клиента.
? На основании выбранного алгоритма машинного обучения реализовать модуль для определения кредитоспособности клиентов ООО "Стройпроект"

СПИСОК ЛИТЕРАТУРЫ
1. Davis J., Goadrich M. The Relationship Between Precision-Recall and ROC Curves
// Proc. Of 23 International Conference on Machine Learning, Pittsburgh, PA, 2006. – 508p. – Direct text.
2. Бизнес-аналитика: от данных к знаниям / Паклин Н. Б., Орешков В. И. — 2-е изд. — Санкт-Петербург: Питер, 2013, - 84 c. – Текст непосредственный.
3. Data Science Наука о данных с нуля / Джоэл Грас — Санкт-Петербург: БХВ Петербург, 2017, -56 с. – Текст непосредственный.
4. Sckit-learn: Библиотека для анализа данных на python: [сайт].
5. Разведочный анализ данных [электронный ресурс]: Википедия. Свободная энциклопедия.
Текст непосредственный.
7. Быков, К. В. Особенности предобработки данных для применения машинного обучения / К. В. Быков. — Текст : непосредственный // Молодой ученый. — 2021.— № 53 (395). — С. 1-4.
Текст непосредственный.
9. Важность оценки закона распределения данных: теория и практическое руководство. Анестезиология и реаниматология. / Ядгаров М.Я., Кузовлев А.Н., Берикашвили Л.Б., Баева А.А., Лихванцев В.В. 2021. -с. 136-142. Текст непосредственный.

НЕ НАШЛИ, ЧТО ИСКАЛИ? МОЖЕМ ПОМОЧЬ.

СТАТЬ ЗАКАЗЧИКОМ