Курсовая работа на тему "Машинное обучение и анализ данных - Витте [ID 63377]"
0
Эта работа представлена в следующих категориях:
Курсовая работа на тему: Машинное обучение и анализ данных
Направление подготовки:
Специальность профиль/ специализация:
Работа была сдана на 5-ку.
На момент публикации готовой работы- оригинальность составляет 50% по версии антиплагиат.ру. Так же прилагаю заявление на выбор темы.
Направление подготовки:
Специальность профиль/ специализация:
Работа была сдана на 5-ку.
На момент публикации готовой работы- оригинальность составляет 50% по версии антиплагиат.ру. Так же прилагаю заявление на выбор темы.
Демо работы
Описание работы
МОСКОВСКИЙ УНИВЕРСИТЕТ ИМ С.Ю. ВИТТЕВитте
Тема курсовой: Машинное обучение и анализ данных
СОДЕРЖАНИЕ
ВВЕДЕНИЕ 3
1. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АНСАМБЛЕВЫХ МЕТОДОВ В АНАЛИЗЕ ДАННЫХ 5
1.1. Понятие и классификация ансамблевых методов 5
1.2. Основные подходы к построению ансамблей 5
1.3. Преимущества и недостатки ансамблевых методов 5
1.4. Области применения ансамблевых методов 6
2. ПОСТАНОВКА ПРИКЛАДНОЙ ЗАДАЧИ АНАЛИЗА ДАННЫХ 9
2.1. Описание предметной области 9
2.2. Формулировка задачи анализа данных 10
2.3. Описание используемого набора данных 12
2.4. Выбор метрик оценки качества решения задачи 13
2.5. Выбор и настройка ансамблевых алгоритмов 14
2.6. Сравнительный анализ ансамблей 15
2.7. Итоговая модель и её интерпретация 15
3. ТЕСТИРОВАНИЕ МОДЕЛИ 17
3.1. Анализ и интерпретация результатов 17
3.2. Выводы 19
ЗАКЛЮЧЕНИЕ 20
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 20
ПРИЛОЖЕНИЯ 23
ВВЕДЕНИЕ
Ансамблевые методы машинного обучения становятся всё более востребованными в data-анализе, поскольку укрепляют точность и надёжность моделей, объединяя прогнозы множества базовых алгоритмов. Это критично при работе с большими данными и сложными задачами – от NLP и компьютерного зрения до анализа клиентского поведения.
Актуальность вопроса связана с тем, что ансамблевые методы демонстрируют высокую эффективность при решении сложных задач анализа данных, когда одиночные алгоритмы не обеспечивают нужную точность и стабильность.
Цель курсовой работы — изучить и применить ансамблевые методы для решения практической задачи анализа данных, предусматривающей подбор оптимальной методики, оценку её эффективности и интерпретацию полученных результатов.
Задачи работы:
1. Освоить теорию ансамблевых методов в машинном обучении.
2. Выявить предметную область, подобрать релевантный датасет и выполнить его анализ с дальнейшей очисткой.
3. Создать ансамблевые модели, провести их обучение и тестирование, а затем оценить их производительность.
4. Оптимизировать модели и оценить пригодность ансамблевых методов для выбранной предметной области.
Практическая цель — автоматизировать определение тональности (позитив, негатив, нейтрал) пользовательских отзывов о товарах и услугах с помощью ансамблевых алгоритмов машинного обучения. Это востребовано в e-commerce, маркетинге и клиентском сервисе, где важно мгновенно получать объективный индикатор клиентского опыта.
В качестве объекта исследования выступают методы машинного обучения, а в качестве предмета — использование ансамблевых подходов для улучшения точности и стабильности моделей при решении практических задач анализа данных.
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1. ГОСТ 33707– 2016 (ISO/IEC 2382:2015). Информационные технологии. Словарь. М.: Стандартинформ, 2016.
2. ГОСТ 34.321– 96. Информационные технологии. Система стандартов по информационным технологиям. Эталонная модель управления данными. М.: Стандартинформ, 1996.
3. ГОСТ ISO/IEC 29100– 2021. Информационные технологии. Методы и средства обеспечения безопасности. Основополагающие принципы обеспечения безопасности персональных данных. М.: Стандартинформ, 2021.
4. ГОСТ Р 59795– 2021. Информационные технологии. Комплекс стандартов на автоматизированные системы. Автоматизированные системы. Требования к содержанию документов. М.: Стандартинформ, 2021.
5. ГОСТ Р 59925– 2021. Информационные технологии. Большие данные. Термины и определения. М.: Стандартинформ, 2021.
6. ГОСТ Р 7.0.100– 2018. Система стандартов по информации, библиотечному и издательскому делу. Библиографическая запись. Библиографическое описание. Общие требования и правила составления. М.: Стандартинформ, 2019.
7. ГОСТ Р 7.0.23– 2019. Издания информационные. Структура и оформление. М.: Стандартинформ, 2019.
8. ГОСТ Р ИСО/МЭК 20546– 2021. Информационные технологии. Большие данные. Обзор и словарь. М.: Стандартинформ, 2021.
9. ГОСТ Р7.32– 2017. Система стандартов по информации, библиотечному и издательскому делу. Отчет о научно– исследовательской работе. Структура и правила оформления. М.: Стандартинформ, 2018.
10. Ансамбли в машинном обучении / Яндекс.Образование.
11. Ансамблевое обучение для самых маленьких / Хабр
12. Ансамблевые методы машинного обучения / Хабр.
13. Ансамблевые методы машинного обучения: Стекинг, Беггинг, Бустинг / Evergreens.
14. Ансамблевый метод машинного обучения, основанный на рекомендации классификаторов / Публикации ВШЭ.
15. Кугаевских А. В., Муромцев Д. И., Кирсанова О. В. Классические методы машинного обучения: учебное пособие. – Санкт– Петербург: Университет ИТМО, 2022. – 53 с.
16. Лукашевич Н. В. Автоматический анализ тональности текстов: проблемы и методы // Интеллектуальные системы. Теория и приложения. – 2022. – Т. 26, № 1. – С. 50–61.
Самигулин Т. Р., Джурабаев А. Э. У. Анализ тональности текста методами машинного обучения // Научный результат. Технологии бизнеса и сервиса. – 2019. – Т. 5, № 2. – С. 34–45.