Дипломная работа на тему "Применение анализа больших данных и алгоритмов машинного обучения в медицинской практике | Синергия [ID 34812]"

Эта работа представлена в следующих категориях:

Работа на тему: Применение анализа больших данных и алгоритмов машинного обучения в медицинской практике
Оценка: хорошо.
Оригинальность работы на момент публикации 50+% на антиплагиат.ру.
Ниже прилагаю все данные для покупки.
https://studentu24.ru/list/suppliers/Anastasiya1---1326

Демо работы

Описание работы

НЕГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ ЧАСТНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«МОСКОВСКИЙ ФИНАНСОВО-ПРОМЫШЛЕННЫЙ УНИВЕРСИТЕТ «СИНЕРГИЯ»
Факультет онлайн обучения

Направление 09.03.03 Кафедра ЭО

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА
Применение анализа больших данных и алгоритмов машинного обучения в медицинской практике

МОСКВА 2018 г.

ЗАДАНИЕ
ПО ВЫПУСКНОЙ КВАЛИФИКАЦИОННОЙ РАБОТЕ
1. Тема работы Применение анализа больших данных и алгоритмов машинного обучения в медицинской практике
2. Срок сдачи студентом законченной работы 20.08.2018
3. Исходные данные по работе
3.1. статистическая информация
3.2. специальная литература
3.3. методические указания и инструкции _
3.4. локальные акты предприятия
4. Содержание расчетно-пояснительной записки
4.1. ОБЩИЕ ВОПРОСЫ МАШИННОГО ОБУЧЕНИЯ
4.2. ОСОБЕННОСТИ МЕДИЦИНСКИХ ДАННЫХ
4.3. ПРИМЕНЕНИЕ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ВЫЯВЛЕНИЯ ПАЦИЕНТОВ ИЗ ГРУППЫ РИСКА ПО РАЗВИТИЮ ИНСУЛЬТА
5. Перечень графического материала
5.1 Импорт основных библиотек
5.2 Загрузка данных
5.3 Оценка размеров таблицы признакового описания
5.4 Вывод первых строк признакового описания
6. Дата выдачи задания 23.04.2018

СОДЕРЖАНИЕ
ВВЕДЕНИЕ 5
ГЛАВА 1. ОБЩИЕ ВОПРОСЫ МАШИННОГО ОБУЧЕНИЯ 8
1.1 История развития машинного обучения… 8
1.1.1 Золотой век искусственного интеллекта… 8
1.1.2 Кризис машинного бучения 12
1.1.3 Возрождение интереса к машинному обучению 13
1.2 Характеристика основных методов машинного обучения… 15
1.2.1 Обучение с учителем 15
1.2.1.1 Линейная регрессия… 16
1.2.1.2 Линейная классификация 20
1.2.1.3 Решающие деревья… 22
1.2.1.4 Случайный лес… 25
1.2.1.5 Градиентный бустинг 27
1.2.1.6 Нейронные сети 29
1.2.2 Обучение без учителя… 33
1.2.2.1 Метод k-средних… 33
1.2.2.2 Самоорганизующиеся карты Кохонена… 35
ГЛАВА 2. ОСОБЕННОСТИ МЕДИЦИНСКИХ ДАННЫХ 38
2.1 Определение и классификация медицинской информации 38
2.2 Особенности сбора медицинской информации 40
2.3 Особенности хранения и передачи медицинских данных… 42
ГЛАВА 3. ПРИМЕНЕНИЕ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ВЫЯВЛЕНИЯ ПАЦИЕНТОВ ИЗ ГРУППЫ РИСКА ПО РАЗВИТИЮ ИНСУЛЬТА 45
3.1 Характеристика понятия инсульт 45
3.2 Описание датасета… 48
3.3 Применяемый инструментарий 49
3.4 Загрузка данных и их подготовка… 52
3.5 Разбиение выборки 61
3.6. Метрики качества… 65
3.7 Алгоритм случайного леса… 73
ЗАКЛЮЧЕНИЕ 77
БИБЛИОГРАФИЯ 79

ВВЕДЕНИЕ
Начало XXI века в области информационных технологий характеризуется все более широким применением технологий машинного обучения, что обусловлено развитием вычислительных мощностей, взрывным ростом объемов доступной информации, развитием технологий ее хранения и передачи, а также высоким спросом на данные технологии со стороны бизнес-сообщества. Успех большинства крупных современных компаний, таких как Google, Amazon, Microsoft в значительной степени связан с развитием и применением технологий обработки информации. Широкое применение модели на основе машинного обучения получили в банковской сфере, где их внедрение позволило минимизировать риски при выдаче займов; в страховом бизнесе. Применение рекомендательных систем в электронной коммерции позволяет значительно увеличить объем продаж, в сравнении с более традиционными методиками ведения бизнеса.
Благодаря все большей доступности, и видимым успехам от внедрения, технологии машинного обучения стали проникать в столь консервативную область человеческой деятельности, как медицина. Их применение позволяет выявлять заболевания на ранней стадии, например, в таких областях как онкология, что значительно повышает шансы на успешный исход лечения. К подобным системам относятся такие проекты как Google Deep Health и IBM Watson. По оценке корпорации Google, каждый десятый пациент страдает от неверной интерпретации информации. Применение решений, основанных на машинном обучении, в качестве рекомендательных систем, цифровых ассистентов докторов позволяет минимизировать подобные ошибки [25].
В частности, IBM Watson применяется в таких областях, как онкология, кардиология, флебология. Проект Google Deep Health работает в четырех крупных клиниках США и Великобритании, занимаясь интерпретацией визуальной информации, полученной в результате выполнения инструментальных методов исследования.
Спрос на подобные разработки активно растет: по прогнозам агентства Frost & Sullivan, объем одного только рынка медицинских разработок, использующих машинное обучение и большие данные, увеличивается на 40% ежегодно и к 2021 году составит 6,6 миллиардов долларов [23]. То же агентство отмечает, что технологии машинного обучения повышают точность постановки диагнозов на 30 — 40%, при этом стоимость медобслуживания снижается на половину.
Целью данной выпускной квалификационной работы является изучение возможностей применения алгоритмов машинного обучения в медицинской практике на основе разработки математической модели, предназначенной для выявления пациентов из группы высокого риска, угрожаемых по развитию острого нарушения мозгового кровообращения.
Для достижения поставленной цели необходимо выполнить следующие задачи: изучить развитие технологий машинного обучения
изучить основные алгоритмы машинного обучения изучить особенности медицинской информации
изучить предметную область применения модели классификации изучить инструментарий, необходимый для построения математической модели
разработать и обучить модели машинного обучения, основанные на различных алгоритмах; сравнить результаты их работы
Объектом исследования в данной работе является применение алгоритмов машинного обучения в медицинской практике с целью выявления пациентов из группы высокого риска для проведения превентивного лечения.
Предметом исследования является создание математической модели, инструменты и методы ее разработки.
Практическая значимость данной работы — потенциальное выявление пациентов из группы высокого риска с целью проведения превентивного лечения, что позволит избежать инвалидизации или летального исхода из-за инсульта.
Выбранная тема является актуальной, поскольку инсульт является преобладающей причиной инвалидизации населения, а уровень заболеваемости среди населения остается высоким и составляет до 740 случаев на 100 000 населения.
Для изучения темы работы исследовались многочисленные источники информации, как отечественных, так и зарубежных авторов.
оценка построенных моделей на основе данных метрик.
В процессе выполнения квалификационной работы достигнута основная цель — разработана математическая модель на основе алгоритмов машинного обучения, имеющая практическую применимость. Модель имеет удовлетворительные характеристики точности и полноты в рамках предоставленной для обучения выборки, и позволяет выявить часть пациентов, относящихся к группе высокого риска. Ее применение в медицинской практике не требует больших финансовых затрат, поскольку основано на применении признаков, не требующих проведения дорогостоящих исследований.
Дальнейшее увеличение объема выборки на этапе применения может способствовать дальнейшему повышению качества модели.
Применение данной модели в качестве скринингового метода способно выявить часть пациентов, требующих проведения превентивного лечения, что позволит предотвратить наступление инвалидизации и летального исхода.

БИБЛИОГРАФИЯ
1. Аладышев А.В. и др. Основы медицинской информатики: учебно- методическое пособие / Издательство Алтайский государственный медицинский университет, 2008. - 140 с.
2. Бринк Х. Машинное обучение СПб.: Питер, 2017. — 336 с.
3. Вандер Плас Дж. Python для сложных задач. Наука о данных и машинное обучение. СПб.: Питер, 2018. — 576 с.
4. Воронцов К.В. Математические методы обучения по прецедентам (теория обучения машин), 2008 — 141 с.
5. Вьюгин В.В. Математические основы теории машинного обучения и прогнозирования М.: МЦНМО, 2013. — 390 с.
6. Гелиг А. Введение в математическую теорию обучаемых распознающих систем и нейронных сетей. Учебное пособие. - СПбГУ, 2014. - 224 с.
7. Гудфеллоу Я., Бенджио И., Курвилль А. Глубокое обучение. - М.: ДМК- Пресс, 2018 — 652 с.
8. Гусев Е.И. (ред.) Неврология. Национальное руководство. М:. ГЭОТАР- Медиа. - 2009. - 1035 с.
9. Доноской В.П. Алгоритмические модели обучения классификации: обоснование, сравнение, выбор. - Симферополь: ДИАЙПИ, 2014. -228 с.
10. Жерон О. Прикладное машинное обучение с помощью Scikit-Learn и TensorFlow. Концепции, инструменты и техники для создания интеллектуальных систем. М.: O'Reilly Media, 2018. — 688 с.
11. Королюк И.П.. Медицинская информатика : Учебник - 2 изд., перераб. и доп. - Самара : ООО «Офорт» : ГБОУ ВПО «СамГМУ». 2012.— 244 с.
12. Матвеев С.В. Неврология. Цикл лекций. СЗГМУ им. Мечникова. - 2013. - 176 с.
13. Мюллер А., Гидо С. Введение в машинное обучение с помощью Python М.: O'Reilly Media, 2017. — 392 с.
14. Назаренко Г.И., Г.С. Осипова. Медицинские информационные системы: теория и практика - М. : ФИЗМАТЛИТ, 2005. - 320 с.
15. Ричарт В. Построение систем машинного обучения на языке Python. - М.: ДМК-Пресс. - 2015. - 302 с.
16. Силен Д., Мейсман А., Али М. Основы Data Science и Big Data. Python и наука о данных СПб.: Питер, 2017. — 336 с.
17. Стаховская Л. В. Инсульт : руководство для врачей. - М. : Мед. информ. агентство, 2014. - 397 c.
18. Хант Э. Искусственный интеллект. - М.: Мир, 1978. — 558 с.
19. Хейдт М. Изучаем Pandas. М.: ДМК-Пресс. - 2015. - 432 с.
20. Щепин О.П. Общественное здоровье и здравоохранение: учебник /. - 2011. - 592 с.
21. Holland J.H. Adaptation in Natural and Artificial Systems. An Introductory Analysis with Applications to Biology, Control, and Artificial Intelligence. - MIT Press, 1992. — 225 p.
22. Mitchell Tom. Machine Learning. - McGraw Hill, 1997. - 432 p.
23. Большие данные и машинное обучение: новые возможности для медицины. [Электронный ресурс]. 22 октября 2017
24. Гогина О. А. Основные стандарты и модели интеграции медицинских информационных систем // Молодой ученый. — 2017. — №18. — С. 8-11. [Электронный ресурс].
25. Зайдулин Р. Будущее уже наступило: как искусственный интеллект применяется в медицине. [Электронный ресурс]. vc.ru — 2018.
26. Митькина П.А. Особенности хранения медицинской информации // Современные научные исследования и инновации. 2017. № 5 [Электронный ресурс].
27. Царегородцев А.Л. Особенности хранения и передачи частично структурированной медицинской информации в АИС. // Вестник НГУ 2010. Том 08.
28. Arthur Samuel. Some studies in machine learning using game of chekers // IBM Journal of Research and Development. - 1959. - N3. - pp 535 - 554
29. Ayse Pinar Saygin. Turing Test: 50 Years Later. Minds and Machines, 10 (4), November 2000
30. McCarthy et al., A Proposal For Dartmouth Summer Research Project On Artificial Intellegence // AI Magazine — 2006. - Volume 27
31. Michele D. Estebon., Perceptrons: An Associative Learning Network // Virginia Tech CS3604. [Электронный ресурс]. 1997 -

Похожие работы


Бухгалтерский учет анализ и аудит
Дипломная работа
Автор: Anastasiya1

Другие работы автора

НЕ НАШЛИ, ЧТО ИСКАЛИ? МОЖЕМ ПОМОЧЬ.

СТАТЬ ЗАКАЗЧИКОМ
Подождите