Дипломная работа на тему "ТЮМГУ | Разработка модуля индексации для системы поиска в адресных данных"

1
Похожие работы

Информационные технологии
Дипломная работа
Автор: Anastasiya1

Менеджмент
Дипломная работа
Автор: Anastasiya1

Государственное и муниципальное управление
Дипломная работа
Автор: Anastasiya1

Право и юриспруденция
Дипломная работа
Автор: Anastasiya1
Работа на тему: Разработка модуля индексации для системы поиска в адресных данных
Оценка: хорошо.
Оригинальность работы на момент публикации 50+% на антиплагиат.ру.
Ниже прилагаю все данные для покупки.
https://studentu24.ru/list/suppliers/Anastasiya1---1326

Описание работы

МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное автономное образовательное учреждение высшего образования
«ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ» ИНСТИТУТ МАТЕМАТИКИ И КОМПЬЮТЕРНЫХ НАУК
Кафедра информационных систем


РЕКОМЕНДОВАНО К ЗАЩИТЕ В ГЭК

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА
бакалаврская работа
РАЗРАБОТКА МОДУЛЯ ИНДЕКСАЦИИ ДЛЯ СИСТЕМЫ ПОИСКА В АДРЕСНЫХ ДАННЫХ

09.03.02 Информационные системы и технологии Профиль «Информационные системы и технологии в бизнесе»

Тюмень 2022

РЕФЕРАТ
Выпускная квалификационная работа содержит 43 стр., 11 рис., 14 табл., 21 источник.
Ключевые слова: парсинг, адрес, полнотекстовый поиск, индексация, триграммы, мультиязычность.
Цель ВКР – разработать программное решение проблемы поиска в разноязычных адресных пространствах, способного осуществлять поиск по текстовому запросу пользователя.
Предложенный прототип модуля способен искать адресные сущности по неполному совпадению запроса пользователя, уточнять географические координаты объекта, устанавливает соответствие объект-адрес и др. Это расширяемо для реализации на разных языках.
Результаты апробированы в компании ООО “ТАКСТЕЛЕКОМ”.

ОГЛАВЛЕНИЕ
РЕФЕРАТ 2
Термины и определения 5
Введение 6
Глава 1. Описание предметной области 8
1.1. Модели актуальных бизнес-процессов 8
1.1.1. Обобщённая модель бизнес процесса для услуг доставки еды и заказа товара из маркетплейсов 8
1.1.2. Обобщённая модель бизнес процесса для услуг перевозок 12
1.2. Обзор систем, имеющихся на рынке 14
1.3. Концепция системы. Русскоязычный вариант 15
Глава 3. Проектирование информационного обеспечения 18
3.1. Выбор СУБД 18
3.2. Описание модели БД 18
3.3. Описание сущностей БД 20
3.4. Индексация текстовых данных с использованием триграммов 26
3.5. Индексация текстовых данных на основе лексем для сущностей типов 27
Глава 4. Проект и реализация программного обеспечения 28
4.1. Выбор технологий реализации 28
4.2. Реализация каркаса приложения 31
4.3. Реализация парсинга запроса пользователя 34
4.4. Реализация поиска улиц 35
4.5. Реализация поиска быстрых адресов 35
4.6. Реализация поиска домов 36
4.8. Реализация сортировки результатов 36
4.9. Реализация обогатителей данных 37
4.9.1. Обогатитель для мест встреч 37
4.9.2. Форматтер данных 37
4.10. REST API 38
Заключение 41
Список использованных источников 42

ТЕРМИНЫ И ОПРЕДЕЛЕНИЯ
1. Адрес — условная кодификация места нахождения объекта в пространстве;
2. Быстрый адрес — наименование конкретной организации с данными о его адресе. (Например: Лента гипермаркет);
3. Место встречи — место возле быстрого адреса или дома (Например: Шлагбаум со стороны ул. Ленина);
4. Парсинг — собор и систематизация информации из запроса пользователя;
5. Сателлит — небольшой населенный пункт в близи города;
6. СУБД — система управления базами данных — совокупность программных и лингвистических средств общего или специального назначения, обеспечивающих управление созданием и использованием баз данных.
7. Триграмма — это группа трёх последовательных символов, взятых из строки.
8. API (англ. Application Programming Interface — программный интерфейс приложения) — это набор способов и правил, по которым различные программы общаются между собой и обмениваются данными.
9. Локаль — это набор данных указывающий на формат даты и времени, отображение валют, используемый язык и другие данные.
10. REST API — это способ взаимодействия сайтов и веб-приложений с сервером.
11. Каркас приложения — базовые классы интерфейсы и реализации для работы приложения.
12. Система поиска адресов — система, отвечающая за поиск адресов по запросу пользователя.
13. Запрос — это формализованный способ выражения информационных потребностей пользователем системы.
На основе опыта, полученного в организации ООО “ТАКСТЕЛЕКОМ” в команде разработки адресного сервиса, проанализированы расширенные потребности пользователей в системах адресного поиска. Названия адресов на каждом языке строятся по-особенному. Это требует проработки разнообразных сценариев поиска, строящихся на основе данных о языке клиента. К примеру, в России внутри одного населенного пункта названия улиц уникальны и не содержат нумерации. Для стран латинской Америки (например, Колумбия) внутри населенного пункта названия улиц неуникальны, улицы уникальны только в рамках одного района и имеют нумерацию и тип (вертикальная, горизонтальная, диагональная). Исходя из такой разницы в адресной структуре для каждого языка, должен быть настраиваемый алгоритм поиска.
Для удовлетворения потребности конечного пользователя требуется решить ряд задач.
• Из-за большого количества адресных данных требуется индексация полей наименований сущностей, для ускоренного полнотекстового поиска.
• Требуются настраиваемые сценарии поиска.
• Ввод запроса пользователя с возможными ошибками (опечатками): адреса находятся по частичному совпадению.
• Парсинг запроса пользователя:
o вычленение из запроса номера дома и названия улицы;
o вычленение введенного типа адреса (улица, кинотеатр, парк, магазин).
Исходя из вышеизложенного, в работе решена первая задача и создан задел для решения остальных задач. В результате достигнута цель ВКР – разработать программное решение проблемы поиска в разноязычных адресных пространствах, способного осуществлять поиск по текстовому запросу пользователя.
Во время разработки использованы технологии и инструменты:
• ASP.NET Core 6;
• ORM – система EntityFramework Core 6;
• Swagger;
• PostgreSql 14;
• Расширение для PostgreSql pg_trgm;
• DataGrip 2021.1.1;
• VisualStudio 2022.
Для успешной подготовки и защиты выпускной квалификационной работы автором ВКР использовались средства и методы физической культуры и спорта с целью поддержания должного уровня физической подготовленности, обеспечивающую высокую умственную и физической работоспособность. В режим рабочего дня включались различные формы организации занятий физической культурой (физкультпаузы, физкультминутки, занятия избранным видом спорта) с целью профилактики утомления, появления хронических заболеваний и нормализации деятельности различных систем организма.
В рамках подготовки к защите выпускной квалификационной работы автором созданы и поддерживались безопасные условия жизнедеятельности, учитывающие возможность возникновении чрезвычайных ситуаций.

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1. PostgreSQL.
2. Документация по ASP.NET.
3. Реализация веб-сервера Kestrel в ASP.NET Core.
4. Entity Framework Core.
5. Внедрение зависимостей в ASP.NET Core.
6. Модульное тестирование: что это? Типы, инструменты.
7. Типы индексов
9. Text Search Types
10. Docker
13. Unit-тесты
14. Сайт заказа еды eda72.
15. Сайт заказа еды Палки-Скалки.
16. Сайт AliExpress.
18. Сервис заказа такси MAXIM.
19. Сайт компании грузоперевозок “Автоколонна 72”.
20. Сайт компании “Грузотакси НонСтоп”.
21. Swagger.

НЕ НАШЛИ, ЧТО ИСКАЛИ? МОЖЕМ ПОМОЧЬ.

СТАТЬ ЗАКАЗЧИКОМ