Онлайн тесты на тему "Прикладной статистический анализ, тест (1-6) итоговый и компетентностный тест - 6 семестр | Синергия [ID 60214]"

Эта работа представлена в следующих категориях:

Тестовое задание на тему: Прикладной статистический анализ, тест (1-6) итоговый и компетентностный тест - 6 семестр
Тест набрал 88 баллов, был выполнен на зачет. Отчёт набранных баллов предоставляю в демо работах.
В купленном тесте будут вопросы и ответы которые размещены ниже.
Так же могу выполнять данную работу индивидуально. Делайте индивидуальный заказ.

Демо работы

Описание работы

Тест 1

Статистика – это наука о …
Процесс статистического анализа включает основные этапы, в частности, …
… — это метод для оценки центральной тенденции выборки
Дисперсия — это показатель …
В реальных данных чаще всего встречается … распределение
… —совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для их постоянного хранения, передачи и обработки
Расположите этапы статистического анализа в хронологическом порядке:
Расположите меры центральной тенденции в порядке возрастания сложности вычисления:
Соотнесите термины и их определения:
Установите соответствие типов данных и их примеров:

Тест 2

… данных — это сбор информации из баз данных с целью подготовки комбинированных наборов данных для обработки данных
… — значения признака, которые делят выборку на определенное количество равных частей
… — это разница между максимальным и минимальным значениями в выборке
… размах — это разница между третьим и первым квартилями
Стандартное отклонение — это …
Критерий Стьюдента (t-тест) используется для проверки гипотез о …
Максимальная величина коэффициента корреляции Пирсона равна …
Установите последовательность действий необходимых для построения гистограммы в хронологическом порядке:
Расположите в правильной последовательности типы распределений по степени их симметричности (от симметричного к ассиметричному):

Тест 3

Для проверки гипотез о средних значениях, когда выборки независимые и нормально распределены, используют …
Установите соответствие между методами проверки гипотез и их назначением:
Уровень значимости α означает …
Расположите шаги проведения статистического исследования в хронологическом порядке:
Сопоставьте термины с их определениями:
Установите соответствие между статистиками и их функциями:
Ошибка … рода — это ситуация, когда H0 отвергается, хотя она, на самом деле, верна
… — это предположение о свойствах случайных величин или событий, которое необходимо проверить по имеющимся данным

Тест 4

Для сравнения медиан двух независимых выборок используют критерий …
Условие необходимое для применения критерия Краскела-Уоллиса — …
Критерий Колмогорова-Смирнова применяется для … данных
Для сравнения трех и более независимых выборок подходит критерий …
Расположите шаги проверки гипотезы с использованием критерия Вилкоксона для парных выборок в хронологическом порядке:
Расположите в хронологическом порядке этапы применения критерия Колмогорова-Смирнова для проверки согласия эмпирического распределения с теоретическим:
G-критерий … — это непараметрический статистический тест, который используется для проверки гипотез о медиане одномерной выборки или о разнице медиан двух связанных выборок

Тест 5

… — это статистическая мера, отражающая силу и направление связи между двумя или более переменными
Одномерный анализ применяется, когда …
Установите соответствие понятий и их определений:
Если два признака сильно коррелируют (коэффициент корреляции близок к 1 или -1), это может свидетельствовать …
Расположите этапы интерпретации результата корреляционного анализа в хронологическом порядке:
Установите правильный порядок шагов построения графика рассеяния для визуализации корреляционной связи:
Установите соответствие терминов и их определений:

Тест 6

… — это совокупность значения возможного ущерба в некоторой ситуации и его вероятности
Переменная, которая может влиять на взаимосвязь между изучаемыми переменными, однако сама по себе интереса не представляет называется …
… — это статистическое явление, которое происходит, когда значение измерения или наблюдения известно лишь частично
Статистический инструмент, который описывает вероятность смерти в различных возрастных группах населения за определенный период времени – это … смертности
Основное назначение таблицы выживаемости заключается в оценке …
Кривая Каплана-Мейера учитывает … данные, позволяя корректно оценить функцию выживаемости даже при наличии пропущенных или неполных данных
Расположите действия в порядке построения таблицы смертности:
Расположите действия статистического метода для анализа выживаемости в порядке метода Каплана-Мейера:
Установите соответствие между методами и их характеристиками:
Установите соответствие между понятиями и их определениями:

Итоговый тест

Разница между характеристиками выборки и генеральной совокупности — это … выборки
Систематическое отклонение характеристик выборки от характеристик генеральной совокупности — это … выборки
… — это наблюдения, значительно отличающиеся от основной массы данных
… — применяют для описания статистики малых выборок, в том числе при небольшом объеме выборки
… применяют для моделирования суммы квадратов нормально распределенных величин
С возрастанием числа степеней свободы, распределение Стьюдента быстро приближается к …
… распределение — это частный случай нормального распределения, когда математическое ожидание (μ) равно 0, а стандартное отклонение (σ) — 1
Установите соответствие между именем ученого с его вкладом в развитие статистической науки:
Упорядочить законы распределения по мере увеличения сложности их применения:
T-критерий Стьюдента (t-тест) можно применять при условии, когда …
… гипотеза — это предположение о свойствах генеральной совокупности, которое является логичным и правдоподобным, об отсутствии влияния или воздействия фактора
Установите соответствие понятия и его определения:
Расположите стадии проверки гипотезы с использованием p-значения в логическом порядке:
… является непараметрическим
… критерии сравнения — это методы статистической обработки данных, применение которых не требует знания закона распределения изучаемых признаков в совокупности и вычисления их основных параметров
Расположите шаги применения критерия знаковых рангов Вилкоксона для парных выборок в хронологическом порядке:
Основная цель p-значения в контексте статистического тестирования — …
Расположите шаги оценки параметров распределения в хронологическом порядке:
Расположите в правильном порядке действия при проверке гипотезы о наличии корреляции:
Линейная … — это взаимосвязь между разными показателями, которая предполагает существование линейной зависимости между ними
Максимальное возможное значение коэффициента корреляции равно …
Значение … коэффициента корреляции указывает на отсутствие линейной связи между переменными
Коэффициент корреляции применяется для …
… используется для анализа данных с цензурированными наблюдениями
Расположите в хронологическом порядке этапы подготовки данных для построения кривой выживаемости:
Основная цель составления таблицы смертности — …

Компетентностный тест

Компания «CloudSecure» предоставляет услуги облачного хранения данных. Команда аналитиков изучает статистику использования дискового пространства клиентами. Аналитики собрали следующие данные (в гигабайтах) о размере занимаемого дискового пространства для 10 случайных клиентов:
[10, 15, 12, 25, 18, 15, 16, 14, 10, 20]
Аналитики хотят проанализировать распределение данных, чтобы понять, насколько равномерно клиенты используют дисковое пространство. С этой целью они вычислили Среднее значение и Медиану.
Какие значения получили аналитики соответственно для Среднего значения и Медианы?
Команда разработчиков программного обеспечения (ПО) проводит нагрузочное тестирование нового веб-приложения. Цель тестирования — оценить производительность приложения при различных уровнях нагрузки (количестве одновременных пользователей). Важным параметром является время отклика сервера на запросы пользователей (в миллисекундах). Было проведено множество экспериментов, в результате которых были получены данные о времени отклика при различных сценариях нагрузки.
После сбора данных команда аналитиков должна выбрать подходящие законы распределения для моделирования и анализа времени отклика. Предполагается, что время отклика зависит от многих факторов, включая задержки в сети, загрузку сервера, сложность запросов и другие случайные процессы.
Аналитики рассматривают несколько вариантов распределений.
Какой закон распределения наиболее вероятно будет полезен для моделирования и анализа времени отклика сервера в данной ситуации?
Компания «CloudSpeed» предоставляет услуги облачного хостинга. Один из ключевых показателей, за которым они следят, — это время отклика серверов на запросы пользователей (в миллисекундах). Компания обнаружила, что время отклика серверов в их сети в целом стабильно, но иногда случаются небольшие отклонения.
Аналитик компании заметил, что если взять большое количество измерений времени отклика, то они группируются вокруг среднего значения, при этом отклонения от среднего примерно одинаково вероятны в обе стороны. Он также построил гистограмму времени отклика и увидел, что она имеет форму колокола.
С помощью какого закона распределения можно наиболее точно охарактеризовать время отклика серверов в сети «CloudSpeed»?
Компания «SecureNet» разрабатывает систему обнаружения вторжений (IDS). Чтобы оценить эффективность новой версии IDS, команда проводит тестирование. Они устанавливают новую версию IDS в тестовой сети и в течение недели собирают данные о количестве ложных срабатываний (когда IDS ошибочно определяет нормальную активность как подозрительную).
Старая версия IDS выдавала в среднем 5 ложных срабатываний в день. Аналитики хотят проверить, уменьшилось ли количество ложных срабатываний с новой версией IDS.
В результате тестирования новая версия IDS выдавала в среднем 4 ложных срабатывания в день. Стандартное отклонение количества ложных срабатываний новой версии составило 1,5. Количество дней тестирования — 25.
Аналитики провели односторонний (однонаправленный) t-тест и получили p-значение (p-value), равное 0,06.
Используя уровень значимости (альфа), равный 0,05, какой вывод можно сделать на основе результатов t-теста?
Компания «CodeCraft» разрабатывает новую поисковую систему. Чтобы оценить удобство использования, они провели тестирование. Пять добровольцев использовали старую версию поисковика, а затем пять других добровольцев использовали новую версию. Тестируемым нужно было выполнить несколько заданий по поиску информации. Время, затраченное на выполнение заданий (в секундах), было измерено для каждой версии поисковика.
Поскольку время выполнения заданий не всегда подчиняется нормальному распределению (может быть искажено, например, из-за внешних факторов), аналитик решил использовать непараметрический статистический тест для сравнения двух групп.
Полученные результаты тестирования:
Старая версия: 30, 45, 60, 35, 50
Новая версия: 25, 38, 55, 32, 40
Какой непараметрический критерий наиболее подойдет для сравнения двух независимых выборок (старая и новая версии) в данной ситуации?
Компания «QuickLoad» оптимизирует время загрузки веб-страниц. Они протестировали новый метод сжатия изображений на двух веб-сайтах.
Результаты (время загрузки в секундах) для каждого сайта:
Сайт 1 (старый метод): 3, 5, 7
Сайт 2 (новый метод): 2, 4, 6
Аналитик хочет определить, улучшился ли средний результат (время загрузки) при использовании нового метода, но не уверен, что данные распределены нормально.
Какой непараметрический тест эффективнее использовать для сравнения времени загрузки на двух сайтах?
Компания разрабатывает программное обеспечение (ПО) для управления проектами. Они внедрили новую систему лицензирования, которая предусматривает пробный период использования ПО. Компания хочет проанализировать, как долго пользователи используют пробную версию ПО, прежде чем принять решение о покупке лицензии.
Аналитики собирают данные о пользователях, которые зарегистрировались для пробной версии. Они фиксируют:
Время использования: количество дней, в течение которых пользователь использовал пробную версию.
Статус: покупка лицензии (1) или отказ от использования (0) (цензурированные данные). Если пользователь купил лицензию, это означает, что он «пережил» определенный период. Если пользователь отказался, это означает, что он «выбыл» из исследования.
Аналитики используют таблицы выживаемости для анализа этих данных. Они хотят оценить вероятность того, что пользователь продолжит использовать пробную версию в течение определенного времени.
Что представляет собой «функция выживаемости» (Survival Function) в контексте этого анализа?
Компания «CloudStorage» предоставляет услуги облачного хранения данных. Они внедрили новую систему хранения данных, оптимизированную для более быстрого доступа к файлам. Компания хочет оценить, насколько новая система влияет на время доступа к файлам, хранящимся в облаке.
Аналитики собирают данные о времени (в секундах), которое требуется пользователям для загрузки файлов из облака.
Они фиксируют:
1. время доступа: время, затраченное на загрузку файла (в секундах).
2. цензура: если файл был успешно загружен, это нецензурированные данные (1). Если при загрузке произошла ошибка (например, из-за временных проблем с сетью), это цензурированные данные (0), то есть мы знаем, что время загрузки превышает измеренное, но точное время неизвестно.
Аналитики используют таблицы выживаемости для анализа времени доступа. Они хотят построить график выживаемости, чтобы визуализировать вероятность того, что файл будет загружен в течение определенного времени.
В контексте анализа выживаемости, что представляют собой цензурированные данные?
Компания «GameDev» разрабатывает онлайн-игры. Они выпустили новую игру и хотят проанализировать, как долго игроки остаются активными в ней. Для этого они отслеживают время (в днях) с момента регистрации игрока до его выхода из игры (прекращения активности).
Аналитики собирают следующие данные:
1. время игры, т.е. количество дней, в течение которых игрок был активен;
2. статус, где
1 = игрок покинул игру (выбыл);
0 = игрок все еще активен (данные цензурированы).
Например, если игрок зарегистрировался месяц назад и до сих пор играет, его данные будут цензурированы.
Аналитики используют таблицы выживаемости для анализа этих данных. Они хотят построить кривую выживаемости, чтобы оценить, как быстро игроки покидают игру.
Какие параметры покажет таблица выживаемости?

Похожие работы

Другие работы автора


Базы данных
Онлайн тесты
Автор: Majya

Право и юриспруденция
Онлайн тесты
Автор: Majya

Информационные технологии
Онлайн тесты
Автор: Majya

Информатика
Онлайн тесты
Автор: Majya

НЕ НАШЛИ, ЧТО ИСКАЛИ? МОЖЕМ ПОМОЧЬ.

СТАТЬ ЗАКАЗЧИКОМ