Тесты на тему "Ответы на тест | Системы обработки больших данных (Big Data) | фмен_БАК | Синергия"

Системы обработки больших данных (Big Data).фмен_БАК
1 Занятие

Демо работы

Описание работы

Алгоритм k-средних предназначен для решения задачи:

Классификации
Кластеризации
Прогнозирования
Снижения размерности


Большие данные – это:

Данные объемом более 10Тб
Данные объемом более 100Тб
Данные объемом более 150Тб
Нет ограничений на минимальный объем


Большинство методов Data mining были разработаны в рамках …

классического анализа данных
теории баз данных
теории искусственного интеллекта


Деревья решений относятся к группам …

статистических методов
кибернетических методов
логических методов
методов кросс-табуляции


Для какой шкалы применимы только такие операции как равно и не равно?

номинальная шкала
порядковая шкала
интервальная шкала


Интервальная шкала – это шкала…

содержащая категории, которые могут упорядочиваться, однако разности не имеют смысла
разности между значениями которой могут быть вычислены, однако их отношения не имеет смысла
содержащая только категории, которые не могут упорядочиваться


Какие типы данных используются в R:

logical

numeric

integer

character

attributive

complex



Какой пакет позволяет загружать данные из листа Excel файла?

readxl
excelreadr
googlesheets
vroom
sheets_read


Классификация относится к стратегии:

обучения с учителем
обучения без учителя
обучения с подкреплением


Кластер можно охарактеризовать как …

группу объектов, имеющих общие свойства
один объект, изолированный от других
группу объектов, имеющую внутреннюю однородность


Кто создал первую модель искусственных нейронных сетей?

Фрэнк Розенблатт
Уоррен Мак-Каллок и Уолтер Питтс
Ян Лекун
Дэвид И. Румельхарт, Дж. Е. Хинтон и Рональд Дж. Вильямс


Найдите соответствие между понятием и его описанием

A. Data lake

B. Data science

C. Data mining

D. Machine learning

E. Хранилище больших данных в необработанном виде.

F. Дисциплина, изучающая проблемы анализа, обработки и представления информации в цифровой форме.

G. Интеллектуальный анализ данных с целью выявления закономерностей.

H. Теория и практика разработки самообучающихся программ, большая область искусственного интеллекта.



Найдите соответствие между функцией в R и еe описанием:

A. str(оbject)

B. summаry(оbject)

C. hеad(x)

D. tаil(x)

E. Внутренняя структура объекта

F. Общая информация об объекте

G. Посмотреть начальные строки объекта

H. Посмотреть последние строки объекта



Найдите соответствие между функцией в R и еe описанием:

A. с(…)

B. sеq(from, to, by=)

C. list(…)

D. сbind(…)

E. Объединяет аргументы в вектор

F. Генерирует последовательность чисел с шагом

G. Создает список объектов

H. Объединяет объекты по столбцам



Не верно утверждение о том, что:

Большие объёмы данных приводят к слабой их структуризации, поэтому появляется такое разнообразие данных.
Увеличившаяся производительность телекоммуникационных каналов привела к росту объёмов передаваемой информации.
Удешевление систем хранения на единицу информации привело к росту рынка больших данных.
Большое разнообразие источников данных.


Не верно, что закономерности, определенные с использованием технологии Data Mining должны обладать такими свойствами:

быть очевидными
быть неочевидными
быть практически полезными
быть объективными


Не верно, что технология Web Mining применяет Data Mining для анализа:

Неоднородной информации
Неструктурированной информации
Структурированной информации
Распределенной и значительной по объему информации


Не верно, что Variety в контексте характеристик Big Data означает:

Высокая скорость генерирования данных.
Разные типы данных в колонках таблиц реляционных СУБД.
Разнообразие отраслей, являющихся источниками данных.
Разнообразие типов данных, включающих в себя структурированные, полуструктурированные и неструктурированные.


Объём накопленных человечеством цифровых данных на 2023 год измеряется:

Петабайтами
Зеттабайтами
Экзабайтами
Йоттабайтами




Регрессионный и дискриминантный анализ относятся…

к статистическим методам Data mining
к кибернетическим методам Data mining
не являются методами Data mining


Такие данные как температура воздуха относятся к …

атрибутивным данным
непрерывным данным
дискретным данным
альтернативным данным


Услуги по построению архитектуры системы базы данных, обустройству и оптимизации инфраструктуры, и обеспечению безопасности хранения данных относятся к…



Установите соответствие между функциями и их определениями:

A. mutate_at

B. transmute

C. mutate

D. изменяет определенные переменные по имени

E. добавляет новые переменные во фрейм данных и удаляет существующие переменные

F. добавляет новые переменные во фрейм данных, сохраняя существующие переменные

Установите соответствие целей инфраструктуры Hadoop и их определений:

A. Надежность

B. Отказоустойчивость

C. Масштабируемость

D. Портируемость

E. достигается посредством создания нескольких копий данных и повторного применения логики обработки в случае сбоя

F. обнаружение сбоев и их автоматическое и применение автоматического восстановления

G. данные и их обработка распределяются в кластерах

H. возможность установки на всех видах устройств и операционных систем



Data Mining — это процесс обнаружения в сырых данных…

ранее сформулированных гипотез
неочевидных закономерностей
практических закономерностей
объективных закономерностей
большого количества закономерностей


Похожие работы
Другие работы автора

НЕ НАШЛИ, ЧТО ИСКАЛИ? МОЖЕМ ПОМОЧЬ.

СТАТЬ ЗАКАЗЧИКОМ