Лекция
Привет, сегодня поговорим про задачи модульного контроля, обещаю рассказать все что знаю. Для того чтобы лучше понимать что такое задачи модульного контроля , настоятельно рекомендую прочитать все из категории Интеллектуальный анализ данных.
1 Закономерности, найденные в процессе использования технологии Data
должны иметь следующие свойства:
а) быть очевидными;
б) быть неочевидными;
в) быть практически полезными;
г) быть объективными;
д) чем больше найдено закономерностей, тем краще.25
2 Выберите характеристику, наиболее подходящую для Data Mining
а) подходит для понимания ретроспективных данных;
б) опирается на ретроспективные данные для получения ответов на
вопрос о будущем;
в) подходит для обобщения ретроспективных данных.
3 Данные представляют собой:
а) факты и графики;
б) текст;
в) картинки, звуки, аналоговые или цифровые видео-сегменты;
г) все вместе.
4 Для какой шкалы применимы только такие операции как "равно" "не
равно "," больше "," меньше ":
а) номинальная шкала;
б) порядковая шкала;
в) интервальная шкала?
5 На какие две группы подразделяются методы Data Mining за принципов
ум работы с исходными учебными данными:
а) непосредственное использование данных или сохранения данных;
б) выявление и использование формализованных закономерностей;
в) статистические методы;
г) кибернетические методы?
6 Какая из перечисленных ниже стадий может считаться дополнительной
или частью одной из основных стадий Data mining:
а) выявление закономерностей (свободный поиск);
б) использование выявленных закономерностей для прогнозирования не-
известных значений (прогнозтичне моделирование);
в) валидация.
7 Нечеткая логика и дерева решений:
а) относятся к статистическим методам Data mining;
б) относятся к кибернетических методов Data mining;
в) не является методами Data mining.
8 Правильно такая формулировка: "Ассоциация является частью слу-
ковой последовательности с временным лагом, равным нулю ":
а) формулировка правильное;
б) последовательность является частью случайной ассоциации;
в) ни последовательность, ни ассоциация не являются отдельными случаями один од
ного? 26
9 В основе так называемой информационной пирамиды находится категория:
а) данные;
б) знание;
в) информация.
10 Задачи Data Mining, в зависимости от используемых моделей под-
разделяются на:
а) обучение с учителем;
б) обучение без учителя;
в) дескриптивные;
г) прогнозирующие.
11 Выделите два основных направления Web Mining:
а) Web Content Mining;
б) Web Usage Mining;
в) Web Text Mining.
12 Какое из перечисленных ниже направлений имеет целью выявление
закономерностей в действиях пользователя web-узла или их группы:
а) Web Content Mining;
б) Web Usage Mining;
в) Web Text Mining?
13 Конечный узел дерева решений называют также:
а) узлом проверки;
б) узлом решения;
в) письмом.
14. байесовскими сетей имеет следующие преимущества:
а) позволяет избежать проблемы переучивания;
б) определяет зависимости между всеми переменными;
в) на результат классификации влияют только индивидуальные зна
ния входных переменных.
15 С помощью метода опорных векторов решаются задачи:
а) бинарной классификации;
б) не только бинарной классификации;
в) прогнозирование.
16 Традиционные методы визуализации могут находить следующее за-
менения:
а) представлять пользователю информацию в наглядном виде;
б) компактно описывать закономерности, присущие исходному на-
бора данных, 27
в) снижать размерность или сжимать информацию;
г) упрощать расчеты в модели;
д) восстановление пробелов в наборе данных.
17 Нахождение шумов и выбросов в данных:
а) возможно с помощью средств визуализации;
б) невозможно с помощью средств визуализации;
в) не является функцией визуализации.
18 Назовите характеристики одной из основных тенденций в области ви-
зуализации:
а) увеличение размеров структур данных, представляющих с помо
щью визуализации;
б) осложнения структур данных, представляющих с помощью ви-
зуализации;
в) уменьшение размеров структур данных, представляющих с помо
щью визуализации. Об этом говорит сайт https://intellect.icu .
19 Качественная программа очистки данных должна:
а) исправлять неправильные данные;
б) создавать небольшой по объему отчет о подозрительных записи;
в) требовать минимальных затрат на установку, обслуживание и
ручные проверки;
г) исправлять абсолютно все подозрительные данные.
20. Качественная программа очистки данных должна иметь такие характерис-
тики:
а) исправлять неправильные данные;
б) создавать небольшой по объему отчет о подозрительных записи;
в) требовать минимальных затрат на установку, обслуживание и
ручные проверки;
г) может частично затрагивать правильные данные.
21 Такая функция инструментов очистки данных как улучшение означает:
а) добавления к данным дополнительных фактов о записях, которые в них не
предоставлялись;
б) удаление дубликатов данных;
в) удаление шумов и выбросов в системе данных.
22 На каком этапе пересекается работа специалиста предметной об-
ласти и специалиста по добыче данных:
а) анализ бизнес-процессов;
б) анализ данных;
в) подготовка данных;
г) все ответы неверны? 28
23 Анализ предметной области и интерпретация результатов, полученных
них в результате Data Mining - это точки соприкосновения таких специалистов как:
а) специалиста предметной области;
б) специалиста по добыче данных;
в) администратора баз данных;
г) всех вместе.
24. Анализ требований к данным и сбор данных - это точки соприкосновения таких фахи-
вцив как:
а) специалиста предметной области;
б) специалиста по добыче данных;
в) администратора баз данных;
г) всех вместе.
25 Существуют следующие варианты решений по внедрению инструментов
Data Mining:
а) разработка Data Mining-продукта на заказ сторонней ком-
барыней;
б) разработка Data Mining-продукта самостоятельно;
в) комбинация этих вариантов, в т.ч. использование различных библиотек,
компонентов и инструментальных наборов для разработчиков создание
встроенных приложений Data Mining.
26 Инструменты Data Mining могут решать:
а) только одну задачу Data Mining;
б) несколько задач Data Mining;
в) все задачи Data Mining;
г) это зависит от конкретного инструмента.
27 Решение каких задач предусматривает алгоритмы анализа данных в
PolyAnalyst:
а) моделирование;
б) прогнозирование;
в) кластеризация;
г) классификация;
д) текстовый анализ;
е) все ответы правильные.
28 Deductor Studio:
а) может функционировать без хранилища данных;
б) может получать информацию из любых других источников;
в) не может функционировать без хранилища данных.
29 Опишите возможности пакета Deductor по заполнению пропусков:
а) нет возможности заполнения пропусков; 29
б) есть возможность заполнения пропусков методом аппроксимации;
в) есть возможность заполнения пропусков с помощью алгоритма,
подставляет наиболее вероятное значение вместо пропущенных данных.
30 Какие из представленных алгоритмов реализованы в пакете Deductor:
а) нейронные сети;
б) автокорреляция;
в) дерева решений;
г) карты самоорганизующихся;
д) ассоциативные правила;
е) все ответы правильные?
1 Для какой шкалы применяют только такие операции как: равно, не
равно, больше, меньше?
2 На какие две группы подразделяются методы Data Mining за принципов
ум работы с исходными учебными данными?
3 Какая из стадий может считаться дополнительной или неотъемлемой час-
тиной одной из основных стадий Data mining?
4 Правильно такая формулировка: "Ассоциация является частью слу-
ковой последовательности с временным лагом, равным нулю "?
5 Что находится в основе так называемой информационной пирамиды?
6 На какие категории подразделяются задачи Data Mining, в зависимости от
моделей, используемых? 16
7 Для решения каких задач применяются иерархические алгоритмы?
8 В чем сходство задач классификации и прогнозирования?
9 Какой из направлений включает выявление закономерностей в действиях поль-
стувача web-узла или их группы?
10 Какие факторы влияют на результат классификации в наивно
байесовскими подходе?
11 Какие преимущества характерны для использования байесовскими ме
реж?
12 Какие задачи решаются с помощью метода опорных векторов?
13 Что представляет собой группа синапсов нейрона?
14 Определите главную функцию искусственного нейрона.
15 В чем заключается обучение сетей самоорганизующихся?
16 Определите дополнение к традиционным методам визуализации?
17 Назовите характеристики одной из основных тенденций в области
визуализации.
18 Что означает интегрированность хранилища данных?
19 Назовите основные концепции хранилища данных.
20 Если набор данных упорядочен и в нем присутствует сезонная
или циклическая компонента, то какое минимальное количество данных необходимо
иметь для возможности анализа?
21 Что должна делать качественная программа очистки данных?
22 Какие характеристики должна иметь качественная программа очистки
данных?
23 На каком этапе пересекается работа специалиста предметной об-
ласти и специалиста по добыче данных?
24. Назовите характеристики, свойственные SAS Enterprise Miner.
25 Решение каких задач предусматривают алгоритмы анализа данных в
PolyAnalyst?
26 Опишите возможности пакета Deductor по заполнению пробелов.
27 Какие алгоритмы реализованы в пакете Deductor?
28 Существует необходимость временного или постоянного копирования
данных для анализа в системе KXEN?
29 Какой компонент KXEN позволяет выявить естественные группы (клас
тер) в наборе данных?
30 Назовите слабые стороны использования готового программного за-
печение Data Mining.
12 Рекомендуемая литература
12.1. Основная
1 Барсегян А. А. Методы и модели анализа данных: OLAP и Data
Mining / А. А. Барсегян, М. С. Куприянов, В. В. Степаненко и др. - Второй
изд., перераб. и доп. - СПб. : БХВ-Петербург, 2004 - 336 с.
2 Дюк В. "Data Mining": учебный курс / В. Дюк, А. Самойленко. -
СПб. : Питер, 2001 - 368 с.
3 Задания и методические рекомендации к выполнению лаборато-
рных работ по теме "Нейронные сети" курса "Прогнозирование социаль-
но-экономических процессов "для студентов специальности 8.050102
"Экономическая кибернетика" дневной форм обучения / сост. Н. А. дуб
Ровинь, А. В. Милов, С. В. Прокопович. - Х.: Изд. ХНЭУ, 2005 - 60 с.
4 Корнеев В. В. Базы данных. Интеллектуальная обработка инфо-
рмациы / В. В. Корнеев, А. Ф. Гареев, С. В. Васютин и др. - М.: Издатель
Могачева С. В.; Издательство Нолидж, 2001 - 496 с.
5 Рассел С. Искусственный интеллект: современный подход / Рас-
пос С., Норвинг П. - М.: Издательский дом "Вильямс", 2006 - 1408 с.
12.2. Дополнительная
6 Вагин В.Н. дедукции и обобщение в системах принятия решений
/ Вагин, В. Н. - М.: Наука, 1988 - 383 с.
7 Дюк В. "Обработка данных на ПК в примерах" / Дюк В. - СПб. :
Питер, 1997. - 240 с.
8 Загоруйко Н. Г. Прикладные методы анализа данных и знаний
/ Н. Г. Загоруйко. - Новосибирск: Изд. Ин-та математики СО РАН, 1999 -
270 с.
9 Каллан Р. Основные концепции нейронных сетей / Р. Каллан.
Пер. с англ. - М.: Издательский дом "Вильямс", 2001 - 292 с.
10 Круглов В. В. Искусственные нейронные сети: Теория и практика
/ В. В. Круглов, В. В. Борисов. - М.: Горячая линия - Телеком, 2001 - 383 с.
11 Лбов Г. С. Анализ данных и знаний: учебн. пособ. / Г. С. Лбов. -
Новосибирск: Изд. НГТУ, 2001 - 90 с.
12 Романов А.Н. Советующие информационные системы в эконо-
Мике: учебн. пособ. для вузов / А. Н. Романов, Б. Е. Одинцов. - М.:
ЮНИТИ-ДАНА, 2000 - 488 с.
13 Тюрин Ю. H. Статистический анализ данных на компьютере
/ Ю. Н. Тюрин, А. А. Макаров; под ред. В. Э. Фигурнов. - М.: ИНФРА-М,
1998 - 528 с.
14 Хайкин С. Нейронные сети: полный курс / С. Хайкин. - 2-е изд .;
пер. с англ. - М.: Вильямс. 2006 - 1204 с.
15 Ханк Д. Э. Бизнес-прогнозирование / Д. Э. Ханк, Д. В. Уичерн,
А. Дж. Райтс. - 7-е изд., Пер. с англ. - М.: Вильямс, 2003 - 644 с.
12.3. Ресурсы сети Internet
16 Электронная библиотека. - Режим доступа: http://all-ebooks.com.
17 Свободна энциклопедия [Электронный ресурс]. - Режим доступа:
http://ru.wikipedia.org/wiki/Data_mining.
18 Дюк В.А. Применение технологий интеллектуального анализа
данных в естественнонаучных, технических и гуманитарных областях
[Электронный ресурс] / В. А. Дюк, А. В. Флегонтов, И.К. Фомина. Ре -
жим доступа: ftp://lib.herzen.spb.ru/text/dyuk_138_77_84.pdf.
19 Шапот М. Интеллектуальный анализ данных в системах подде-
ржкы принятия решений [Электронный ресурс] / М. Шапот. - Режим дос
тупую: http://www.osp.ru/os/1998/01/179360/.
К сожалению, в одной статье не просто дать все знания про задачи модульного контроля. Но я - старался. Если ты проявишь интерес к раскрытию подробностей,я обязательно напишу продолжение! Надеюсь, что теперь ты понял что такое задачи модульного контроля и для чего все это нужно, а если не понял, или есть замечания, то не стесняйся, пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Интеллектуальный анализ данных
Комментарии
Оставить комментарий
Интеллектуальный анализ данных
Термины: Интеллектуальный анализ данных