Вам бонус- начислено 1 монета за дневную активность. Сейчас у вас 1 монета

Технологии Data Mining. кратко

Лекция



Привет, Вы узнаете о том , что такое Технологии Data Mining., Разберем основные их виды и особенности использования. Еще будет много подробных примеров и описаний. Для того чтобы лучше понимать что такое Технологии Data Mining. , настоятельно рекомендую прочитать все из категории Теория принятия решений.

В основу современной технологии Data Mining положена концепция паттернов, отражающих фрагменты многоаспектных взаимоотношений в данных.

Определение

Паттерны представляют собой устойчивые повторяющиеся сочетания данных, отражающие присущие подвыборкам данных закономерности, которые могут быть компактно выражены в понятной человеку форме.

Поиск паттернов производится методами, не ограниченными рамками априорных предположений о структуре выборки и виде распределения значений анализируемых показателей. Найденные паттерны могут отражать неочевидные, неожидаемые регулярности в данных, раскрывающие так называемые скрытые знания. Также как и при добыче полезных ископаемых, «сырые» данные могут содержать глубинный пласт знаний, при грамотной раскопке которого можно обнаружить настоящие самородки, дающие ощутимые преимущества в конкурентной борьбе. В первую очередь методы Data Mining заинтересовали коммерческие предприятия, развертывающие проекты на основе информационных хранилищ данных. Их опыт показывает, что прибыль от использования Data Mining может достигать 1000%.

Примеры заданий на поиск для решения одной и той же задачи при использовании технологии Data Mining и OLAP-технологии приведены в табл. 4.5'.

Сравнение OLAP и Data Mining технологий

Таблица 4.5

OLAP

Data Mining

Каковы средние показатели травматизма для курящих и некурящих?

Встречаются ли точные паттерны в описании людей, подверженных повышенному травматизму?

Каковы средние размеры телефонных счетов существующих клиентов в сравнении со счетами бывших клиентов, отказавшихся от услуг телефонной компании?

Имеются ли характерные портреты клиентов, которые, по всей вероятности, собираются отказаться от услуг телефонной компании?

Какова средняя величина ежедневных закупок по украденной и не украденной кредитной карте?

Существуют ли стереотипные схемы покупок для случаев мошенничества с кредитными картами?

В целом технологию Data Mining достаточно точно определяет один из основателей этого направления Г. Об этом говорит сайт https://intellect.icu . Пятецкий-Шапиро .

Определение

Data Mining это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.

Data Mining является существенно многодисциплинарной областью, возникшей и развивающейся на базе достижений прикладной статистики, распознавания образов, методов искусственного интеллекта, теории баз данных и др. Отсюда проистекает обилие методов и алгоритмов, реализованных в различных действующих системах Data Mining , многие из которых интегрируют в себе сразу несколько подходов. Тем не менее в каждой системе имеется некая ключевая компонента, решающая поставленную конкретную задачу.

Обратите внимание!

Существует пять стандартных типов закономерностей, выявляемых с помощью методов Data Mining: ассоциация, последовательность, классификация, кластеризация и прогнозирование.

Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в компьютерном супермаркете, может показать, что 55% купивших компьютер берут также и принтер, а при наличии скидки за такой комплект принтер приобретают в 80% случаев.

Цепочка связанных во времени событий образует последовательность. Так, например, после покупки квартиры в 45% случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60% новоселов обзаводятся холодильником.

С помощью классификации выявляются признаки, характеризующие класс, к которому принадлежит тот или иной объект. Это делается посредством анализа заранее классифицированных объектов и формулирования некоторого набора правил.

Кластеризация отличается от классификации тем, что сами классы заранее не заданы, средства Data Mining самостоятельно выделяют различные однородные группы данных.

Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в БД в виде временных рядов. Если удается найти паттерны, адекватно отражающие динамику поведения целевых показателей, то с их помощью можно предсказать и поведение системы в будущем.

  • Дюк В. A. Data Mining — интеллектуальный анализ данных [Электронный ресурс]. URL:http://www.inftcch.webservis.ru/it/database/datamining/ar2.1пт1#Розничная торговля (датаобращения: 04.08.2015).
  • 2 Piatetsky-Shapiro G. Data Mining and Knowledge Discovery/ G. Piatetsky-Shapiro // 1996to 2005: Overcoming the Hvpc and moving from «University» to «Business» and «Analytics».Data Mining and Knowledge Discovery Journal. 2007.
  • Дюк В. А., Самойленко А. П. Data Mining : учебный курс. СПб.: Питер, 2001. С. 368.

Исследование, описанное в статье про Технологии Data Mining., подчеркивает ее значимость в современном мире. Надеюсь, что теперь ты понял что такое Технологии Data Mining. и для чего все это нужно, а если не понял, или есть замечания, то не стесняйся, пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Теория принятия решений

Из статьи мы узнали кратко, но содержательно про
создано: 2020-11-14
обновлено: 2021-03-13
2



Рейтиг 9 of 10. count vote: 2
Вы довольны ?:


Поделиться:

Найди готовое или заработай

С нашими удобными сервисами без комиссии*

Как это работает? | Узнать цену?

Найти исполнителя
$0 / весь год.
  • У вас есть задание, но нет времени его делать
  • Вы хотите найти профессионала для выплнения задания
  • Возможно примерение функции гаранта на сделку
  • Приорететная поддержка
  • идеально подходит для студентов, у которых нет времени для решения заданий
Готовое решение
$0 / весь год.
  • Вы можите продать(исполнителем) или купить(заказчиком) готовое решение
  • Вам предоставят готовое решение
  • Будет предоставлено в минимальные сроки т.к. задание уже готовое
  • Вы получите базовую гарантию 8 дней
  • Вы можете заработать на материалах
  • подходит как для студентов так и для преподавателей
Я исполнитель
$0 / весь год.
  • Вы профессионал своего дела
  • У вас есть опыт и желание зарабатывать
  • Вы хотите помочь в решении задач или написании работ
  • Возможно примерение функции гаранта на сделку
  • подходит для опытных студентов так и для преподавателей

Комментарии


Оставить комментарий
Если у вас есть какое-либо предложение, идея, благодарность или комментарий, не стесняйтесь писать. Мы очень ценим отзывы и рады услышать ваше мнение.
To reply

Теория принятия решений

Термины: Теория принятия решений