Лекция
Привет, Вы узнаете о том , что такое Технологии Data Mining., Разберем основные их виды и особенности использования. Еще будет много подробных примеров и описаний. Для того чтобы лучше понимать что такое Технологии Data Mining. , настоятельно рекомендую прочитать все из категории Теория принятия решений.
В основу современной технологии Data Mining положена концепция паттернов, отражающих фрагменты многоаспектных взаимоотношений в данных.
Определение
Паттерны представляют собой устойчивые повторяющиеся сочетания данных, отражающие присущие подвыборкам данных закономерности, которые могут быть компактно выражены в понятной человеку форме.
Поиск паттернов производится методами, не ограниченными рамками априорных предположений о структуре выборки и виде распределения значений анализируемых показателей. Найденные паттерны могут отражать неочевидные, неожидаемые регулярности в данных, раскрывающие так называемые скрытые знания. Также как и при добыче полезных ископаемых, «сырые» данные могут содержать глубинный пласт знаний, при грамотной раскопке которого можно обнаружить настоящие самородки, дающие ощутимые преимущества в конкурентной борьбе. В первую очередь методы Data Mining заинтересовали коммерческие предприятия, развертывающие проекты на основе информационных хранилищ данных. Их опыт показывает, что прибыль от использования Data Mining может достигать 1000%.
Примеры заданий на поиск для решения одной и той же задачи при использовании технологии Data Mining и OLAP-технологии приведены в табл. 4.5'.
Сравнение OLAP и Data Mining технологий
Таблица 4.5
OLAP |
Data Mining |
Каковы средние показатели травматизма для курящих и некурящих? |
Встречаются ли точные паттерны в описании людей, подверженных повышенному травматизму? |
Каковы средние размеры телефонных счетов существующих клиентов в сравнении со счетами бывших клиентов, отказавшихся от услуг телефонной компании? |
Имеются ли характерные портреты клиентов, которые, по всей вероятности, собираются отказаться от услуг телефонной компании? |
Какова средняя величина ежедневных закупок по украденной и не украденной кредитной карте? |
Существуют ли стереотипные схемы покупок для случаев мошенничества с кредитными картами? |
В целом технологию Data Mining достаточно точно определяет один из основателей этого направления Г. Об этом говорит сайт https://intellect.icu . Пятецкий-Шапиро .
Определение
Data Mining — это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.
Data Mining является существенно многодисциплинарной областью, возникшей и развивающейся на базе достижений прикладной статистики, распознавания образов, методов искусственного интеллекта, теории баз данных и др. Отсюда проистекает обилие методов и алгоритмов, реализованных в различных действующих системах Data Mining , многие из которых интегрируют в себе сразу несколько подходов. Тем не менее в каждой системе имеется некая ключевая компонента, решающая поставленную конкретную задачу.
Обратите внимание!
Существует пять стандартных типов закономерностей, выявляемых с помощью методов Data Mining: ассоциация, последовательность, классификация, кластеризация и прогнозирование.
Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в компьютерном супермаркете, может показать, что 55% купивших компьютер берут также и принтер, а при наличии скидки за такой комплект принтер приобретают в 80% случаев.
Цепочка связанных во времени событий образует последовательность. Так, например, после покупки квартиры в 45% случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60% новоселов обзаводятся холодильником.
С помощью классификации выявляются признаки, характеризующие класс, к которому принадлежит тот или иной объект. Это делается посредством анализа заранее классифицированных объектов и формулирования некоторого набора правил.
Кластеризация отличается от классификации тем, что сами классы заранее не заданы, средства Data Mining самостоятельно выделяют различные однородные группы данных.
Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в БД в виде временных рядов. Если удается найти паттерны, адекватно отражающие динамику поведения целевых показателей, то с их помощью можно предсказать и поведение системы в будущем.
Исследование, описанное в статье про Технологии Data Mining., подчеркивает ее значимость в современном мире. Надеюсь, что теперь ты понял что такое Технологии Data Mining. и для чего все это нужно, а если не понял, или есть замечания, то не стесняйся, пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Теория принятия решений
Из статьи мы узнали кратко, но содержательно про
Комментарии
Оставить комментарий
Теория принятия решений
Термины: Теория принятия решений