Лекция
Привет, сегодня поговорим про извлечение знаний из web, обещаю рассказать все что знаю. Для того чтобы лучше понимать что такое извлечение знаний из web, web mining , настоятельно рекомендую прочитать все из категории Интеллектуальный анализ данных.
Рассмотрены проблемы анализа информации из Web, этапы Web Mining, Web Mining и другие Интернет-технологии, а также категории Web Mining. Описане методы извлечения Web-контента (извлечение Web-контента в процессе информационного поиска, извлечение Web-контента для формирования баз данных), а также методы извлечения Web-структур (представления Web-Структура, оценка важности Web-структур, поиск Web-документов с учетом гиперссылок,
кластеризация Web-структур). Приведенные результаты исследований использония Web-ресурсов (исследовательская информация, этап препроцессингу, этап извлечения шаблонов, этап анализа шаблонов и их применение).
ПЛАН
1.Web Mining (проблемы анализа информации из Web, этапы Web Mining, Web Mining и другие интернет-технологии, категории Web Mining).
2 Методы извлечения Web-контента (добыча Web-контента в процессе информационного поиска, извлечения Web-контента для формирования баз данных).
3.Добування Web-структур (представление Web-Структура, оценка важности Web-структур, поиск Web-документов с учетом гиперссылок, кластеризация Web-структур).
4.Исследование использования Web-ресурсов (исследовательская информалиция, этап препроцесинга, этап добычи шаблонов, этап анализа шаблонов и их применение).
Web Mining — это использование методов интеллектуального анализа данных для автоматического обнаружения веб-документов и сервисов, извлечения информации из веб-ресурсов и выявления общих закономерностей в Интернете
В Web Mining можно выделить следующие этапы:
Это общие шаги, которые необходимо пройти для анализа данных сети Интернет. Конкретные процедуры каждого этапа зависят от поставленной задачи. В связи с этим выделяют различные категории Web Mining:
Web Content Mining (Извлечение веб-контента) — процесс извлечения знаний из контента документов или их описания, доступных в Интернете[2].Поиск знаний в сети Интернет является непростой и трудоемкой задачей. Именно это направление Web Mining решает ее. Оно основано на сочетании возможностей информационного поиска, машинного обучения и интеллектуального анализа данных.
Web Structure Mining (Извлечение веб-структур) — процесс обнаружения структурной информации в Интернете[3].Данное направление рассматривает взаимосвязи между веб-страницами, основываясь на связях между ними. Построенные модели могут быть использованы для категоризации и поиска схожих веб-ресурсов, а также для распознавания авторских сайтов.
Web Usage Mining (Анализ использования веб-ресурсов) — это автоматическое обнаружение шаблонов в маршруте передвижения пользователя и связанных с ним данными, собранными или приобретенными в результате взаимодействия с одним или несколькими веб-сайтами[4].Это направление основано на извлечении данных из логов веб-серверов. Целью анализа является выявление предпочтений посетителей при использовании тех или иных ресурсов сети Интернет.
Литература:
основная [1; 2; 3; 5];
дополнительная [7; 8; 11; 12].
К сожалению, в одной статье не просто дать все знания про извлечение знаний из web. Но я - старался. Если ты проявишь интерес к раскрытию подробностей,я обязательно напишу продолжение! Надеюсь, что теперь ты понял что такое извлечение знаний из web, web mining и для чего все это нужно, а если не понял, или есть замечания, то не стесняйся, пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Интеллектуальный анализ данных
Из статьи мы узнали кратко, но содержательно про извлечение знаний из web
Комментарии
Оставить комментарий
Интеллектуальный анализ данных
Термины: Интеллектуальный анализ данных