Лекция
Информационно- поисковые системы Интернета (ИПС) - это специализированные компьютерные программы и сервисы, которые предназначены для поиска и организации информации, доступной в сети Интернет. Они выполняют ключевую роль в облегчении поиска, фильтрации и предоставлении информации пользователям в режиме реального времени.
Интернет (Internet = inter + net – объединение сетей) – всемирная компьютерная сеть, объединяющая миллионы компьютеров в единую информационную систему.
Интернет предоставляет широчайшие возможности свободного получения и распространения научной, деловой и познавательной информации (Пример 13.1). Глобальная сеть связывает практически все
крупные научные и правительственные организации мира, университеты и бизнес-центры, информационные агентства и издательства, образуя
гигантское хранилище данных по всем отраслям человеческого знания.
Виртуальные библиотеки, архивы, ленты новостей содержат огромное количество текстовой, графической, аудио и видео информации.
Пример 13.1
Современный ученый и Интернет
«Сейчас в мире выходит 20—30 тысяч журналов, печатающих в год несколько миллионов статей. Можно полностью потеряться в этом информационном потоке, а можно чувствовать себя довольно свободно,
используя электронные системы поиска. За исключением отдельных чудаков, никто уже не ходит в библиотеки, не листает страницы журналов,
не работает с картонными библиографическими карточками. У всех научных журналов есть электронные аналоги, а поисковая система подбирает за считанные секунды нужные тебе статьи. Остается их распечатать и заняться творческой работой - анализом. Все это делается на своем компьютере, не вставая из-за рабочего стола. А если нужен журнал старых времен, рукопись или раздел из книги, которая есть только в
центральной библиотеке — то и здесь вставать из-за стола не нужно, тем более куда-то бежать или ехать в столичный город. Находишь в Интернете каталог центральной библиотеки, определяешь, что тебе нужно,
и отсылаешь запрос по электронной почте. Библиотекарь находит искомое, сканирует и высылает в электронной форме прямо на твой компьютер. Быстро, удобно и дешево. Так работают сейчас большинство научных сотрудников мира». А. Демченко .
В компьютерной сети Интернет, по оценкам специалистов, насчитываются сотни миллионов сайтов, причем каждые полтора года это количество удваивается.
Как же в этом гигантском хранилище данных найти нужную информацию? Для этого нужно уметь пользоваться поисковыми системами.
Поисковая система – это онлайновая служба, предоставляющая возможность поиска информации на сайтах в сети Интернет.
Среди поисковых системы выделяют:
1) поисковые системы в чистом виде (другое название - поисковые машины, поисковики);
2) классификаторы (интернет-каталоги, web директории, поисковые средства справочного типа);
3) метапоисковые системы.
Часто один и тот же портал содержит и поисковую машину и классификатор.
Поисковая машина – это онлайновая служба, осуществляющая поиск информации в Интернете по ключевым словам и выдающая пользователю список ссылок на те сайты, которые удовлетворяют
критерию поиска (рис. 13.3). Основными критериями качества работы поисковой машины являются релевантность (соответствие результата запросу), полнота базы, учет морфологии языка.
Поисковая машина осуществляет поиск ссылок в своей базе данных, которая постоянно обновляется – в нее заносятся данные о все
новых и новых сайтах. Процесс добавления сведений о сайте в базу данных поисковика называется индексацией сайта. Индексация сайтов
осуществляется специальной программой – поисковым роботом.
Поисковый робот – это программа, являющаяся составной частью поисковой системы и предназначенная для обхода страниц Интернета с целью занесения информации о них (ключевых слов) в базу поисковика. Порядок обхода страниц, частота визитов, защита от зацикливания, а также критерии выделения ключевых слов определяются алгоритмами поисковой машины. В настоящее время существует несколько тысяч поисковых систем, однако большая часть пользователей обращается к услугам примерно 10–15 самых популярных поисковиков:
вот некоторые из наиболее известных информационно-поисковых систем Интернета:
Google: Google является одним из самых популярных поисковых движков в мире. Он предоставляет выдачу результатов поиска на основе множества факторов, включая релевантность и авторитетность веб-сайтов.
Bing: Bing - это поисковая система, разработанная Microsoft. Она предоставляет поисковые результаты, а также интегрирована в различные продукты Microsoft, такие как Windows и Office.
Yahoo: Yahoo Search предоставляет поисковые услуги и является одним из старейших игроков в этой области. Он также предлагает новости, электронную почту и другие сервисы.
Yandex: Yandex - российская поисковая система, которая предоставляет поисковые и другие онлайн-сервисы. Она популярна в русскоязычных странах.
DuckDuckGo: DuckDuckGo известен своим фокусом на конфиденциальности пользователей. Он не отслеживает и не сохраняет личную информацию пользователей и предоставляет анонимные результаты поиска.
Baidu: Baidu - крупнейшая поисковая система в Китае. Она предоставляет поисковые и другие онлайн-сервисы для китайских пользователей.
Wolfram Alpha: Wolfram Alpha предоставляет результаты, ориентированные на знания. Он может выполнять вычисления и предоставлять структурированные ответы на вопросы.
Startpage: Startpage предоставляет анонимный поиск в Интернете с использованием результатов Google, но без отслеживания пользователей.
Ecosia: Ecosia - это поисковая система, которая обещает высаживать деревья за каждые 45 поисковых запросов, чтобы бороться с изменением климата.
Классификатор – это онлайновая служба, предоставляющая пользователям адреса и иногда аннотации к сайтам, сгруппированным в категории по тематике. Каждая категория может содержать
несколько подкатегорий. Переходя по названиям рубрик, можно добраться до интересующей информации. Например: Наука – Экономические науки – Менеджмент.
Классификаторы могут помочь исследователю в том случае, если он не может точно сформулировать запрос, но знает тематическую область поиска информации (рис. 13.4, 13.5)
Частный случай классификатора – рейтинг-классификатор.
Рейтинг-классификатор – это классификатор, в котором
сайты в категориях отсортированы по степени популярности, а
также снабжены информацией об их посещаемости (определяемой с
помощью счетчиков посещений).
Рейтинг-классификатор дает возможность владельцам собственных страниц, а также пользователям быстро и точно определить количество визитов на интернет-страницы. Услуга рейтинг-классификатора
предоставляется, например, на портале Рамблер (рис. 13.6)
Мета-поисковая система – это онлайновая служба, позволяющая производить поиск информации в Интернете с применением одновременно нескольких поисковых машин. Мета-поисковая система
автоматически передает запрос реальным поисковым машинам и директориям, а полученные от них результаты интегрирует в виде единого целого.
В качестве примера мета-поисковой системы можно назвать систему MetaCrawler (http://www.metacrawler.com).
Инструментарий, подобный мета-поисковой системе, встроен в прямо в интерфейс Internet Explorer. Для того, чтобы получить доступ к этому инструментарию, нужно на панели инструментов Google Chrome нажать кнопку Поиск. На экране появится панель «Поиск», на которой есть поле, предназначенное для ввода ключевых слов. Введя в это поле слово или фразу, можно увидеть результаты поиска, полученные с помощью таких поисковиков, как Рамблер, Яндекс и Гугл.
Эти информационно-поисковые системы используют различные алгоритмы и методы для определения релевантности и порядка результатов поиска. Пользователи могут использовать их для поиска информации в Интернете, а также для получения доступа к разнообразным онлайн-сервисам и ресурсам.
Ответы на вопросы для самопроверки пишите в комментариях, мы проверим, или же задавайте свой вопрос по данной теме.
Комментарии
Оставить комментарий
Основы научных исследований и организация научно-исследовательской деятельности
Термины: Основы научных исследований и организация научно-исследовательской деятельности