Поиск информации в Интернете


Содержание
<< Читать " ОСНОВЫ ИНТЕРНЕТ-ТЕХНОЛОГИЙ "
>> Читать "Международные поисковые системы "

Многие считают, что в Интернет легко найти любую информацию. Однако опытные пользователи знают, что хотя Web и представляет собой огромное хранилище данных, отыскать среди них нужные не так просто. Бессистемный поиск информации во Всемирной сети можно сравнить с поиском книги в огромной библиотеке, не имеющей алфавитного каталога и картотеки.

В качестве проводника Интернет предлагает такие специализированные средства как поисковые системы (searchengines), индексированные веб-каталоги (directories), метапоисковые системы и специализированные списки ссылок по определенной тематике.

Поисковые серверыэто специально созданные узлы WWW, которые свободно доступны и основная функция которых состоит в поиске информации среди различных информационных ресурсов Интернет. Сегодня в World Wide Web насчитывается около десятка лидирующих и активно конкурирующих между собой поисковых систем, а общее число поисковых серверов составляет более сотни. Популярность и признание поисковых систем Интернет дает их владельцам – компьютерным компаниям – существенную поддержку в бизнесе в виде притока рекламодателей.

Хотя благодаря рекламе доступ к поисковым серверам бесплатен, это не значит, что наше время тоже ничего не стоит. Вот почему, когда требуется найти нужные документы в Интернет, важно выбрать наиболее мощные поисковые системы и уметь в совершенстве ими пользоваться.

В общем случае механизм поиска включает в себя три главных элемента. Первый и основной элемент – “паук” (spider) или программа-робот. “Паук” – это специальная программа, которая посещает какую-либо страницу Сети, читает содержимое и затем следует по ссылкам на другие страницы и другие узлы Web. Паук регулярно возвращается к узлу, примерно каждый месяц или чаще, чтобы поискать изменения.

Все сведения, что находит паук, входят во вторую часть механизма поиска, называемую индексом. Индекс, который еще иногда называют каталогом, содержит копию каждой страницы Сети, которую нашла программа-паук. Если со временем страница изменяется, то при следующем посещении паук фиксирует эти изменения и индекс модифицируется на основе найденной информации. Иногда на это может потребоваться некоторое время, которое затрачивается пауком на поиск изменений и последующую добавку к индексу. Таким образом, страница сети может быть просмотрена, но еще не индексирована. Пока страница не индексирована, все содержащиеся на ней сведения недоступны пользователям Интернет, проводящим поиск в Сети с помощью данной поисковой системы.

Программное обеспечение механизма поиска – третья часть поисковой системы. В общем случае это – программа, которая просматривает миллионы страниц, записанных в индексе, чтобы найти пары (шаблоны) к поиску и отсортировать их в определенном порядке. Именно это программное обеспечение позволяет отправить запрос на поисковый сервер, где происходит выделение из введенной фразы ключевых слов, проводится поиск в индексе и в ответ передаются адреса страниц, где встречаются подобные слова или выражения.

В Web существуют десятки поисковых систем, каждая из которых имеет свои особенности сбора информации. Одни просматривают всю Web-страницу, другие сосредоточиваются на ее заголовке, а третьи просто считывают ключевые слова и информацию, имеющуюся в тегах с ключевыми словами, которые дают представление о содержимом страницы. Вот почему различные поисковые системы выдают разные результаты.



<< Читать " ОСНОВЫ ИНТЕРНЕТ-ТЕХНОЛОГИЙ "
>> Читать "Международные поисковые системы "



Похожие статьи:

4.3 Системы интеллектуального анализа данных. Извлечение знаний из данных. ч.2
25 июня 2012,
Сравните с точки зрения наглядности и объяснимости два способа представления знаний, которые выявил компьютер на основе анализа результатов деятельности интернет-магазина (это еще одно пояснение те ... Читать полностью

Вступление. Электронное учебное пособие
06 мая 2012,
Глухих И.Н. Теория экономических информационных систем: Электронное учебное пособие. – Тюмень: Тюменский государственный университет, 2003г. - Рег. ФГУП НТЦ «Информрегистр» 02.10. ... Читать полностью

Тема 4. Информационное моделирование предметной области при построении ЭИС. Информационное моделирование при построении ИПС. ч.1
01 июня 2012,
Основным назначением информационно-поисковых экономических систем является информационное обеспечение руководителей и работников предприятий на основе выдачи ответов на их запросы. В общем случае с ... Читать полностью

Тема 5. Комплексная автоматизация управления предприятием. Корпоративные ЭИС. Адаптируемые интегрированные системы для построения КИС предприятий. ч.1
03 июня 2012,
На сегодняшний день на российском рынке имеется не одна сотня программных систем разной степени сложности и с различными возможностями (см. [Петров,2001], www.finsoft.ru, www.interface.ru и друг ... Читать полностью

Тема 5. Комплексная автоматизация управления предприятием. Корпоративные ЭИС. Отечественные программные системы для комплексной автоматизации предприятия. ч.1
03 июня 2012,
В этом пункте рассмотрим некоторые отечественные адаптируемые интегрированные системы, на базе которых возможно построение КИС предприятия. В дополнение к излагаемому материалу рекомендуется посети ... Читать полностью