КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Поиск информации с сети Интернет
Работа в сети Интернет практически всегда связана с необходимостью получения информации. Для этой цели служат различные системы поиска. Поисковые системы разрабатывались давно и с различными целями. В свое время даже выделяли специальный класс систем обработки информации – информационно-поисковые системы (ИПС). По мере развития систем управления базами данных информационный поиск как самостоятельное направление перестал разрабатываться, так как поиск данных в базах стал неотъемлемым элементом любой СУБД. С появлением Интернет положение изменилось – теперь данные нужно искать не в одной конкретной базе данных, а мировом информационном пространстве, что представляет собой гораздо более сложную задачу. В последние несколько лет появились довольно удачные поисковые системы. Так как такие системы призваны обслуживать различные запросы, их принято называть поисковыми серверами. Они позволяют находить информацию в Web-страницах, в группах новостей и хранилищах файлов. Стратегия современных поисковых серверов базируется на трех основных подходах: § создание индексов; § создание каталогов; § гибридный метод.
Поддержка Web-индексов предполагает создание и непрерывное пополнение огромной базы данных по индексируемым документам. Под индексами понимают специальные таблицы, которые указывают на место расположения (адреса Web-узлов) разнообразных терминов во всемирной сети. Сбор информации выполняется автоматически программами - роботами, которые просматривают серверы сети Интернет, анализируют встречающиеся в них слова и выполняют индексирование. В качестве примеров таких систем можно привести следующие системы:
Поисковые системы этого типа обладают очень большими базами данных и высокой скоростью обработки запросов. Однако эффективность информационного поиска зачастую оказывается недостаточной. Поисковые серверы, реализованные по принципу создания каталогов, формируются людьми, которые сами просматривают Web-узлы, читают электронную почту и телеконференции. Собранная таким образом информация помещается в тематические каталоги. Примером подобных систем могут служить системы:
Качество таких поисковых серверов значительно выше. Кроме того, Web-каталоги имеют также внутренний поисковый механизм, который позволяет локализовать поиск по теме. В гибридных системах поиска можно воспользоваться как индексной базой данных, так структурированными тематическими каталогами. Примером могут служить системы:
Справочные системы отличаются от поисковых систем тем, что в них отсутствует внутренний механизм поиска. Примером справочных систем могут быть:
Стремление облегчить задачу поиска информации дало толчок к развитию систем параллельного поиска, называемых метапоисковыми системами. В простейшем случае метапоисковые системы — программы, которые предоставляют доступ поочередно к нескольким серверам. Пример такой системы: http://home.microsoft.com/intl/ru/access/allinone.asp. Процесс поиска во многих поисковых системах имеет приблизительно следующий алгоритм: § выполняется переход на начальную страницу поисковой системы, на которой находятся поля для формирования запроса или кнопка для выполнения начала поиска; § уточняется область поиска (наука, искусство, медицина, новости и т.д.); § вводится запрос на поиск в соответствии с правилами, принятыми в выбранной системе поиска. Возможно уточнение параметров запроса; § нажимается кнопка для начала поиска; § после появления на экране результатов поиска выполняется просмотр информации и сохранение наиболее важных для пользователя данных на диске.
Поиск информации при выполнении запроса выполняется не непосредственно в Интернет, а в базе данных поисковой системы. Возможно, что информация в первоисточнике уже не совпадает с информацией базы данных. Для минимизации этого несовпадения поисковые системы постоянно обновляют свои базы данных. При этом существует два способа обновления информации в базах данных поисковых систем: § разработчик Web-страниц самостоятельно добавляет ссылку на свою страницу в поисковую систему. § поисковая система запускает специальную программу, называемую роботом. Робот проверяет существование ранее найденных и наличие новых документов.
Для поиска информации с помощью поисковой системы Alta Vista, которая имеет на сегодняшний день самую большую базу данных и быстрый механизм поиска, необходимо: § установить связь с поставщиком услуг Интернета; § запустить программу Internet Explorer или другую программу навигации; § нажать кнопку Поиск. На экране появится список поисковых систем с полем запроса для поиска информации. § ввести информацию для запроса в поле ввода поисковой системы Alta Vista. На рис.8.5 показан основной экран системы Alta Vista. Рис. 8.5. Окно поисковой системы AltaVista В большинстве случаев достаточно бывает простых запросов. Однако данная система реализует и сложный запрос, для которого используются логические операторы и синтаксические выражения. Синтаксические выражения – это любые слова и словосочетания или фразы. Над синтаксическими выражениями допустимы логические операции с помощью следующих логических операторов:
Alta Vista — это только одна из многих поисковых систем международного уровня с интерфейсом на английском языке, которая поддерживает поиск по проиндексированным страницам, поиск графических изображений, аудио- и видеоинформации, а также обширный тематический каталог. Большой популярностью пользуется поисковая система Rambler (http://www.rambler.ru/) (рис.8.6), которая была изначально создана для возможности поиска по русскоязычным серверам и состоит из двух частей: поисковой программы-робота и базы данных. Первая часть является роботом, который может получать адреса документов через прокси-сервер или непосредственно с указанного узла, индексирует содержание документа и помещает результаты этого индексирования в базу данных. Второй частью Rambler является собственно сама поисковая система. Она поддерживает различные логические операции между словами, а также усечения слов с помощью метасимволов. Пользователь может определить выходной формат документов, максимальное количество результатов поиска и т. д. Rambler предоставляет информационные разделы по основным сферам человеческой деятельности - экономике, налогам, финансам, компьютерам, ценам, курсам валюты, политике и так далее.. Для поиска информации в русскоязычной части Интернет сегодня работает несколько систем, которые в значительной мере удовлетворяют потребности пользователей Интернет Росcии и стран ближнего зарубежья. К числу наиболее известных, кроме Rambler (http://www.rambler.ru/), относятся Апорт-2000 (http://www.aport.ru/), Яndex (http://www.yandex.ru/).
Рис. 8.6. Окно поисковой системы Rambler Для получения адекватного результата поиска необходим опыт и соблюдение некоторых основных правил: § правильное правописание ключевых слов, используемых в запросе; § использование синонимов ключевых слов для расширения пространства поиска; § использование опций расширенного поиска, где действуют специальные синтаксические правила для применения булевых операций над ключевыми словами, предусматривается различие прописных и строчных букв, предлагается выбор способов ранжирования найденных документов и т. д.
Значительно улучшить результаты поиска помогают метапоисковые системы. В простейшем варианте метапоисковые системы являются всего лишь интерфейсными программами, предоставляющими на одной странице одновременный доступ к нескольким серверам, где Вы можете поочередно вводить ключевые слова в текстовом окне каждого из представленных поисковых серверов. В браузере Internet Explorer 6.0 предусмотрен легкий доступ и метапоисковой странице, расположенной на сервере Microsoft (http://home.microsoft.com/intl/ru/access/allinone.asp).Здесь находятся окна для ввода ключевых слов и поиска на следующих серверах: 1. Excite. 2. Yahoo! (Web-каталог). 3. Rambler. 4. Aport. 5. Yandex. Пользователю Internet Explorer 6.0 достаточно лишь загрузить данную страницу, нажав кнопку Поиск (Search) на панели инструментов, выбрать поисковый cервер, и введя одно или несколько ключевых слов, нажать кнопку Поиск (Search). В Интернет существует достаточно большое число независимых метапоисковых серверов: AccuFind SearchService(http://accufind.com/), SuperSearch Service (http://www.robtex.com/search/query.htm), MetaSearch (http://metasearch.com/). Однако простейшие метапоисковые серверы позволяют всего лишь сэкономить время, необходимое для установления доступа к каждому из серверов в отдельности, не решая самой задачи параллельного поиска. Реальный одновременный поиск документов по целому ряду поисковых машин с выдачей совокупных результатов поиска обеспечивают сегодня несколько наиболее развитых метапоисковых серверов, одним из лидеров которых признан WebCompass фирмы Quaterdeck Corp.
Дата добавления: 2014-12-29; Просмотров: 622; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |