КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Поисковый сервис Интернет
Созданная с помощью Интернета новая глобальная информационная среда породила проблемы, связанные с накоплением огромного количества уже доступной информации и стремительного непрерывного роста объема новых ИР, не имеющих четкой индексации в глобальной сети. К тому же многие Web- страницы не имеют четкой рубрикации, позволяющей находить информацию по конкретному направлению деятельности. Увеличение же объемов научной и прочей информации в каждой из предметной областей знаний ведет к повышению дополнительной нагрузки на пользователей, занятых зачастую рутинными процессами поиска нужного ИР среди множества других. Таким образом, возникают значительные трудности по обеспечению полноты и глубины поиска необходимой информации. Отсюда возникли насущные и не менее важные задачи автоматизации процессов, связанных с поиском информации в Интернете. В связи с этим наряду с развитием и совершенствованием самой сети одновременно разрабатываются методы и средства автоматизированного поиска информации в этой сети, которые привели к созданию поискового сервиса сети. Он подразделяется на следующие виды: поисковые системы (машины); тематические каталоги и локализованная система поиска. Поисковые системы представляют собой программно-технические средства, обеспечивающие регулярное отслеживание сетевого пространства по адресам определенных серверов и сбор и них содержащей информации, которая заносится в базу данных серверов уже поисковых машин. Причем содержание Web-страниц сети помещают в общую базу данных поискового сервера полностью или частично. Пользователи, обращающиеся к поисковым системам, имеют возможность осуществлять полнотекстовый поиск по этой базе данных, используя ключевые слова, относящиеся к интересующей их теме. Выдача результатов поиска обычно состоит из выдержек рекомендуемых вниманию пользователя страниц и их адресов, оформленных в виде гиперссылок. Поисковые серверы достаточно многочисленны и разнообразны. Принято различать поисковые системы (индексы) и каталоги. Основное преимущество поисковых систем глобального масштаба — их оперативность. Пользователем задается ключевое слово (словосочетание) — поисковый механизм выдает результаты поиска и точные адреса тех документов, в которых это слово (словосочетание) встречается. При этом многие поисковые системы снабжены логическими операциями при формировании сложного запроса (операторы AND, OR, NOT), усечения слов с помощью звездочки, вопросительного знака и т.п. Для возможного увеличения или уменьшения весового значения какого-либо слова в некоторых системах применяют знаки плюс или минус. В ряде поисковых систем ограничивают поиск только по отдельному серверу. Наиболее распространенными отечественными поисковыми системами являются следующие: К наиболее известным поисковым машинам относятся: Поисковая система "Rambler" (http://www.rambler.ru) — одна из самых самая популярных систем в России, имеющая свой каталог. Она поддерживает все кодировки кириллицы и обеспечивает полнотекстовый поиск более чем в 15 тыс. узлов сети в России и странах ближнего зарубежья. Поисковая система "Yandex" (http://www.yandex.ru) содержит документы более чем из 15 тыс. серверов. Имеет многофункциональный язык запросов, что дает возможность организовывать поиск по списку уже отобранных документов для конкретизации результата. Поисковая система "Aport" (http://www.aport.ru) — самая старая из ориентированных на русский язык систем. Она подключена более чем к 12 тыс. серверов. Имеет возможность, при необходимости, автоматически переводить тексты запроса и ответа на английский и русский языки. Среди отечественных поисковых систем более поздних разработок следует отметить следующие: "Atrus" — http://www.atrus.ru; "List" — http://www.list.ru; "Паук" — http:// www.spider.raser.ru, которые в некоторых случаях превосходят предшествующие системы как по увеличению глубины и широты поиска, так и по предоставлению пользователям большего комфорта. Среди мировых поисковых систем наиболее известные следующие системы: "Alta Vista" (http://www.altavista.digital.com), обладающая на сегодняшний день самой обширной базой данных, "Yahoo" (http://www. yahoo.com), снабженная собственным тематическим каталогом, "Hotbot" (http://www.hotbot.com), "Delphion" (http://www.delphion.com) и др. Недостатками работы поисковых систем являются: - низкая интеллектуальность поиска документов в базе знаний — индекс составляется с помощью простейших программ-роботов, использующих индексы, составляемые для произвольного запроса и, следовательно, не может быть ориентирован заранее на конкретную информацию или предметную область; - упрощенность процедуры вычисления степени релевантности документа, а, следовательно, коэффициентов полноты и шума, на основе индекса; - отсутствие средств полноценного расширения запроса пользователя с целью повышения полноты поиска информации. - отсутствие средств для удобного уточнения результатов запроса - найденные документы сгруппированы по принадлежности к сайтам (месту размещения), а не по тематическому направлению содержания документов; - должным образом не осуществляется индексация данных в табличном виде; - большинство систем не предоставляет возможности уточнения поисковых отчетов по тематическому направлению содержания документов; - в связи с разным форматированием одного и того же информационного содержания документов на разных сайтах системы не могут распознать одинаковых по содержанию документов. Применение поисковых систем для поиска в Internet эффективно, если пользователь представляет, какие ключевые слова характеризуют требуемые ресурсы. Тематические каталоги — поисковые средства справочного типа, представляющие собой многоуровневую смысловую классификацию ссылок, построенную по принципу "от общего к частному". При этом ссылки иногда сопровождаются кратким описанием ресурса. Как правило, предоставляется возможность поиска в названиях рубрик (категориях) и описаниях ресурсов по ключевым словам, а также возможность определить, с каким именно ресурсом Интернета следует ознакомиться, переходя от самых общих категорий к более частным. Поисковые каталоги уместно сравнивать с тематическими библиотечными каталогами, словарями-тезаурусами или биологическими классификациями. Поисковые каталоги бывают общего назначения и специализированные, причем первые включают в себя ресурсы самого разного профиля, а специализированные каталоги объединяют ресурсы, посвященные определенной тематике. В данном случае удается достичь лучшего охвата ресурсов определенной предметной области и построить более адекватную рубрикацию. Инициаторами наполнения ресурсов в каталогах выступают владельцы информационных ресурсов. Каталоги по сравнению с поисковыми системами отличаются более точными и свежими данными, но уступают им в количественных показателях. Сервер, имеющий каталог www.ru, появившийся одним из первых в России (был создан в сентябре 1995 г.), имеет самый простой и запоминающийся адрес. Очень часто на него попадают иностранцы в поисках любой информации о России. Он занимает 8-е место среди всех интернет-ресурсов, используемых россиянами, 4-е среди российских поисковых серверов и каталогов. Каталог "Rambler" (http://www.rambler.ru) содержит 30 рубрик с названиями ресурсов, но без их описания. Имеется статистика посещаемости страниц. Классический каталог "Ау" (http://www.ay.ru) является одним из лучших рубрикаторов русского сегмента Интернета, имеет трехуровневую структуру рубрикатора, содержит около 9 тыс. доступных источников с российских серверов. Каждая ссылка системы включает в себя аннотацию с характеристикой содержания сервера. Каталог-классификатор Web-ресурсов http:// www.refer.ru охватывает множество ресурсов СНГ и России. Большую помощь в поиске первичной и особенно вторичной информации оказывают электронные каталоги библиотек, библиографические и тематические базы данных. Так, к примеру, перечень зарубежных и отечественных каталогов "Русской справочной библиотеки" находится на сайте http://library.vadimstepanov.ru. Перечни библиотечных каталогов представлены на сервере "Библиотеки Конгресса США" http://www.loc.gov/index.html, серверах различных университетов, например МГУ — http://nbmgu.ru/search и т.д. Широко известны также справочники "Желтые страницы Интернет. Мировые ресурсы", "Желтые страницы Интернет. Русские ресурсы" и др. В заключение необходимо отметить, что Интернет в настоящее время становится одним из основных и важнейших источников информации и предлагает огромное количество разнообразной информации, которая только частично ориентирована на определенные потребности пользователя. При этом требуется соблюдение определенных правил поиска и извлечения нужной информации.
Дата добавления: 2014-01-11; Просмотров: 1064; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |