Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Модератор

Поисковые каталоги

Каталоги в WWW аналогичны систематизированным библиотечным каталогам. Поиск по каталогам состоит в последовательном движении по иерархическому списку ссылок, называемых рубриками или категориями.

На первой странице каталога содержатся ссылки на крупные темы, например, Культура и искусство, Общество и политика, Бизнес и др.

Щелчок на соответствующей категории открывает страницу, содержащую ссылки, детализирующие выбранную тему (рубрики). Двигаясь вниз по детализирующим категориям, можно найти страницы с нужной информацией.

Некоторые каталоги поддерживают возможность быстрого поиска определенной категории или страницы по ключевым словам с помощью локальной поисковой машины.

Результат поиска в каталоге представляется в виде списка, состоящего из краткого описания (аннотации) документов с гипертекстовой ссылкой на первоисточник.

Все каталоги создаются и поддерживаются в актуальном состоянии специалистами, аналогично тому, как библиографы составляют и поддерживают библиотечные каталоги.

Сотрудник фирмы, отвечающий за содержимое каталога (его отдельного раздела, подраздела и т.д.), за его достоверность, надёжность и актуальность. Модератора иногда называют гидом поисковой машины (системы).

Благодаря этому содержание страниц, включенных в каталог, наиболее адекватно соответствует рубрике, к которой они отнесены, а поиск по каталогам дает более релевантные результаты, чем поиск по поисковым системам.

Каталоги могут быть глобальные, национальные, общие и специализированные (отраслевые, тематические и т.д.).

Основными параметрами, характеризующими достоинства каталогов, являются:

Ø объем - определяет степень надежности или «информационной прочности». От этого зависит уровень доверия, который пользователи питают к конкретному каталогу.

Ø оперативность отражения новых или изменившихся ресурсов - насколько оперативно появляются ссылки на новые сайты, и исправляются или удаляются ссылки на устаревшие ресурсы. В некоторых системах существует специальный механизм, периодически проверяющий доступность сайта и исключающий его из перечня при долгом «отсутствии» в Сети;

Ø логичность и последовательность иерархической схемы классификации - определяет степень простоты, с которой пользователи могут находить требуемые сведения;

Ø перекрестность структуры - позволяет выявлять информацию, используя разные подходы (например, территориальный или отраслевой). В этом случае схема классификации должна автоматически выводить пользователя на искомый объект, какой бы путь поиска не был выбран.

Основная проблема поисковых каталогов – низкий коэффициент охвата Web-ресурсов.


Адреса популярных каталогов:

Российские каталоги:

Улитка

Russia of the net (www.ru) – один из старейших каталогов, основан в 1995 году.

Зарубежные каталоги:

http://www.yahoo.com/

Система запущена в начале 1994 года. Yahoo! является одним из самых первых, надежных и авторитетных каталогов. У каталога два основных достоинства: - внушительный объем (на сегодня отражено порядка 2 миллионов сайтов в более чем 25 тысячах категорий) и научность и логичность используемой схемы классификации. У yahoo имеется поисковый каталог для детей и поисковик на русском языке.

http://www.dmoz.org - каталог начал предоставлять свои услуги в июне 1998 года. Имеет базу данных с более 2 млн. проиндексированных сайтов, 28.000 редакторов и 304.000 категорий. Разработчики хотели создать каталог больше и лучше, чем Yahoo.

Поисковые машины (поисковые серверы, поисковые роботы)

По области действия поисковые машины можно разделить на глобальные, которые осуществляют поиск на многих языках без учёта имени домена, и локальные, которые осуществляют поиск в пределах определённого домена, например, национального, на определенном языке.

Поисковые системы состоят из следующих основных частей:

1. Робот (Robot, или Spider). Это программа, которая посещает Web-страницы, считывает (индексирует) полностью или частично их содержимое и далее следует по ссылкам, найденным на данной странице. Spider автоматически возвращается через определенные периоды времени и индексирует страницу снова.

2. Индексы. Все, что находит и считывает Spider, попадает в индексы поисковой системы. Индексы системы представляют собой гигантское вместилище информации, где хранится преобразованная особым образом текстовая составляющая всех посещенных и проиндексированных Spider страниц.

3. Поисковая программа. В соответствии с запросом пользователя эта программа перебирает индексы поисковой системы в поисках информации, интересующей пользователя, и выдает ему найденные документы в порядке убывания релевантности.

К основным параметрам, характеризующим достоинства поисковых машин, относятся:

- объем индексных файлов или широта охвата материала (число проиндексированных серверов и отдельных документов) – до 3 с лишним миллиардов документов;

- степень оперативности обновления базы данных за счет включения сведений о новых материалах и удаления устаревших – от двух недель до полутора месяцев;

- возможности для составления запроса – предопределяет долю релевантных документов в перечне полученных документов;

- интеллектуальность системы ранжирования результатов поиска - перечень факторов, принимаемых во внимание при определении места документа в перечне ссылок необычайно широк: от местоположения слова на странице до рейтинга (авторитета) страниц, имеющих ссылки на найденный документ;

- наличие дополнительных сервисных функций, облегчающих работу пользователя - возможность перевода текста документа на иностранный язык, способность выделять все документы с определенного сайта, сужение критериев в ходе поиска, нахождение документов "по образцу" и т.д.

Достоинство автоматизированного поиска состоит в том, что он обеспечивает просмотр очень больших объемов информации.

Адреса наиболее популярных поисковых машин:

Зарубежные поисковые машины:

http://www.google.com/

http://www.altavista.com/

Система открыта в декабре 1995 года.

http://www.excite.com/

Система открыта в конце 1995 года

http://www.hotbot.com/

Система запущена в мае 1996 года.

www.lycos.com

Система запущена примерно в мае 1994 года.

Российские поисковые машины:

http://www.yandex.ru/ (или http://www.ya.ru/) Сайт компании, Yandex.ru, был открыт 23 сентября 1997 года.


http://www.rambler.ru/ Rambler создан в 1996 году.

http://www.aport.ru/ действует в Интернете с 1996 года.

<== предыдущая лекция | следующая лекция ==>
Основные понятия. Информационная потребность– необходимость найти сведения по какому-либо запросу | Метапоисковые системы. Метапоисковые системы сами ничего не ищут, но обращаются за помощью сразу к нескольким поисковым машинам
Поделиться с друзьями:


Дата добавления: 2014-01-20; Просмотров: 684; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.