Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Поисковые системы. Как уже говорилось выше, большую часть пользователей в Internet интересуют гипертекстовые HTML-стра-ницы




Web-браузеры

Как уже говорилось выше, большую часть пользователей в Internet интересуют гипертекстовые HTML-стра-ницы, которые позволяют представить информацию в виде документов с перекрестными гиперссылками и привлекательным графическим оформлением. Для просмотра гипертекстовых страниц применяются специ-альные программы – Web-браузеры. На сегодняшний день существует большое количество Web-браузеров, но самыми популярными являются Internet Explorer (входит в состав ОС Windows) и Netscape Navigator. Распространение также получил браузер Opera. Остальные браузеры занимают незначительную долю рынка, менее 1%. Несмотря на то, что все браузеры предназначены для одного и того же – просмотра HTML-страниц – между ними имеются различия: страницы в Internet Explorer и Netscape Navigator выглядят по-разному, хотя общая структура страницы сохраняется. Особенно большие проблемы возникают при ис-пользовании в HTML-страницах программ, написанных на языке JavaScript, т.к. объектные модели Internet Explorer и Netscape Navigator различаются. Фактически приходится создавать два варианта страниц: один – для Internet Explorer, второй – для Netscape Navigator. Различаются браузеры и с точки зрения безопасности от сетевых атак. Хотя трудно возлагать всю вину только на браузер, но можно с уверенностью утверждать, что пользователь ОС Linux, использующий Netscape Navigator, будет иметь гораздо меньше проблем с безопасностью, чем пользователь ОС Windows 95/98/Me, использующий Internet Explorer:). Для повышения защищенности, пользователям ОС Windows можно порекомендовать почаще скачивать с сервера Microsoft заплатки (patch, hotfix) и обновления (service pack), устраняющие выявленные пробелы в безопасности, а также завести себе межсетевой экран (например, AtGuard).

Для того, чтобы просмотреть HTML-страницу достаточно просто ввести ее URL-адрес в строке адреса Web-браузера, а затем следовать по гиперссылкам. Но именно в этом и заключается основная проблема – как узнать адрес страницы? Чаще всего бывает так, что известно то, что необходимо найти, но неизвестно где именно искать. Для решения этой проблемы существуют специальные поисковые системы. С точки зрения пользователя, поисковая система – это обычный сайт на главной странице которого находятся разбитые по рубрикам ("Спорт", "Бизнес", "Компьютеры" и т.п.) ссылки на другие сайты. Кроме того, поисковая система позволяет пользователю ввести несколько ключевых слов и возвращает ссылки на страницы, содержащие эти ключевые слова. Важно отметить, что поиск не происходит в момент запроса пользователя. Отдельные серверы заранее и постоянно "исследуют" Internet и составляют базу данных по результатам поиска, а при поступлении запроса пользователя информация просто извлекается из этой базы данных. Из этой схемы имеется одно следствие: разные поисковые системы могут "исследовать" разные "области" Internet, поэтому если информация не найдена одной поисковой системой, то ее возможно найдет другая поисковая система. Кроме того, разные поисковые системы проводят поиск с разной эффективностью и на разную глубину. Самыми известными поисковыми системами по русским ресурсам Internet являются www.aport.ru, www.yandex.ru, www.rambler.ru. Наиболее известные поисковые системы по англоязычным ресурсам - www.altavista.com, www.yahoo.com, infoseek.go.com. Стоит также выделить поисковую систему www.google.com, которая достаточно быстро и качественно осуществляет поиск как по русским, так и по англоязычным ресурсам.

Как уже указывалось выше, все поисковые системы предусматривают поиск по ключевым словам. Очень важно правильно составить запрос на поиск. Необходимо употреблять ключевые слова комбинация которых не является широко распространенной. Если в ответ на Ваш запрос было найдено 7 321 сайт, то очевидно стоит попробовать другую комбинацию ключевых слов, т.к. у Вас просто времени не хватит просмотреть все сайты, большинство из которых не относится к делу. Практически в каждой поисковой системе имеется "раcширенный поиск" (advanced search), который позволяет при помощи удобных форм и логических условий "и", "или" и шаблонов поиска организовать достаточно сложный поиск. Кроме того, каждая поисковая система имеет свой собственный язык запросов. К сожалению, единого стандарта не существует, поэтому просто приведем примеры поисковых запросов поисковой системы www.aport.ru:

Таблица 7.5

Язык запросов поисковой системы www.aport.ru

Запрос Результат поиска
пара умников страницы содержащие слово "пара" и слово "умников". Для простых русских слов Aport также будет искать различные формы слов: умник, умников, умники, пара, пару, парой и т.д.
(пара) or (умников) страницы содержащие слово "пара" или слово "умников".
"(пара) or (умников)" страницы, содержащие слово "(пара)" и слово "or" и слово "(умников)". Условие or и другие специальные слова в кавычках игнорируются и считаются простым текстом.
((NOT из*) and (!яблоко)) or (шампунь)) Скобки означают порядок применения операторов "or" и "and". Звездочка означает любое количество произвольных символов, т.е. из* соответствует словам "изморозь", "известковый" и т.д. NOT – документ не должен содержать слово, следующее за этим оператором, т.е. (NOT из*) означает, что в странице не должны содержаться слова, начинающиеся на "из". Восклицательный знак означает "только эта форма слова", т.е. не будут учитываться слова "яблоки", "яблокам" и т.д.
сл7(курить грабли) в найденных страницах, между словами "курить" и "грабли" должно быть не более 7 слов.
пр2(курить грабли) в найденных страницах, слова "курить" и "грабли" должны находится в пределах 2-х предложений.
(пингвин) and (url=www.microsoft.com) будут найдены все страницы на сервере www.microsoft.com, содержащие слово "пингвин"
(пингвин) and (url= *.ru/arktika/*) будут найдены все страницы со словом "пингвин", при условии, что на некотором сервере из домена.ru, в основном каталоге web-сервера имеется подкаталог arktika.
(пингвин) and (date=01/01/98-01/02/99) страницы, содержащие слово "пингвин" и созданные между 01.01.98 и 01.02.99
(пингвин) and (date:<01/02/99) страницы, содержащие слово "пингвин" и созданные до 01.02.99

* Еще раз напомним, что данный язык запросов специфичен только для поисковой системы www.aport.ru. Другие поисковые системы имеют другие языки запросов – единый стандарт отсутствует.

Помимо поисковых систем можно воспользоваться некоторыми специализированными каталогами. Так для поиска программного обеспечения можно обратиться к сайтам www.listsoft.ru, www.tucows.ru, www.shareware.com. Для поиска художественной литературы можно порекомендовать библиотеку Максима Мошкова www.lib.ru.




Поделиться с друзьями:


Дата добавления: 2014-01-20; Просмотров: 481; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.