КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Обзор поисковых систем Интернета
Поиск информации на Web-страницах сети Интернет удобно проводить с помощью поисковых машин «Altavista», «Google», «Теоmа», «Snар», «Yahoo», «Оingo», «Апорт», «Yndex», «Rambler». Аltavista (www.altavista.com) - поисковая система, включающая в свою базу данных тексты на разных языках (в основном, на английском). Индекс «Аltavista» - один из самых больших в мире (включает в себя более 200 млн. страниц). Сооglе (www.google.com) - поисковая система с простым языком запросов, хорошо приспособленная для начального поиска. «Сооglе» не различает прописных и строчных букв, ищет документы, в которых есть все указанные в строке поиска слова. Если указаны два слова, то «Google» покажет только те документы, где есть оба слова. Если перед каким-либо словом поставить знак минус, то «Google» найдет только те страницы, где нет помеченного минусом слова, например: Clinton -Lewinsky. Индекс «Google» способен искать фразы, при этом фраза отмечается кавычками, например: "Bill Clinton". Поисковый робот «Google» ведет учет внешних ссылок на проиндексированную им страницу, поскольку предполагается, что сайт или страница, на которые очень часто ссылаются создатели других Интернет-ресурсов, более авторитетны, а значит, будут более полезны ищущему (технологии «РаgеRank»). Подключив, таким образом, к своему поисковому механизму десятки тысяч ответственных за свои собственные сайты граждан и компаний, «Google» быстро вырвался в технологические лидеры среди систем поиска. Тeoma (www.teoma.com) следит не только за тем, какие страницы выбираются, но и за тем, как долго посетитель там задерживается. Часто выбираемые и подолгу рассматриваемые страницы «Теоmа» показывает первыми. Люди, того не подозревая, «голосуют» за те документы, которые им понравились, привлекли внимание. Snaр (www.snap.com) - поисковая система для начального поиска. По одному слову можно получить связанные с ним популярные сайты, разделы тематического каталога, близкие по теме слова и фразы. Yahoo! (www.yahoo.com) является тематическим каталогом, подобным рассмотренному ранее каталогу «Ulitka». Разница только в размерах. Если в «Ulitka» около 16 000 адресов страниц и сайтов, то в самом большом каталоге Интернета «Уahoo!» их более миллиона. «Уаhoо!», как и любой тематический каталог, построен в виде дерева: сначала идут основные рубрики (главные ветви); рубрики разбиты на разделы (ветви), разделы - на подразделы (маленькие ветви и побеги), и так до тех пор, пока не появятся описания сайтов и ссылки на них (листья). Каждое описание сайта делается специальным редактором (всего их в «Уаhоо!» около 50). Каждый месяц к «Уаhоо!» обращается более 50 млн. человек. В отличие от «Теоmа», «Сооglе» и «Snap», сайты в разделах «Уаhоо!» не расставлены в порядке убывания «важности». Работающий с 1994 г., «Уаhоо!» не имеет никаких средств измерения популярности. Значок, похожий на очки, стоящий справа от названия сайта, указывает на то, что редакторы рекомендуют его для знакомства с темой. В «Уаhоо!» есть свой язык запросов, поскольку информация, нужная пользователю (нужный раздел каталога), находится не всегда. Во-первых, потому, что каталог, содержащий множество адресов, имеет сложную структуру, и необходимый раздел может затеряться в его недрах. Во-вторых, нужные сведения могут быть разбросаны по разным разделам каталога. Когда в каталоге «Уаhоо!» не найдется нужных слов или фраз, он обратится к индексу «Сооglе» и попытается найти нужные слова или фразы уже в самих документах, а не в их названиях. Для более детальных запросов можно использовать префиксы t: и u:. Префикс t:, поставленный перед словом, означает поиск только в заголовках страниц и сайтов; префикс u: задает поиск только в адресах сайтов. Система Оinhо (www.oingo.com) в отличие от многих других поисковых систем, воспринимающих слова как простые последовательности символов, способна понимать их смысл. Сначала поиск проходит так же, как и в любом другом каталоге, - ищутся все сайты, где встречается заданное для поиска слово (или фраза). Однако, это слово может иметь самые различные значения (например, слово «king» имеет значения «бог», «царь», «магнат», «шахматный король», «карточный король» и др.). Системе «Оingo» известны многие значения слов, и «Оingo» позволяет пользователю выбрать нужное значение. После уточнения запроса пользователь ищет сайты и страницы с нужным значением слова. Если «Оingо» не может ничего найти в своем каталоге, он обращается к мощному индексу «Аltavista». При поиске редких документов лучше и надежнее опрашивать одновременно несколько поисковых систем, устранять одинаковые адреса и выдавать на экран информацию в удобном для ищущего виде. Именно по такому принципу работают ведущие метапоисковые системы: «МеtаСrаwler» (www.metacrawler.com), Dogpile (www.dogpile.com), «Маmmа» (www.mamma.com), Ixquick (www.ixquick.com). Метапоисковые системы не имеют собственных баз данных и использует базы данных традиционных поисковиков при осуществлении поиска. Наряду с достоинствами, метапоисковым системам присущи и недостатки: выдается только часть адресов, найденных каждым индексом; нельзя использовать достаточно мощный язык запросов - каждый индекс использует свой язык.
Дата добавления: 2014-01-20; Просмотров: 811; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |