Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Как работают поисковые системы

Что такое поисковые системы

Поисковые системы

Поиск информации

Одно из заблуждений, бытующее среди пользователей Интернет, гласит, что в Интернет найдется все. Это не так по двум причинам. Во-первых, в Интернет может найтись лишь то, что туда кем-то было помещено. Во-вторых, для того чтобы найти в Интернет то, что там наверняка есть, нужно обладать определенными навыками поиска. Но даже будь пользователь самым крупным специалистом по поиску в Интернет, все его способности будут бессильны, если владелец ресурса с нужной вам информацией не позаботился о том, чтобы она стала доступной для поиска. Так тоже бывает, и от такого головотяпства уже ничто не поможет.

Давайте посмотрим, что и как можно искать в Интернет, чем при этом пользоваться и каких ошибок следует избегать во время поиска.

Поисковые системы — это Интернет-порталы, которые предназначены для того, чтобы предоставить их посетителю возможность найти сайты, на которых встречаются заданные слова или Целые фразы. Поисковые системы хороши в тех случаях, когда пользователь точно знает, что вам нужно, когда пользователь может быть уверены, что если на какой-либо странице присутствуют те или иные слова или Фразы, то это как раз то, что он ищет.

Как мы уже говорили, порталы — это целый набор серверов, которые обеспечивают работу единой системы какого-либо Интернет-сервиса. В данном случае нас интересует служба поиска сайтов по заданным словам. Это значит, что поисковая машина должна знать, где и на каком сайте встречаются те или иные слова. Согласитесь, если бы поиск по сайтам начинался в момент, когда мы щелкаем на кнопке Найти, то мы бы не дождались ее завершения и через несколько дней. Сейчас Интернет насчитывает более одного терабайта информации. Это примерно 2x10*8 страниц машинописного текста. Если просматривать эти страницы по 10 в секунду, то на это уйдет чуть меньше года! Как же получается, что поисковые системы предоставляют нам результат за несколько секунд?

Для этого существуют специальные поисковые роботы, или, как их еще называют, пауки. Они представляют собой серверы, на которых запущена программа сканирования сайтов. После того как владелец сайта зарегистрирует свой ресурс на поисковом сервере, робот запишет этот адрес в очередь, через несколько дней зайдет на этот сайт и проиндексирует его. Все слова, найденные на страницах сайта, будут занесены в специальную базу данных и отсортированы соответствующим образом, чтобы их поиск по этой базе отнимал как можно меньше времени. И когда пользователь в строке поискового запроса набирает нужное слово, поиск на самом деле ведется не по всей сети Интернет, а лишь по базе данных поискового сервера. Периодически "паук" повторно обходит известные ему страницы, чтобы обновить сведения о них. Таким образом, результаты поиска будут достаточно актуальны, но в пределах времени, необходимого роботу для повторной проверки ресурса.

Далее, чтобы предоставить вам информацию, поисковая машина должна ее как-то классифицировать и упорядочить. Вот здесь и начинаются "секретные" технологии. Дело в том, что поисковые серверы пытаются предугадать, насколько тот или иной сайт соответствует введенному пользователем запросу. Это соответствие называется релевантность. У каждой поисковой системы собственные методы оценки релевантности. А держатся они в строжайшем секрете не только для обеспечения своего авторского права, но и для того, чтобы Web-мастера, создающие сайты, не смогли четко вычислять факторы, влияющие на то, чтобы сайты доказывались среди первых в списке найденных результатов. Тогда они будут искусственно фабриковать эти факторы, и страница не будет реально отвечать введенному слову или фразе.

<== предыдущая лекция | следующая лекция ==>
Простейшая реализация | Как правильно использовать функцию поиска
Поделиться с друзьями:


Дата добавления: 2014-01-05; Просмотров: 1626; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.