Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Синтаксис языка запросов

 

Синтаксис Что означает оператор Пример запроса
Пробел или &   Логическое И (в пределах предло­жения)   лечебная физкультура  
&&   Логическое И (в пределах доку-мента)   рецепты && (плавленый сыр)  
|   Логическое ИЛИ   фото | фотография | снимок фотоизображение  
+   Обязательное наличие слова в найденном документе (работает также в применении к стоп-словам)   +быть или +не быть  
()   Группировка слов   (технология | изготовление) (сыра | творога)  
~   Бинарный оператор И НЕ (в пределах предложения)   банки ~ закон  
~~   Бинарный оператор И НЕ (в пре­делах документа)   путеводитель по Парижу ~~ (агентство тур)  
/(n m)   Расстояние в словах (-назад +вперед)   поставщики /2 кофе музыкальное /(-2 4) образо­вание вакансии ~/+1 студентов  
" "   Поиск фразы   "красная шапочка" (эквивалентно красная /+1 шапочка)  
&&/(n m)   Расстояние в предложениях (-назад +вперед)   банк && /1 налоги  

 

Естественно-языковый поиск. Знаки «+» (плюс) и «-» (ми­нус). Если пользователю нужно, чтобы некоторые слова из запроса обязательно были найдены, он должен поставить перед каждым из них «+». Если пользователю нужно исключить какие-либо слова из результата поиска, то он должен поставить перед каждым из них «-». Например, запрос «частные объявления продажа велосипедов», выдаст много ссылок на сайты с разнообраз-ными частными объявлениями. Запрос с «+» «частные объявления продажа +велосипедов» покажет объявления о продаже именно велосипедов.

Если пользователю нужно описание Парижа, а не предложения многочисленных турагентств, то имеет смысл задать такой запрос «путеводитель по Парижу -агентство -тур».

Основные операторы. Несколько набранных в запросе слов, разделенных пробелами, означают, что все они должны входить в одно предложение искомого документа. Тот же эффект произведет употребление символа «&». Например, при запросе «лечебная физкультура» или «лечебная & физкультура» резуль­татом поиска будет список документов, в которых в одном пред­ложении содержатся и слово «лечебная», и слово «физкультура» (эквивалентно запросу «+лечебная +физкультура»).

Между словами можно поставить знак «|», чтобы найти до­кументы, содержащие любое из этих слов (удобно при поиске синонимов).

Запрос вида «фото | фотография | фотоснимок снимок | фото­изображение» задает поиск документов, содержащих хотя бы одно из перечисленных слов.

Еще один знак - тильда «~» - позволит найти документы с предложением, содержащим первое слово, но не содержащим второе.

По запросу «банки ~ закон» будут найдены все документы, содержащие слово «банки», рядом с которым (в пределах пред­ложения) нет слова «закон».

Чтобы подняться на ступеньку выше — от уровня предложе­ния до уровня документа, просто повторите соответствующий знак. Одинарный оператор «&» или «~» ищет в пределах предло­жения; двойной «&&» или «~~» - в пределах документа. Напри­мер, по запросу «рецепты &&(плавленый сыр)» будут найдены документы, в которых есть и слово «рецепты», и словосочетание «плавленый сыр» («плавленый сыр» будет в одном предложе­нии). Запрос «руководство Visual С ~~ цена» выдаст все доку­менты со словами «руководство Visual С», но без слова «цена».

Поиск с расстоянием. Часто в запросах ищут устойчивые словосочетания. Если поставить их в кавычки, то будут найдены те документы, в которых эти слова идут строго подряд. Напри­мер, по запросу «"красная шапочка"» будут найдены документы с это фразой. При этом фразы типа «а шапочка у нее была красная» найдены не будут.

Как «Яndex» адресует слова? Если все слова в тексте пере­нумеровать по порядку следования, то расстояние между словами a и b - это разница между номерами слов а и b. Таким образом, расстояние между соседними словами равно 1 (а не 0), а расстоя­ние между соседними словами, стоящими «не в том порядке», равно -1. То же самое относится и к предложениям.

Если между двумя словами поставлен знак «/», за которым сразу напечатано число, значит, требуется, чтобы расстояние между ними не превышало этого числа слов. Например, задав запрос «поставщики /2 кофе», вы требуете найти документы, в которых сосодержится и слово «поставщики», и слово «кофе», причем рас­стояние между ними должно быть не более двух слов, и они долж­ны находиться в одном предложении. (Найдутся «поставщики ко­лумбийского кофе», «поставщики кофе из Колумбии» и т.д.).

Если порядок слов и расстояние точно известны, то можно воспользоваться синтаксисом «/+n». Так, например, задается поиск слов, стоящих подряд.

Запрос «синяя /+1 борода» означает, что слово «борода» должно следовать непосредственно за словом «синяя». (К тому же результату приведет запрос «"синяя борода"»).

В общем виде ограничение по расстоянию задается при помо­щи синтаксиса вида «/(n m)», где «n» - минимальное, а «m» - мак­симально допустимое расстояние. Отсюда следует, что запись «/n» эквивалентна «/(-n +n)», а запись «/+n» эквивалентна «/(+n +n)».

Запрос «музыкальное /(-2 4) образование» означает, что сло­во «музыкальное» должно находиться от «образование» в интер­вале расстояний от 2 слов слева до 4 слов справа.

Практически все знаки можно комбинировать с ограничени­ем расстояния. Например, результатом поиска по запросу «вакан­сии ~/+1 студентов» будут документы, содержащие слово «ва­кансии», причем в этих документах слово «студентов» не следует непосредственно за словом «вакансии».

Когда знаки ограничения по расстоянию стоят после двой­ных операторов, употребленные там числа - это расстояние не в словах, а в предложениях. Расстояние в абзацах определяется аналогично расстоянию в словах. Запрос «банк &&/1 налоги» оз­начает, что слово «налоги» должно находиться в том, либо в со­седнем со словом «банк» предложении.

Скобки. Вместо одного слова в запросе можно подставить це­лое выражение. Для этого его надо взять в скобки. Например, запрос «(история, технология, изготовление) /+1 (сыра, творога)» задает поиск документов, которые содержат любую из фраз: «история сы­ра», «технология творога», «изготовление сыра», «история творога».

Поиск в зонах. Можно искать информацию в «зонах» - за­головках (имя «зоны»: Title), ссылках (имя «зоны»: Аnchor) и ад­ресе (имя «зоны»: Аddress).

Синтаксис: $имя_зоны (поисковое выражение).

Запрос «$title CompTek» ищет в заголовках документов сло­во «СompТеk».

Запрос «$anchor (CompTek | Dialogic) находит документы, в ссылках внутри которых есть одно из слов - «СоmрТеk> или «Dialogic».

Поиск в определенных элементах. Можно ограничить по­иск информации списком серверов или, наоборот, исключить серверы из поиска (URL). Можно также искать документы, со­держащие ссылки на определенные URL (link) и файлы картинок (image). Если нужно работать не с конкретным URL (image), а со всеми, начинающимися с данной последовательности символов, то используйте «*».

Синтаксис: #имя_элемента= "имя_файла (URL)".

По запросу «СоmрТеk ~~ #url=www.comptek.ru*» будут най­дены упоминания компании «СоmрТеk» везде, кроме ее собст­венного сервера (www.comptek.ru). А запрос //#link=www.comptek.ru*» покажет все документы, в которых есть ссылки на сервер компании.

Запрос «#image="tort*"» даст ссылки на документы с изо­бражениями тортов (хотя, возможно, найдется и портрет черепа­хи Тортиллы).

Можно также искать по ключевым словам (keywords), анно­тациям (аbstract) и подписям под изображениями (hint).

Синтаксис: #имя_элемента=(поисковое выражение).

По запросу «#kеуwords=(поисковая система) | #abstract=(поисковая система)» будут найдены все страницы, на которых есть эти слова.

По запросу «#hint=(кино)» будут найдены документы, со­держащие изображение с такой подписью.

Ранжирование результата поиска. При поиске для каждого найденного документа «Яндекс» вычисляет величину релевант­ности (соответствия) его содержания поисковому запросу. Спи­сок найденных документов перед выдачей пользователю сорти­руется по этой величине в порядке убывания. Релевантность до­кумента зависит от ряда факторов, в том числе от частотных ха­рактеристик искомых слов, веса (значимости) слова или выраже­ния, близости искомых слов в тексте документа друг другу и т.д.

Пользователь может влиять на порядок сортировки, исполь­зуя операторы веса и уточнения запроса.

Задание веса слова или выражения применяется для того, чтобы увеличить релевантность документов, содержащих «взве­шенное» выражение.

Синтаксис: слово:число или (поисковое_выражение):число.

По запросу «поисковые механизмы:5» будут найдены те же документы, что и по запросу «поисковые механизмы». Разница состоит в том, что наверху найденного списка окажутся докумен­ты, в которых чаще встречается именно слово «механизмы».

Запрос «поисковые (механизмы | машины | аппараты):5» равно­значен запросу «поисковые (механизмы:5 машины:5 | аппараты:5)».

Задание уточняющего слова или выражения применяется для того, чтобы увеличить релевантность документов, содержащих уточняющее выражение.

Синтаксис: <- слово или <- (уточняющее_выражение).

По запросу «компьютер <- телефон» будут найдены все до­кументы, содержащие слово «компьютер». При этом первыми будут выданы документы, содержащие слово «телефон». Если ни в одном документе со словом «компьютер» нет слова «телефон» то результат запроса будет эквивалентен запросу «компьютер».

Летом 2002 г. компания «Яндекс» объявила о запуске но­вой поисковой службы изображений «Яндекс.Картинки» (www.yandex.ru/images.html). Служба автоматически собирает картинки, находящиеся в Рунете, в стандартных графических форматах (jpeg, gif и png). Как результат поиска приводятся не только ссылки на изображения, но и уменьшенные копии ори­гиналов. На момент запуска в базе «Яндекс.Картинки» содер­жалось около 12 млн. изображений. Большое внимание уделе­но ранжированию результатов поиска - учитывается не только мера совпадения текста подписей и ссылок, но и размер карти­нок и их «авторитетность», для расчета которой используется взвешенный индекс цитирования страниц, содержащих кар­тинку или ссылающихся на нее.

Уже два раза в Рунете компания «Яндекс» провела Кубок России по поиску в Интернет. В этих увлекательных соревнова­ниях участвовало более тысячи человек, а следили за их ходом десятки тысяч.

Поиск в Интернет - это новый вид интеллектуальной дея­тельности. Как известно, правильная постановка задачи - уже половина решения, и этот принцип особенно важен в отношении поиска в сети Интернет. В ходе поиска вырабатываются навыки анализа и переформулировки задачи, разложения ее на элемен­тарные составляющие. Кроме того, поиск обеспечивает приток новых знаний и одновременно приучает их критически оцени­вать, ведь Интернет часто предоставляет противоречивую ин­формацию по одному и тому же вопросу.

Контрольные вопросы:

 

5.1. Перечислите поисковые машины Интернета.

5.2. Чем осложняется поиск информации в Рунете?

5.3. Перечислите факторы, от которых зависит релевантность документа.

5.4. Что означает оператор «пробел или &» в поисковом выражении «Яндекса»?

5.5. Что означает оператор «&&» в поисковом выражении «Яндекса»?

5.6. Что означает оператор «+» в поисковом выражении «Яндекса»?

5.7. Что означает оператор «|» в поисковом выражения «Яндекса»?

5.8. Что означает оператор «" "» в поисковом выражении «Яндекса»?;

5.9. Что означает оператор «/(n m)» в поисковом выражении * «Яндекса»?

5.10. Что означает оператор «()» в поисковом выражении «Яндекса»?

5.11. Что означает оператор «~» в поисковом выражении «Яндекса»?

5.12. Что означает оператор «~~» в поисковом выражении Яндекса?

5.13. Что означает оператор «&&/(n m)» в поисковом выра­жении «Яндекса»?

5.14. Возможен ли в «Яндексе» поиск изображений?

5.15. Какой список документов найдет «Яндекс» по запросу «коммерческая & тайна»?

5.16. Какой список документов найдет «Яндекс» по запросу «+пластиковые карты -микропроцессор»?


<== предыдущая лекция | следующая лекция ==>
Поиск в Рунете | Особые виды Web-узлов и Web-страниц
Поделиться с друзьями:


Дата добавления: 2014-01-20; Просмотров: 3879; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.04 сек.