Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Системи




Методи, що забороняють роботам пошук по сайтах, власники яких не бажають, щоби вони були

проіндексовані.

2. База даних – містить інформацію, яку зібрано павуками. Для того, щоб визначити

порядок, у якому перелік документів буде показано, база даних застосовує алгоритм

ранжирування. В ідеальному випадку, розташованими першими в списку будуть документи, що

є найбільш релевантними до запиту користувача.

Релевантність – міра відповідності, тобто це відповідність змісту знайденої сторінки до

запиту користувача. Пошукові системи використовують спеціальні алгоритми для визначення

релевантності. Теоретичних методів визначення релевантності більш ніж 20. Але виділяють два

основні напрями: лінгвістичне (RAMBLER, ЯNDEX) і статистичне (GOOGLE).

Різні пошукові системи використовують різні алгоритми ранжування, однак основними

принципами визначення релевантності є наступні:

 кількість слів запиту у текстовому вмісті документу (тобто в html-коді);

 теги, у яких ці слова розташовуються;

 місцезнаходження шуканих слів у документі;

 питома вага слів, відносно яких визначається релевантність, у загальній кількості слів

документу;

 час, як довго сторінка знаходиться в базі пошукового сервера. В Інтернет існує багато

сайтів, час життя яких складає близько місяця. Якщо ж сайт існує досить довго, це значить, що

його власник є досвідченим за даною темою і користувачу більше підійде сайт, що існує вже

кілька років, ніж той, який з’явився тиждень тому за цією ж темою;

 індекс цитування, який визначає частоту посилань на дану сторінку у базі пошукової

3. Пошуковий механізм, який користувачі використовують як інтерфейс для взаємодії з

базою даних. Різні пошукові механізми вибирають різні способи показу отриманого переліку –

деякі відображають лише посилання, інші виводять посилання з декількома першими

реченнями документу. Пошук необхідної інформації в Інтернет можна здійснювати різними способами:

 за допомогою пошукових машин за ключовим словом;

 за допомогою класифікаторів пошукових машин;

 за каталогами і колекціями посилань;

 за рейтингами;

 за конференціями, чатами;

 за сторінками посилань (“Links”) на тематичних сайтах;

 немережевими способами (поради друзів, знайомих; реклама в друкованих виданнях);

Перш ніж розпочати пошук інформації, спочатку необхідно визначити тип інформації.

Умовно можна виділити чотири типи інформації:

 загальна (наприклад, система кровообігу людини) – пошук здійснюється за допомогою

класифікаторів пошукових машин (наприклад, Яндекс www.Yandex.ru). Якщо відразу сайти з

необхідною інформацією не знайдено, то варто переглянути знайдені за класифікатором

каталоги і сторінки посилань (“Links”), що знаходяться на сайтах подібної тематики. Ці сайти

представлені в класифікаторі за темою і знайденим каталогом.

 менш загальна (наприклад, серце) – пошук здійснюється подібно до першого типу, але

переважно за каталогами і сторінками посилань.

 конкретна (наприклад, лівий шлуночок серця) – пошук здійснюється за ключовими

словами, що вводяться в рядок пошуку пошукових машин, каталогів, сторінок посилань.

 більш конкретна (наприклад, аортальний клапан) – пошук здійснюється за уточненими




Поделиться с друзьями:


Дата добавления: 2015-05-26; Просмотров: 405; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.