Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Організація пошуку інформації в Internet




Система адресації в Internet

Існують два види адрес: ІР-адреса і доменна адреса. ІР - адреса складається із чотирьох груп десяткових цифр, розділених крапками, наприклад, 121.53.27.97. (вся адреса також закінчується крапкою). Кожний комп'ютер у мережі має унікальну ІР-адресу, але запам'ятовувати такі імена складно, тому користувачі звичайно використовують систему доменних імен (Domain Naming System). При цьому враховується фізична будова мережі, при якій кожна локальна мережа або окремий комп'ютер користувача являє собою простий домен, що входить у домен свого провайдера. Ті, у свою чергу, є складовими домену регіонального провайдера й т.д.

Повне доменне ім'я являє собою послідовність розділених крапкою імен доменів, причому крайнє праворуч ім'я – це ім'я домену самого верхнього рівня, що вказує на організаційну ознаку або країну, до якого відноситься домен. Перед ім'ям цього домену стоїть доменне ім'я регіону (області, міста), перед ним – доменне ім'я провайдера й т.д., аж до імені найпростішого домену. Кожний домен у повному імені є підмножиною того домену, ім'я якого указане праворуч від нього. Наприклад, повне доменне ім'я eko.atlas.dp.ua належить деякій локальній мережі, що перебуває на Україні (ім'я національного домену – ua), у Дніпропетровській області (ім'я регіонального домену – dp). Просте ім'я eko належить кінцевому користувачеві, ім'я atlas відповідає домену провайдера, за допомогою якого домен eko підключений до Internet.

Адреса, що вводиться у вікно броузера, крім доменного імені, містить ще деякі елементи. Як приклад розглянемо адресу Web - сторінки Національної бібліотеки України ім. В. И. Вернадського http://www.nbuv.gov.ua/db/. У цій адресі http:// указує на тип протоколу (саме цей протокол застосовується при перегляді Web – сторінок), www говорить про звертання до Web–сервера, nbuv.gov.ua являє собою доменне ім'я Web-сервера бібліотеки, а db – це ім'я конкретної Web–сторінки, розміщеної на сервері.


Значний обсяг наявної інформації в Internet призводить до необхідності використання спеціальних засобів пошуку. Розрізняють індексаційні і категорійні пошукові системи. Перші з них ще називають пошуковими машинами, другі – Web-каталогами.

Пошукова машина – це комплекс програмно-технічних засобів, які забезпечують систематичне скачування вмісту Web-серверів і індексацію наявних в них документів за певними ключовими словами. Спеціальні програми-спайдери (павуки) постійно переглядають Web-вузли, корегуючи власні бази даних. В подальшому з таких баз даних витягаються відповіді на запити користу­вачів. При цьому спеціальне програмне забезпечення виділяє з запиту користувача ключові слова, шукає їх в наявних індексах і пересилає користувачу адреси Web-сторінок, в яких зустрічаються подібні слова або вирази. Таким чином, забезпечується контекстний пошук інформації. Оперативність роботи пошукових машин забезпечується за рахунок швидкодіючої апаратури.

Web-каталог - це віртуальна бібліотека, яка складається з сукупності Web-сторінок, присвячених якійсь тематиці, із стислим описом джерел інформації та гіперпосиланнями на них. Із зростанням кількості посилань на одній сторінці з'являється необхідність її поділу, тобто введення нових підтем або категорій. У результаті розвитку такої системи з'являється деревоподібна структура каталогів, підкаталогів і т.д. Іноді всередині каталогу за певними критеріями відбираються кращі посилання за темою. Таким чином, завдяки Web-каталогам можна вести спрямований пошук необхідних даних по конкретній темі.

Суттєвою особливістю Web-каталогів є те, що вони створюються людьми, а не машинами, тому якість відбору інформації в них значно вища. Вважається, що Web-каталоги краще використовувати, коли не відома точна назва шуканого об’єкта. Коли ж необхідна інформація про конкретний об’єкт (особливо, не зовсім звичний), то пошукова машина це завдання виконає швидше.

Прагнення якомога ширше задовольнити потреби користувача призвело до того, що сучасні пошукові сервери часто поєднують в собі риси індексаційних і категорійних пошукових систем. При зверненні до такого сервера за його ім’ям у вікні відкривається сторінка, що містить каталоги з різних тем (наука, спорт, погода, новини тощо) й елементи для виконання контекстного пошуку. Крім того, пошукові сервери можуть надавати додаткові послуги: електронної пошти, тематичного пошуку зображень, музики, людей, новин тощо (див. приклад на рис. 12.1).

 

Рисунок 12.1 – Головне вікно пошукової системи <Мета>

 

Переглядаючи зміст каталогів, можна вести спрямований пошук необхідних даних. Для ведення контекстного пошуку в спеціальному полі головної сторінки пошукового сервера задається запит: ключові слова для пошуку або їх комбінація. У відповідь на запит пропонується список документів із посиланням на відповідну адресу з короткими фрагментами документа, які містять шукані слова або словосполучення (див. приклад на рис.12.2).

Як правило, список знайдених документів впорядкований за їх релевантністю. Релевантність документа – це міра того, наскільки точно той або інший документ відповідає критеріям, зазначеним у запиті користувача. Слід зазначити, що однозначних критеріїв встановлення релевантності немає, тому документ, визнаний пошуковою системою найрелевантнішим за формальними ознаками, не завжди є таким на думку користувача.

При проведенні контекстного пошуку слід враховувати, що якість пошуку і кількість знайдених документів залежать не тільки від обсягу бази даних пошукового сервера, але і від конкретного вигляду запиту. Тому слід зважено підходити до формулювання запиту, обираючи найбільш інформативні, загальновживані слова, які з найбільшою ймовірністю можуть бути на шуканих Web-сторінках.

 

Рисунок 12.2 – Контекстний пошук в середовищі пошукової системи Яндекс

 

Найбільш загальні правила конструювання запитів наведені в таблиці 12.1.

 

Таблиця 12.1 – Загальні правила конструювання запитів

 

Вид запиту Приклад Результат пошуку
Слово Комп’ютер Адреси Web-сторінок, на яких згадується дане слово
Кілька слів (словосполучення) Персональний комп’ютер Адреси Web-сторінок, на яких згадуються всі вказані слова. При цьому слова можуть бути розташовані в іншому порядку і не поруч. Деякі пошукові машини виводять сторінки, на яких є хоча б одне з вказаних слів
Словосполу­чення в лапках “ІВМ-сумісний комп’ютер” Адреси Web-сторінок, на яких зустрічається точно таке словосполучення
Кілька слів зі зна­­­­­­ка­­ми “плюс” (+) або “мінус” (-) Текстовий + редактор - Word Адреси Web-сторінок, на яких зустрічаються перше слово і всі слова, перед якими є зна­­­­­­к “плюс”, і не зустрічаються слова, перед якими є зна­­­­­­к “мінус” (у нашому прикладі – текстовий редактор але не Word)
Слово або сло­во­сполучення з використанням символів * R*ambler Адреси Web-сторінок, на яких зустрічаються слова, що розпочинаються на R і закінчуються символами ambler. Такий підхід використовується, коли користувач не впевнений в точному написанні слів

В той же час, слід мати на увазі, що на різних пошукових серверах можуть бути різні правила складання запитів. На Web-сторінці сервера зазвичай є довідка зі складання запиту, з якою доцільно познайомитися перед пошуком.

В багатьох випадках необхідне уточнення умов пошуку можна виконати за допомогою інструмента, який зазвичай називається “ розширений пошук ” (іноді – складний пошук або щось подібне). Доступ до нього з’являється після проведення простого пошуку і реалізується шляхом вказівки певного ряду уточнюючих параметрів (див. приклад на рис. 12.3).

 

 

Рисунок 12.3 – Розширений пошук в середовищі пошукової системи Google

 




Поделиться с друзьями:


Дата добавления: 2014-01-06; Просмотров: 521; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.013 сек.