Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Информационно-поисковые системы (ИПС)

Каталог и файл

Порт

URL - Uniform Resource Locator

HTML - HyperText Markup Language

 

HTML - это подмножество языка SGML (Standard Generalized Markup Language), который используется для публикации документов на разных платформах. Подобно SGML, HTML это текст в формате ASCII с добавлением ряда управляющих кодов. Эти коды транслируются клиентской программой (браузером) и результат отображается на экране.

Элементами HTML являются ссылки, списки, заголовки, изображения, элементы форм. Конечно, HTML ограниченный язык и не может сравниться с издательскими системами такими, например, как PageMaker, но он постоянно развивается.

 

 

Ссылка HTML документа должна содержать адрес требуемого документа. Для повышения гибкости и независимости от технологий доступа для WWW была разработана специальная адресная система, известная как URL (унифицированный указатель ресурсов). URL позволяет указывать не только имя документа, но и протокол доступа к нему. URL состоит из нескольких частей: протокол://домен: порт/каталог/файл

В адресе URL не должно быть пробелов.

Протокол наиболее важная частъ URL, это совокупность правил по которым происходит взаимодействие между сервером и клиентом. Для WWW основным протоколом является http.

 

Домен (Адрес сервера)

Доменное имя сервера (или IP адрес) в Интернет, отделяется от имени протокола двумя косыми чертами "//".

 

Обозначает целым положительным числом точку входа на сервер. Является необязательным параметром, если не указан, то принимается равным 80.

 

Место расположения адресуемого ресурса. Имена каталогов и файлов должны соответствовать синтаксису Unix[27], т.е. подкаталоги разделяются прямой косой чертой "/"; большие и маленькие буквы различаются; если имя начинается с тильды "~", то это корневой каталог зарегистрированного пользователя; имя каталога должно оканчиваться косой чертой "/".

 

Информационно-поисковые системы представляет собой функциональную систему, предназначенную для хранения и поиска информации.

Поиск информации - это процесс отыскивания в массиве документов, соответствующих поступившему запросу.

Системы часто разделяют на фактографические и документальны. Фактографические системы в ответ на конкретные запросы о данных выдают конкретные ответы, содержащие по мере возможности, только действительно запрашиваемые данные, факты. Что же касается документальных систем, то они в ответ на запросы выдают подборки документов.

Документальная информационно-поисковая система не информирует пользователя о предмете запроса в том смысле, что она не изменяет его знания по этому предмету. Она информирует его лишь о наличии (или отсутствии) документов, имеющих отношение к его запросу, и о том, где эти документы можно найти.

Хотя эти два типа информационных систем схожи в том отношении, что ответы, которых ждут от фактографических систем, могут быть обнаружены в подборках документов, полученных в документальной системе, с точки зрения обработки эти системы совершенно различны. Документальный и фактографический поиск имеют совершенно различную организацию хранения, манипуляции со структурами данных и процессы обработки при выполнении различных операций.

Информационно-поисковые системы следует отличать от системы поиска данных (традиционно их называют базами данных), которые осуществляют поиск и выдачу пользователю фактических значений данных, как правило, в буквенной либо цифровой форме. Очевидно, что поиск данных есть частный случай поиска документов, при котором "документами" являются отдельные значения показателей либо текстовые фрагменты. В системах поиска данных информация представляется в виде таблиц. Фактически поиск данных сводиться к просмотру таблиц и выбору нужных значений в соответствии с заданными критериями поиска, которые формируются с помощью специального формализованного языка запросов (например, SQL - Structured Query Language).

В информационно-поисковых системах язык запросов менее формализован, как правило, в нем определены только операции, с помощью которых могут связываться между собой ключевые слова, содержащиеся в запросе.

Автоматизированная информационно-поисковая система (АИПС) является сложной информационной системой, включающей информационную базу, лингвистические, математические и технические компоненты.

Элементами реальной информационно-поисковые системы являются:

массив документов (текстов, записей), выступающих в качестве объекта поиска;

информационно-поисковый язык (ИПЯ) - искусственный язык, предназначенный для описания содержания и формы документов и (или) запросов для осуществления поиска;

правила индексирования (алгоритмы, методы), следуя которым производится описание средствами ИПЯ документов и запросов (перевод их с естественного языка на информационно-поисковый). В результате индексирования документа получается поисковый образ документа (ПОД), а при индексировании запроса - поисковые предписания (ПП);

правила (алгоритмы, методы) поиска документов, соответствующих запросу, которые задаются в виде критерия соответствия (критерия выдачи);

технические средства, с помощью которых реализуется ИПС, т.е. осуществляющие хранение и поиск информации;

обслуживающий персонал - индексаторы и технические работники, обеспечивающие обработку и ввод в систему документов, а также операторы информационно-поисковой системы, производящие поиск информации и выдачу ее потребителю (в качестве оператора может выступать и сам потребитель информации).

Информационно-поисковый язык, правила индексирования и поиска зависят от состава и тематики документов.

Все элементы информационно-поисковые системы могут быть разделены на две основные составляющие:

семантические[28] средства - ИПЯ, методы индексирования и поиска;

материальные составляющие (массивы документов, технические средства, персонал).

Совокупность информационно-поискового языка, методов индексирования и поиска принято в теории информационно-поисковых систем называть абстрактной информационно-поисковой системой. С помощью семантических средств информационно-поисковые системы осуществляет смысловые операции обработки документов, запросов и отбор документов, подлежащих выдаче.

Наиболее известными поисковыми системами в Internet являются: http://all.by, http://come.to/belarus http://www.rambler.ru, http://www.aport.ru, http://www.yandex.ru, http://www.yahoo.com, http://uk.altavista.com.

 

<== предыдущая лекция | следующая лекция ==>
HTTP - HyperText Transfer Protocol | История Internet
Поделиться с друзьями:


Дата добавления: 2014-01-05; Просмотров: 775; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.013 сек.