Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Распределенная гипертекстовая информационная система WWW




Онлайновые технологии – средства коммуникации сообщений в сетевом информационном пространстве, обеспечивающие синхронный обмен информацией в реальном времени, т. е. в данном случае ПК пользователя постоянно соединен с сетью Интернет.

Оффлайновые технологии – средства электронной коммуникации сообщений в сетевом информационном пространстве, допускающие существенную асинхронность в обмене данными и сообщениями, когда ПК пользователя подключается к сети Интернет только на время передачи (приема) сообщения.

После установления канала связи между компьютерами программа приложения может направлять в него данные непрерывным потоком как на стандартное устройство ввода-вывода. Протокол TCP разбивает данные на пакеты, после чего каждый пакет маркируется с целью последующей правильной сборки документа на компьютере получателя. Протокол ТСР обеспечивает также подтверждение факта получения пакетов принимающей стороной и повторную передачу пакетов, если в этом будет необходимость. Кроме того, в протоколе TCP реализованы специальные механизмы регулирования загрузки сети и устранения в ней заторов.

Для подключения к Интернету необходим ISP(Internet Service Provider – поставщик услуг Интернета) или провайдер – это организация или частное лицо, которые ведут (поддерживают) информационные ресурсы. Провайдер предоставляет клиентам доступ к Интернету по коммуникационным линиям, а также услуги, такие как аренда пространства на сервере и создание Web-страниц.

Обращаясь к провайдеру, необходимо указать сервисы и потребность в полосе пропускания. После заключения контракта ISP обеспечивает подключение к сети, рекомендует необходимое дополнительное оборудование и сообщает пользователю:

· IP-адрес,

· маску подсети (имя - login и пароль - password),

· имена серверов.

 

2. Адресация компьютеров в сетях [3,4]

 

Каждый компьютер, работающий в сети на основе протокола TCP/IP, должен иметь собственный IP-адрес. IP-адрес может быть постоянным (статическим) или временным (динамическим). Статический IP-адрес назначается вручную администратором. Однако в больших сетях, где состав сети часто изменяется, бывает неудобно назначать каждому компьютеру IP-адрес вручную. Во-первых, это отнимает время, а во-вторых, легко запутаться с большим количеством выданных IP-адресов. Эта проблема решается динамическим выделением IP-адресов пользователям, только на время подключения их к сети в данный момент. Для динамического назначения IP-адресов используется служба DHCP -Dynamic Host Configuration Protocol. Служба DHCP используется для динамической настройки IP-адресов компьютеров сети.

При подключении к сети компьютера пользователя, он посылает запрос на DHCP-север. DHCP-сервер ищет в своей базе свободный в данный момент IP-адрес, и передает его клиенту вместе с другими настройками сети.

Суть протокола IP состоит в том, что каждый компьютер сети (hosty) имеет уникальный IP-адрес, состоящий из 4 байт, например 144. 206.160.32. Так как байт содержит 256 значений, то количество возможных адресов составляет порядка 2 миллиардов. По этим адресам каждый компьютер определяет, кому из ближайших соседей можно переслать ТСР - пакет, чтобы он оказался «ближе» к получателю. В результате конечного числа пересылок пакет достигает адресата. Важными элементами в протоколах транспортного уровня являются понятия «порт» и «сокет».

Порт в протоколах транспортного уровня – это не физически существующий порт ввода-вывода (как, например, последовательный порт СОМ1), а "виртуальный" порт, который программно изолирует данные, передаваемые по одному порту, от данных, передаваемых по другому порту. Нумерация портов осуществляется от 0 до 65535. Например, стандартным портом для Web-сервера является порт 80.

Сокет (socket) характеризует сетевое соединение между двумя сетевыми приложениями, которое включает в себя:

· IP-адрес и номер порта локальной машины,

· IP-адрес и номер порта удаленной машины.

Сокет задает сетевое соединение однозначно. Если рассмотреть два различных соединения, то в них отличаются значения хотя бы одного из приведенных выше параметров. Так, к определенному порту сервера могут одновременно подключиться два приложения, работающие с различных портов на машине пользователя.

Пользоваться числовыми адресами достаточно трудно, поэтому для облегчения задачи существует специальная система имен доменов DNS - Domain Name System. Служба DNS отвечает за преобразование URL-адресов (типа www.microsoft.com) в IP-адреса. Это более удобная для восприятия человеком система осмысленных доменных имен (например, TUT.BY, MAIL.RU, MICROSOFT.COM). Доменное имя – это имя группы рабочих станций и серверов в одной сети, уникальный идентификатор, который назначается определенному IP-адресу. Оно включает суффикс домена верхнего уровня и имена узлов (доменов) нижних уровней. Перевод доменных имен в связанные с ними IP-адреса осуществляют серверы DNS, после чего сообщение передается по IP-адресу. Домен – самая крупная структурная единица Интернет. Обычно домен – страна или другая большая структура, отражающая различные области интересов или ответственности. Организовать группы компьютеров в Интернет с помощью иерархии доменов позволяет специальная сервисная служба Domain Name Service в DNS.

Домены в Интернете различаются по уровням иерархии, например в imb.by imb – домен второго уровня, а в by – верхнего. Домены верхнего уровня классифицируют организации по типам (используется в США): gov (government) – государственные, edu (educational) – образовательные, org (organization) – организации, net – главные центры поддержки сети, mil – военные группы, int – международные, com (commercial) – коммерческие, <country code> (любая страна, географическая единица).

Чтобы присоединиться к доменам (кроме последнего), необходимо иметь аргументы, соответствующие предъявляемым строгим требованиям. Включение в домен com гораздо проще, однако все-таки нужно правильно определить, к какому из доменов верхнего уровня относится организация.

Имя домена должно иметь смысл, легко запоминаться и вводиться с клавиатуры, а также не использоваться другой организацией на Интернете. Самым главным является корневой домен InterNIC. Домены первого уровня назначаются для каждой страны: BY, RU, US, LT и т. д.

Выбранное имя регистрируется. Обычно для этого из области регистрации Web-страницы InterNIC получают текстовый бланк и заполняют его в любом редакторе или текстовом процессоре либо заполняют специальную форму WWW, используя программу просмотра Web. При этом необходимо сообщить InterNIC некоторые данные о себе. Во-первых, кто будет контактировать с ней по административным, техническим или финансовым вопросам, касающимся домена, во-вторых, имена и IP-адреса серверов DNS, поддерживающих домен. Заполненная форма отсылается электронной почтой в InterNIC. Через некоторое время поступают два ответа: первый – подтверждение получения запроса, второй – разрешение на использование имени домена.

WWW – World Wide Web, что рассматривается как «Всемирная паутина». Официальное определение World Wide Web звучит как мировая виртуальная файловая система – «широкомасштабная гипермедиа среда, ориентированная на предоставление универсального доступа к документам». Основное назначение WWW является предоставление пользователям сетевых компьютеров достаточно простого доступа к самой разнообразной информации. Используя популярный программный интерфейс, проект WWW изменил процесс просмотра и создания информации. Идея заключается в том, что по всему миру хаотично разбросаны тысячи информационных Web-серверов, на которых информация хранится в виде документов – Web-страниц (HTML-страниц). Любую машину, подключенную к Интернет в режиме on-line, можно преобразовать в Web-сервер с определенной информацией. С любого компьютера, подключенного к Интернет, можно свободно установить сетевое соединение с таким сервером и получать от него информацию.

Система включает следующие базовые элементы:

– язык гипертекстовой разметки документов HTML (Hyper Text Markup Language);

– универсальный способ адресации ресурсов в сети URL (Universal Resource Locator);

– протокол обмена гипертекстовой информацией HTTP (Hyper Text Transfer Protocol), а также защищенный протокол Secure Sockets Layer (SSL), предназначенный для обеспечения конфиденциальности работы пользователя Интернет с тем или иным Web-сервером;

– универсальный интерфейс шлюзов CGI (Common Gateway Interface).

Информационный WWW-сервер использует гипертекстовую технологию, в которой для записи документов в гипертексте используется специальный язык гипертекстовой разметки HTML, позволяющий управлять шрифтами, отступами, вставлять цветные иллюстрации, поддерживать вывод звука и анимации. В стандарт языка также входит поддержка математических формул.

Внешне гипертекст отличается от обычного текста тем, что часть слов или целые строки в нем, будучи выделены особым образом (шрифтом или цветом), оказываются чувствительными к появлению на них указателя манипулятора «мышь». При попадании на такую область текста указатель (часто стрелочка) изменяет первоначальный вид. Щелчок «мыши» в таком положении приводит к инициированию какого-либо события, чаще всего к загрузке в программу просмотра нового документа, привязанного так называемой гипертекстовой ссылкой к выделенной строке текста. В результате у пользователя появляется возможность самому выбирать порядок просмотра тех или иных страниц, двигаясь по перемежающимся между собой нитям – паутинкам ссылок. Если при этом компьютер подключен к глобальной сети Интернет, то в сценарий просмотра могут входить ресурсы всего мира, доступ к которым происходит по протоколу работы с гипертекстом, или HTTP. После сказанного становится понятным представление об этих ресурсах как о всемирной паутине.

Взаимодействие клиента и Web-сервера осуществляется с помощью специальной программы просмотра Web-страниц, называемой броузером (от англ. browse – просматривать). Наиболее распространены броузеры Internet Explorer (Microsoft) и Netscape Navigator (Netscape Communications) – близкие по своим возможностям многопротокольные графические интерфейсы доступа к WWW и другим ресурсам сети.

Для удобства ввода информации предусмотрены специальные формы, меню. Программы просмотра позволяют получать доступ не только к WWW-серверам, но и к другим службам Интернет. С их помощью можно путешествовать по Gopher-серверам, искать информацию в WAIS-базах, получать файлы с файловых серверов по протоколу FTP. Поддерживается протокол обмена сетевыми новостями Usenet NNTP.

Одно из главных преимуществ WWW над другими средствами поиска и передачи информации – «много образность»: в WWW можно увидеть на одной странице одновременно текст и изображение, звук и анимацию.

WWW работает по принципу клиент-сервер, точнее, клиент-серверы: существует множество серверов, которые по запросу клиента возвращают ему гипермедиа документ – документ, состоящий из частей с разнообразным представлением информации, в котором каждый элемент может являться ссылкой на другой документ или его часть.

Организация информации в Web-узле может быть различной.Документы, предназначенные для экрана компьютера, могут содержать большое количество различных средств отображения информации, включая текст, числа, иллюстрации или фотографии, мультипликацию и цифровой аудиовизуальный материал, поэтому хорошо спроектированный интерфейс – основа проектирования WWW-документов и систем.

Диапазон способов организации узлов Web весьма широк: от узлов, имеющих строгую линейную структуру, до узлов, у которых вообще нет четкой структуры. Обычно страницы располагаются в иерархическом или линейном порядке, а также в виде паутины.

Содержание Web-страницы описывается на языке HTML в виде команд. Команды в тексте HTML-документа называются тегами. Тег заключается в угловые скобки, например, <TITLE> или <В>. Для более сложных тегов характерно наличие атрибутов, которые могут иметь конкретные значения, определяющие функции тега, например: <Р ALIGN= «JUSTIFY»>. В данном случае <Р> – это тег, ALIGN – один из его атрибутов, a «JUSTIFY» – значение этого атрибута (данный тег определяет начало абзаца, атрибут ALIGN определяет способ выравнивания текста в абзаце, значение «JUSTIFY» задает выравнивание по ширине).

В настоящее время широко применяются разновидности языка HTML, например:

Язык XML (eXtensible Markup Language) – расширяемый язык гипертекстовой разметки, используемый для создания и размещения документов в среде WWW. Язык XML использует структуру тегов и определяет содержание гипертекстового документа, позволяет автоматизировать обмен данными, не прибегая к существенному объему программирования;

Язык WML (Wireless Markup Language) – язык гипертекстовой разметки, предназначенный для отображения информации на маленьком экране мобильного телефона. Для разработки приложений WML позволяет использовать языки XML и HTML.

Универсальный адрес ресурса (URL).

Для того чтобы получить информацию из Интернета, необходимо знать адрес, по которому она расположена. Универсальный адрес ресурса (URL) – это адрес в системе WWW, с помощью которого однозначно определяется любой документ. В общем случае универсальный адрес ресурса имеет следующий формат: протокол://компьютер/путь.

Протокол – здесь указывается символ протокола прикладного уровня. Основным протоколом в системе WWW является HTTP – протокол передачи гипертекста, поэтому большая часть адресов начинается следующим образом: http://. Тем не менее, могут быть использованы и другие протоколы передачи данных, например протокол передачи файлов – FTP или протокол передачи данных в формате Gopher. Тогда на первое место в универсальном адресе ресурса ставится название используемого протокола. Например:

ftp:// или gopher://

Компьютер – это адрес сервера, с которым необходимо установить соединение. Может использоваться как IP-адрес, так и имя сервера в доменной системе имен. Например:

http://www.econ.pu.ru или ftp://194.85.120.66.

Адреса большей части серверов в системе World Wide Web начинаются с префикса www, который используется просто как удобное обозначение того, что на данном компьютере запущен Web-сервер.

Путь представляет собой точное указание месторасположения документа на Web-сервере. Это может быть название директории и файла, как в следующем примере:

http://www.econ.pu.ru/info/history/iubilee.htm

Если ввести в строке «адрес» броузера данный адрес, броузер установит связь с компьютером www.econ.pu.ru по протоколу HTTP и запросит у него документ с названием jubilee.htm из каталога /info/history.

Последняя часть универсального адреса ресурса может включать дополнительную информацию, которую обычно используют для того, чтобы передать Web-серверу параметры запроса пользователя в интерактивных страницах, а также путь и имя той программы на сервере, которая этот запрос будет обрабатывать. Например:

http://www.econ.pu.ru/fs/cbin/main.bat?obet=kit&ida=4

Получив такой запрос, Web-сервер попытается найти программу main.bat в каталоге /fs/cbin/, запустить ее и передать ей параметры obet и ida с соответствующими значениями kit и 4.

В современных версиях браузеров нет необходимости указывать имя протокола в начале каждого адреса ресурса. Если имя протокола не указано, то браузер попытается самостоятельно определить, какой протокол необходимо использовать. Если не указано имя файла, а только каталог, в котором он должен находиться, то пользователю будет передан файл, который администратор Web-сервера определил как файл, передаваемый по умолчанию. Обычно таковым является файл с названием index.htm (index.html) или defautt.htm (default.html). Если в каталоге нет файла по умолчанию, то будет выдано сообщение об ошибке.

Для указания документов на одном и том же сервере в HTML-документах часто используется сокращенное обозначение, называемое относительным адресом. Перед отправкой запроса на Web-сервер броузер преобразует относительный адрес в полный. Например, если документ по адресу http://www.econ.pu.ru/info/index.htm содержит ссылку на документ history/jublilee.htm, то броузер преобразует эту ссылку в http://www.econ.pu.ru/info/history/jubilee.htm.

Основным протоколом является HTTP (Hyper Text Transfer Protocol) – протокол передачи гипертекста. Он используется в службе WWW для передачи HTML-страниц между серверами и браузерами и работает на 80 порту. При работе по этому протоколу каждый элемент HTML-страницы загружается отдельно, причем соединение между загрузками прерывается и никакой информации о соединении не сохраняется. В данном случае информация к пользователям поступает порциями в порядке общей очереди с целью предотвращения ситуации, когда одна машина получает большое количество данных, а все остальные ждут окончания процесса.

Протокол HTTP позволяет установить соединение между клиентом и сервером. Соединение сохраняется только на время обработки сервером запросов клиента. Запрос клиента и ответ сервера образуют так называемую транзакцию.

Обмен данными по протоколу HTTP происходит следующим образом. Клиент устанавливает соединение с сервером по указанному номеру порта. Если в качестве клиента выступает браузер, то номер порта указывается в URL-запросе. Если номер не указан, то по умолчанию используется порт 80. Затем клиент посылает запрос на документ, указывая HTTP-команду, адрес документа и номер версии HTTP. Например:

GET /index.html НТТР/1.0

Команды HTTP-клиента принято называть методами. Метод сообщает серверу о цели запроса. В данном примере используется метод GET, который запрашивает файл index.html, расположенный в корневом каталоге сервера, используя протокол HTTP версии 1.0. Другими, часто используемыми методами являются методы HEAD и POST. Метод HEAD аналогичен GET, но запрашивает не содержимое файла, а информацию о нем. Метод POST позволяет поместить файл на сервере. Кроме того, клиент может послать информацию, называемую заголовком, чтобы сообщить серверу дополнительную информацию о себе. В качестве такой информации могут выступать имя и номер версии клиента, информация о типах данных, которые предпочтительны для клиента, и др.

 




Поделиться с друзьями:


Дата добавления: 2013-12-13; Просмотров: 939; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.