КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Поисковые системы
Интернет (англ. Internet — между сетей) — гигантская всемирная компьютерная сеть, объединяющая десятки тысяч сетей всего мира. Её назначение — обеспечить любому желающему постоянный доступ к любой информации. Интернет предлагает практически неограниченные информационные ресурсы, полезные сведения, учёбу, развлечения, возможность общения с компетентными людьми, услуги удалённого доступа, передачи файлов, электронной почты и многое другое. Интернет обеспечивает принципиально новый способ общения людей, не имеющий аналогов в мире. Благодаря сети стал доступен (бесплатно или за умеренную плату) огромный объём информации. Так, пользователь в любой стране может связаться с людьми, разделяющими его интересы, или получить ценные сведения в электронных библиотеках, даже если они находятся на другом конце света. Нужная информация окажется в его компьютере за считанные секунды, пройдя путь по длинной цепочке промежуточных компьютеров, по кабелям и по радио, через горы и моря, по дну океана и через спутник. Интернет финансируется правительствами, научными и образовательными учреждениями, коммерческими структурами и миллионами частных лиц во всех частях света, но никто конкретно не является её владельцем. Управляет сетью “Совет по архитектуре Интернет”, формируемый из приглашённых добровольцев. Сеть была создана в 1984 году, и сейчас ею пользуются примерно сорок миллионов человек. Интернет всё время изменяется, поскольку имеет много квалифицированных пользователей, которые пишут программы для себя, а затем распространяют их среди желающих. Постоянно появляются новые серверы, а существующие обновляют свой “репертуар”. Стремительно растут информационные потоки. Как можно связаться с Интернет? Самый распространенный и недорогой способ — посредством модема и телефонной линии. При этом используются три типа подключения, отличающиеся друг от друга по объёму услуг и цене:
При работе в сеансном режиме доступ к Интернет обычно покупается у провайдеров (англ. provide — предоставлять, обеспечивать) — фирм, предоставляющих доступ к некоторой части Интернет и поставляющих её пользователям разнообразные услуги. Доменный адрес (англ. domain — область), в отличие от цифрового, является символическим и легче запоминается человеком. Для удобства серверы объединяются в некие логические группы, которые называются «доменными зонами». Зоны эти могут быть как географическими, так и тематическими. Географическая доменнаязона (домен первого уровня) выделяется каждому государству, подключенных к сети. Обозначается она, как правило двумя буквами: - Ch – Китай; - Fr – Франция; - Ge - Германия; - Jp – Япония; - Ru – Россия; - Tw – Тайвань. - Ua – Украина; - Uk – Великобритания. «Тематическая» доменная зона, в отличие от географической, не привязана к какому-либо определенному региону. Здесь компьютеры группируются по типу учреждений, которые ими владеют. А доменный индекс обозначается тремя буквами и более. - Gov –Правительственное учреждение; - Com – Коммерческая организация; - Net – Организация, имеющая отношение к сетевым услугам; - Mil – Военное учреждение; - Int – международное учреждение; - Edu – Образовательное учреждение; - Shop – сетевой магазин; - Pro –Домен для «профессиональных учреждений»ж - Museum- Музей; - Соop- Объединение, корпорация; - Biz –Бизнес-проект; - Info – Ресурс, информационной направленности; - Aero – организация, относящаяся к авиаиндустрии - Name – Персональная страничка. Пример доменного адреса: barsuk.les.nora.ru. Здесь домен barsuk — имя реального компьютера, обладающего IP-адресом, домен les — имя группы, присвоившей имя этому компьютеру, домен nora — имя более крупной группы, присвоившей имя домену les, и т.д. В процессе передачи данных доменный адрес преобразуются в IP-адрес.
Основные сервисы системы Интернет. 1.World Wide Web (WWW, “Всемирная паутина”) — основной инструмент Интернет, её главный информационный сервис. World Wide Web (WWW, “Всемирная паутина”) — гипертекстовая, а точнее, гипермедийная информационная система поиска ресурсов Интернет и доступа к ним. Гипертекст — информационная структура, позволяющая устанавливать смысловые связи между элементами текста на экране компьютера таким образом, чтобы можно было легко осуществлять переходы от одного элемента к другому. На практике в гипертексте некоторые слова выделяют путем подчёркивания или окрашивания в другой цвет. Выделение слова говорит о наличии связи этого слова с некоторым документом, в котором тема, связанная с выделенным словом, рассматривается более подробно. Гипермедиа — это то, что получится, если в определении гипертекста заменить слово “текст” на “любые виды информации”: звук, графику, видео. Такие гипермедийные ссылки возможны, поскольку наряду с текстовой информацией можно связывать и любую другую двоичную информацию, например, закодированный звук или графику, Так, если программа отображает карту мира и если пользователь выбирает на этой карте с помощью мыши какой-либо континент, программа может тут же дать о нём графическую, звуковую и текстовую информацию. Система WWW построена на специальном протоколе передачи данных, который называется протоколом передачи гипертекста HTTP (читается “эйч-ти-ти-пи”, HyperText Transfer Protocol). Всё содержимое системы WWW состоит из WWW-страниц, называемых сайтами (англ. site — участок). WWW-cтраницы (cайты) — гипермедийные документы системы World Wide Web. Создаются с помощью языка разметки гипертекста HTML (Hypertext markup language). Язык HTML позволяет добавлять к текстовым документам специальные командные фрагменты — тэги (англ. tag — "этикетка, ярлык") таким образом, что становится возможным связывать с этими документами другие тексты, графику, звук и видео, задавать заголовки различных уровней, разделять текст на абзацы, строить таблицы и т.д. Например, заголовок документа может иметь такой вид: <TITLE> Клуб любителей персиков </TITLE> Одну WWW-страницу на самом деле обычно составляет набор гипермедийных документов, расположенных на одном сервере, переплетённых взаимными ссылками и связанных по смыслу (например, содержащих информацию об одном учебном заведении или об одном музее). Каждый документ страницы, в свою очередь, может содержать несколько экранных страниц текста и иллюстраций. Каждая WWW-страница имеет свой “титульный лист” (англ. “homepage”) — гипермедийный документ, содержащий ссылки на главные составные части страницы. Адреса “титульных листов” распространяются в Интернет в качестве адресов страниц. 2. Личные страницы — такие WWW-страницы, которые принадлежат не фирмам и не организациям, а отдельным людям. Содержание и оформление такой страницы зависит только от её автора. При работе с системой WWW пользователи имеют дело с программами-клиентами системы, Браузеры (англ. browse — листать, просматривать) — программы, с помощью которых пользователь организует диалог с системой WWW: просматривает WWW страницы, взаимодействует с WWW-cерверами и другими ресурсами в Интернет. азываемыми браузерами.Существуют сотни программ-браузеров. Самые популярные браузеры: Netscape Navigator и Microsoft Explorer. Браузеры WWW умеют взаимодействовать с любыми типами серверов, используя при этом их собственные протоколы. Информацию, полученную от любого сервера, браузер WWW выводит на экран в стандартной, удобной для восприятия форме. При этом переключения с одного протокола на другой для пользователя часто остаются незамеченными. 3. Программа удалённого доступа Telnet. Позволяет входить в другую вычислительную систему, работающую в Интернет, с помощью протокола TELNET. Эта программа состоит из двух компонент: программы-клиента, которая выполняется на компьютере-клиенте, и программы-сервера, которая выполняется на компьютере-сервере. Функции программы-клиента:
Функции программы-сервера:
Telnet — простое и поэтому универсальное средство связи в Интернет. 4. Программа пересылки файлов Ftp. Перемещает копии файлов с одного узла Интернет на другой в соответствии с протоколом FTP (File Transfer Protocol — “протокол передачи файлов”). При этом не имеет значения, где эти узлы расположены и как соединены между собой. Компьютеры, на которых есть файлы для общего пользования, называются FTP-серверами. В Интернет имеется более 10 Терабайт бесплатных файлов и программ. 5. Электронная почта (Electronic mail, англ. mail — почта, сокр. E-mail, читается “и-мэйл”). Служит для передачи текстовых сообщений в пределах Интернет, а также между другими сетями электронной почты. К тексту письма современные почтовые программы позволяют прикреплять звуковые и графические файлы, а также двоичные файлы — программы. При использовании электронной почты каждому абоненту присваивается уникальный почтовый адрес, формат которого имеет вид: <имя пользователя> @ < имя почтового сервера>. Например: earth@space.com, где earth — имя пользователя, space.com — имя компьютера, @ — разделительный символ “эт коммерческое”. Сообщения, поступающие по E-Mail, хранятся в специальном “почтовом” компьютере в выделенной для получателя области дисковой памяти (его “почтовом ящике”), откуда он может их выгрузить и прочитать с помощью специальной программы-клиента. Для отсылки сообщения нужно знать электронный адрес абонента. При качественной связи электронное письмо доходит в любую точку мира в течение нескольких минут. 6. Cистема телеконференций Usenet (от Users Network). Эта система организует коллективные обсуждения по различным направлениям, называемые телеконференциями. В каждой телеконференции проводится ряд дискуссий по конкретным темам. Сегодня Usenet имеет более десяти тысяч дискуссионных групп (NewsGroups) или телеконференций, каждая из которых посвящена определённой теме и является средством обмена мнениями. Телеконференции разбиты на несколько групп:
Внутри этих категорий существует иерархия. Так, например, rec.music.beatles — это дискуссия о творчестве Битлз, входящая в подгруппу “музыка” группы дискуссий по искусству. Существует большой выбор программ чтения телеконференций, которые формируют материал дискуссий в упорядоченном виде и предоставляют в распоряжение корреспондентов. Аналог телеконференций в других сетях — “электронная доска объявлений” (Bulletin Board System, BBS). 7. Системы информационного поиска сети Интернет В Интернет представлена информация на любые темы, которые только можно себе представить. Но найти в ней нужную информацию не так-то легко из-за того, что сеть по своей природе не имеет чёткой структуры. Поэтому для ориентировки в Интернет и быстрого получения свежей справочной информации разработаны системы поиска информации. Все системы поиска информации Интернет располагаются на специально выделенных компьютерах с мощными каналами связи. Ежеминутно они бесплатно обслуживают огромное количество клиентов. Поисковые системы можно разбить на два типа:
Системы, основанные на предметных каталогах. Используют базы данных, формируемые специалистами-редакторами, которые отбирают информацию, устанавливают связи для баз данных, организуют и снабжают данные в разных поисковых категориях перекрёстными ссылками. Кампании, владеющие предметными каталогами, непрерывно исследуют, описывают и каталогизируют содержимое WWW-cерверов и других сетевых ресурсов, разбросанных по всему миру. В результате этой работы клиенты Интернет имеют постоянно обновляющиеся иерархические (древовидные) каталоги, на верхнем уровне которых собраны самые общие категории, такие как “бизнес”, “наука”, “искусство” и т.п., а элементы самого нижнего уровня представляют собой ссылки на отдельные WWW-страницы и серверы вместе с кратким описанием их содержимого. Пример. Если нужно выяснить, какая в мире имеется информация о пище динозавров, достаточно спуститься по иерархии: Науки ==> Млекопитающие ==> Палеонтология ==> Динозавры ==> Пища. Каталоги, составленные людьми, более осмыслены, чем автоматические индексы. Их очень мало, так как их создание и поддержка требуют огромных затрат. Для примера рассмотрим самый популярный предметный каталог Yahoo!, который обладает одной из крупнейших баз данных. Имеет информационные базы для детей и подростков. Поддерживает два основных метода работы с каталогом — поиск по ключевым словам и поиск по иерархическому дереву разделов. Не принимает запросов на естественном языке. Автоматические индексы. Переоценить их трудно. Поиск по ключевым словам в одной базе данных, занимающий в худшем случае несколько секунд, принесёт те же результаты, что и обшаривание всех WWW-страниц во всей сети Интернет. Автоматический индекс состоит из трёх частей:
Все эти компоненты функционируют без вмешательства человека. К автоматическим индексам следует прибегать только тогда, когда ключевые слова точно известны, например, фамилия человека или несколько специфических терминов из соответствующей области. Индексы получают информацию из каждого отдельного узла, регистрируют и индексируют её и добавляют к своим базам данных.
Среди известных индексов выделяется: AltaVista — одна из самых мощных полностью автоматических поисковых систем. Обладает полнотекстовой базой данных. Выдаёт наибольшее количество ссылок. Проиндексировано 30 млн. страниц с 300 тысяч серверов и 4 млн. статей из телеконференций Usenet. За один день AltaVista обслуживает около 20 млн. запросов. В Интернет один и тот же узел сети может одновременно работать по нескольким протоколам. Поэтому крупные узлы сети сейчас обладают полным набором серверов, и к ним можно обращаться почти по любому из существующих протоколов. Позволяют находить, фильтровать, сортировать по релевантности (ожидаемости степени соответствия странички запросу пользователя): - Google, - Altavista, - Rambler, - Aport, - Yandex.
Дата добавления: 2014-01-07; Просмотров: 308; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |