Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Технология поиска информации в Интернете и профессиональных базах




Вопросы эффективности поиска информации в Интернете и профессиональных базах

Информационные ресурсы Интернета и имеющиеся в среде Интер­нет поисковые средства обладают определенной спецификой, которая оказывает существенное влияние на эффективность поиска в этой среде.

Основными поисковыми средствами в Интернете являются поисковые системы и каталоги. Поисковые системы состоят из трех частей:

• робот — программа, которая посещает web-серверы, считывает и индексирует полностью или частично их содержимое и далее следует по ссылкам, найденным на сервере. Просмотры серверов осуществляются периодически, например раз в месяц, раз в две недели;

• индексные массивы и копии текстов просмотренных страниц, хранящиеся в поисковой системе;

• программа, которая, просматривая в соответствии с запросом пользователя индексные массивы, отбирает и выдает потребите­лю найденные документы.

В каталогах имеются иерархические тематические рубрики.

Пользователь ищет информацию в каталоге вручную, ис­пользуя рубрики.

В связи с тем что в средствах поиска в Интернете не используются информационно-поисковые языки, на которых могли бы быть описа­ны исходные документы и запросы, полнота поиска в Интернете с уче­том указанных выше поисковых средств будет значительно ниже, чем в документальных системах, построенных на базе информационно-поисковых языков.

У каждой поисковой машины свой процент индексирования доку­ментов и своя стратегия выбора — какие из ресурсов индексировать. Анализ доли документов, заиндексированных крупнейшими зарубеж­ными поисковыми системами, от общего числа документов в Интер­нете, проведенный в 1999 г., показал, что доля заиндексированных документов у лидеров в этой области не превышает 30 %. Следует отметить, что количество документов в Интернете значительно уве­личивается с каждым годом, при этом доля просмотренных и заиндексированных документов уменьшается.

Информационные ресурсы Интернета делятся на «видимую» и «не­видимую части сайтов.

«Видимая» часть сайтов — это та часть, которая обрабатывается поисковыми системами и индексируется. «Невидимая» — часть сайтов, которая не предназначена для обработки поисковыми системами. Американская фирма BrightPlanet разработала программное обеспечение по исследованию «невидимой» части сайтов. Полученные результаты показывают, что число документов «невидимой» части превышает более чем в 500 раз число документов, относящихся к «видимой» части.

 

Наилучшим вариантом работы с информационными ресурсами Интернета является вариант, когда пользователь знает адрес сайта и получает возможность ознакомиться с его содержимым. Адрес сайта может быть получен из различных справочников, например желтых страниц Интернета, рекламных материалов и других источников. На сайт можно прийти по гиперссылкам, просматривая другие сайты.

Опытный специалист в области информации всегда будет иметь список, каталог адресов самых важных для ведения бизнеса фирмы сайтов. В этом случае необходимо лишь отслеживать появление новых сайтов, информация в которых может представлять интерес.

Если пользователь исследует новую проблему в бизнесе, ищет информацию среди ресурсов, которые он еще не освоил, одним из основных методов является использование поисковых машин и каталогов.

В этом случае может быть предложена следующая технология подготовки и проведения поиска.

1. Определение общей направленности запроса, его содержания.

2. Определение географических регионов поиска. В первую очередь для практических задач ценность информационного ресурса может зависеть от его географического расположения.

3. Отбор поисковых машин. Осуществляется отбор и устанавливается последовательность использования поисковых машин в соответствии с убыванием ожидаемой эффективности поиска в каждой из машин. Качество выполнения этого этапа будет зависеть от опыта работы пользователя с поисковыми машинами.

4. Составление запросов к поисковым машинам. Это наиболее сложный этап. Для эффективного использования поисковых машин запрос составляется так, чтобы область поиска была сужена в максимальной степени. Предпочтение должно отдаваться не одному расширенному, а нескольким узким запросам. Необходимо смоделировать, представить себе, как может выглядеть искомая информация. По ключевым словам следует составить тезаурус. Для этого необходимо хорошее знание языка, на котором работает пользователь, и специфических терминов предметной области.

5. Выполнение запроса и его уточнение. Составленный запрос передается на обработку. Анализ полученных результатов позволяет корректировать запрос, чаще всего с целью сужения области поиска. Поиск деловой информации в Интернете – это творческий процесс, требующий глубоких знаний в области информатики, лингвистики, принципов построения информационных и поисковых ресурсов Интернета.

 

Выводы

Подводя итоги рассмотрению этапов развития мирового рынка информационных услуг и состояния этого рынка в настоящее время, необходимо отметить следующие характерные черты рынка деловой информации, обслуживающего мировой и российский бизнес.

1: Мировой рынок деловой информации представлен более чем 7 тыс. крупных информационных агентств, в полном объеме обеспечивающих разнообразные потребности в деловой информации различных видов бизнеса. Эти агентства предоставля­ют услуги доступа к 13,5 тыс. информационных баз, содержащих биржевую и финансовую информацию, сведения о фирмах, товарах, услугах, рынках сбыта„статистическую, научно-техническую, правовую информацию и деловые новости. К большинству баз имеется режим непосредственного доступа из любой точки мира.

2. Наряду с собранной из различных источников информацией об интересующей пользователя фирме ряд информационных агентств предоставляет потребителям собственную оценку финансового состояния этой фирмы, что крайне важно при установлении партнерских отношений или рассмотрении вопроса о выдаче кредита.

3. Основная информация из профессиональных баз (свыше 85 %) предоставляется на коммерческой основе. Несмотря на относительно высокие цены, спрос на деловую информацию постоянно растет. За пять лет, с 1992 по 1997 г., доходы от продаж информации через Интернет возросли в 28 раз и, по мнению экспертов, в ближайшее время должны приблизиться к 20 млрд. долл. США.

4. Информационные ресурсы стали одним из важнейших ресурсов государств. США — лидер мировой экономики — формирует более 70 % мировых ресурсов деловой информации.

5. Бизнесмены в развитых странах стараются предоставить информацию о своей фирме в максимально возможном объеме. Отсутствие или недостаток информации о фирме будет, как правило, преградой на пути делового сотрудничества с такой фирмой.

 




Поделиться с друзьями:


Дата добавления: 2014-12-08; Просмотров: 4438; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.