Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Технологии доступа к информационным ресурсам




11.03.2013

Требуется получить разнообразную информацию о заемщике и окружении. Технология сбора информации может быть организована по 2 основным схемам:

1. Централизованная. Выделяются подразделения, которым дается задача – выделение информации из внешних источников – информационные (информационно-аналитические). Такие подразделения создают БД, которая систематизирует и выдает информацию.

2. Децентрализованная. Сбор необходимых сведений собирает каждое подразделение.

Чаще используют централизованную схему.

Децентрализованная – это материальные затраты, а с ними эффективнее работать в централизованной схеме. Удобнее работать с БД. Первая схема – более профессиональная.

Спрос, потребности, к каким группам сведений есть:

1. Сведения о состоянии мирового и региональных финансовых рынков

2. Сведения, характеризующие рынки сбыта

3. Сведения, характеризующие возможны партнеров (данные о компании и ее деятельности)

4. Сведения о степени коммерческих и финансовых рисках в различных странах и регионов мира

5. Сведения о финансовом состоянии компании различных стран

6. Сведения о продукции и услугах компании в различных странах

7. Сведения о рынках недвижимости

8. Сведения о патентах и новейших технологиях

9. Сведения о законодательстве различных стран мира

10. Отчеты аудиторских фирм

11. Данные по внешним торговлям по различным странам

12. Сведения о состоянии страхового рынка

13. Официальная политическая и экономическая информация по странам

14. Деловые новости

Информация о внешней среде – основа информации о компании.

Есть спрос на такую информацию. Умение ее собирать и обрабатывать (структурировать - понимать смысл данных) пользуется спросом.

Современные технологии (развитие их) стимулирует спрос.

Основные вопросы (задачи) при работе с ИР:

· Какие ИР выбрать?

· Как извлечь из ИР необходимые сведенья?

· Как оценивать найденную информацию?

Интернет – образование, за которое никто не несет ответственности.

В основу процесса отбора кладется анализ мета или инфра-информации. Это сверх – больше чего-то ординарного. Необходимо начинать поиск с мета-информации (более обобщенная информация).

Gale directory of database – 1993. Слияние «Computer reader database» ….

Около 20 тысяч баз данных представлено в этой мета-сводке. Около 4 тысяч производителей БД и 2,5 тысячи онлайн-служб БД.

В России тоже есть попытка следовать этим тенденциям – Информ Регистр - inforeg.ru – электронный каталог по итогам добровольной регистрации российских БД.

ООО «Международное бюро информации и телекоммуникации»: российская энциклопедия информации и телекоммуникации, веб-каталог деловой информации, веб-каталог бизнес ресурсов. Оказывает информационно-поисковые, аналитические и информационные услуги.

Ни одна из реферативных БД не может претендовать на полноту информации. Степень охвата может быть больше или меньше.

Далее: оценка ИР.

· Из каких источников формируется ИР (из каких БД), их количество

· Периодичность обновления информации

· Возможные варианты подписки и стоимость доступа

· Пользовательский интерфейс (поисковые инструменты)

· Полнота поиска

Следующий шаг: рассмотрение содержательного наполнения ИР. То есть географическое покрытие, за какое время собраны сведений, глубина ретроспективы, возможности применять формализованный поиск.

Виды доступа к ресурсам:

· Разовое обращение

· Абонементный доступ (на период времени)

Как извлекать информацию.

Формы представления информации:

· Фактографические – численный вид.

· Документальные – закодирован числами, но документ представлен на естественном языке.

В соответствии с типами может быть поиск:

· По тексту

· При помощи каталога (каталог – оглавление файлов, которые имеют иерархическую структуру)

Независимо от поискового инструмента, процесс поиска можно разбить на 4 этапа:

1. Формулировка задачи. Цель – определение информационных потребностей. Потребностью может быть документ или информация, посвященная определенному кругу вопросов. Определение потребности влияет на методы поиска.

2. Выбор ИР. Из каких источников можно получить информацию. Есть внешние ограничения – получение доступа.

3. Построение запроса. Для документальной информационной системы: выбор тематики (рублики), разбиение интересующего вопроса на понятия, затем связывание понятий между собой логическими операциями (обычно ориентируется на булеву алгебру логики), вариация написания слов.

4. Оценка результатов поиска. Зависит от целей, которые были поставлены. Наиболее общие оценки: количество найденных документов, источники найденных документов, оперативность информации. По оценкам можно скорректировать запрос. Специалисты составляют несколько запросов, т.к. один запрос может быть некорректным.

Информационный поиск – алгоритм поиска необходимой информации.

Технологии доступа к ресурсам Интернет.

Интернет – система компьютерных сетей, построенные на базе протокола IP. Никем не регулируется. Что лежит в основе Интернета?

Форма представления информации в Интернете – гипертекстовая форма. В узлах сети пользователь сталкивается с доступом к единице гипертекстового документа – странице. Веб-страница – электронный документ, содержащий текстовую, аудио, видео-информация. Связанный набор веб-страниц – это веб-сайт (узел сети).

Веб-портал возник, когда увеличилось количество сервисов (услуг). Первый сервис – навигация по гипертекстовому документу.

В ИР, представленных в Интернете понятие «портал» используется для обозначения дополнительных сервисов, таких как перехода от одного сайта к другому.

Поисковый сервис – один из видов дополнительного сервиса. Навигация

Используются поисковые машины – ПО, которое позволяет найти документ в Интернете по запросу пользователя. Все программы строятся примерно по одному принципу и состоят из трех основных частей:

1. Робот-паук - некий механизм, заменяющий человека. Он перемещается по компьютерной сети (паутине). Основная функция – индексирования документов, лежащий в зоне ответственности, найденные документы ввести в свою базу данных.

2. База данных. Главная часть - индекс. Это хранилища, где присваивается номер объекта….

3. По запросу пользователя перебирает хранилище индексов – коротких адресов и подбирает ответ на запрос пользователя с помощью индексного хранилища.

Организация индекса – некоторое ранжирование – как разложить инструмент, чтобы как можно быстрее получить нужное.

Общие принципы организации принципа ранжирования (индекса) в поисковых машинах:

1. Количество слов запроса в тексте документа

2. Теги, в которых эти слова располагаются

Тег – это указатель. Указывает на то, как должен выглядеть текст. Указание человека, пользователя, который делал запрос, как слова должны располагаться.

3. Местоположение слов в документе

4. Удельный вес искомых слов

5. Время нахождения той или иной страницы в базе поискового сервера

Кэширование

Хэширование

6. Индекс цитируемости – как много ссылок на данную страницу идет с других страниц

Ограничения, которые имею поисковые машины (глубина поиска):

1. Топология Интернета такова, что поисковые машины могут охватить не больше трети всех узлов Интернета.

· Центральное ядро образуют такие страницы, с которых можно попасть на любую другую. Их примерно 27%

· Отправные страницы - из них к ядру попасть можно, а из ядра на них попасть нельзя. Их около 22%

· Конечные веб-страницы – из ядра к ним – можно, а от них к ядру – нельзя. Около 22%.

·.

· Есть веб-страницы, непересекающиеся с другими страницами в интернете. Их около 7%.

2. Глубина индексирования веб-сайтов. Большинство поисковых машин, попав на некий сайт, индексирует определенное количество документов.

3. «Невидимый» Интернет (скрытый) – часть сетевых ресурсов, которые недоступны для индексирования. Например, ресурсы с ограниченным доступом.




Поделиться с друзьями:


Дата добавления: 2015-05-10; Просмотров: 2011; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.015 сек.