Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Морфоанализ (при необходимости)




Удаление стоп-слов

Определение формата, кодировки и языка

Извлечение

Предварительная обработка документа

Методология поиска

Отклик

ПМ

Запрос

Системы персонального информационного поиска (например, в программах, работающих с e-mail)

Системы корпоративного, ведомственного поиска, ориентированного на конкретную проблемную область

Масштабные системы WEB-поиска

ИПС трех уровней

Поисковик

Searching engine (SE)

Поисковая машина (ПМ), машина поиска (МП)

Поисковая система (ПС)

Информационно-поисковая система (ИПС)

Синонимы

ИП и традиционный поиск по ключу

Содержательная группировка

Обработка найденных документов

Фильтрация документов

Навигация по коллекции документов

Дополнительные задачи ИП

Тематическое разнообразие текстов

Представление информации в разных форматах

Огромное количество дубликатов

Неконтролируемость, быстрота пополнения ресурсов и объем Интернета

Исходные положения

Введение в информационный поиск

Избавление от утопических взглядов

Отсутствие косности в голове переводчика

Обучаемость программ

Работа в новых форматах

Тематическое сужение

Четкая постановка задачи

МП как технологическая реальность

К небольшому холоду ели зимой. От леса ель была взята нами домой.

To small fir-tree cold in the winter. From the wood the fir-tree was taken by us home.

Маленькой елочке холодно зимой. Из лесу елочку взяли мы домой

Маленькой елочке холодно зимой. Из лесу елочку взяли мы домой.

Little tree cold in winter. From the forest herringbone we took home.

Маленькой елочке холодно зимой. Из лесу елочку взяли мы домой.

Яндекс.Перевод

Translate.Ru
ОНЛАЙН-ПЕРЕВОДЧИК PROMT

Выводы

специфика программирования WEB-страниц; спам

коварство гипертекста, гиперссылки

Информационный поиск
(Information retrieval, IR, search)

поиск неструктурированной информации, единицей которой является документ произвольных форматов. Предмет поиска – информационная потребность пользователя, выраженная в поисковом запросе (query).

- Здравствуйте у меня вопрос по качеству обслуживания.

- О’к. Назовите, пожалуйста, номер Вашего лицевого счета…

Учебник: Введение в информационный поиск

Общая схема ИП

Прямой поиск (подстроки в документе без доп. обработки):

[Зюганов] ® Зюганова, Зюганову, Зюгановым, Зюгановых etc.

Индексирование документов (создание «поискового образа» документа)

сегментация (выделение слов и предложений) = «токенизация» (проблема многословных токенов и границ предложений)




Поделиться с друзьями:


Дата добавления: 2015-07-02; Просмотров: 360; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.