КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Інформаційно-пошуковий тезаурус. Поняття. Завдання
Термін "тезаурус" широко використовується в лінгвістиці для позначення спеціального типу словників, які тією чи іншою мірою відображають "картину світу", "мовну модель світу". Давньогрецьке слово "тезаурус", що буквально означає "скарбниця", майже на наших очах виросло у своєму значенні. Уперше цейтермін застосував ще у XIII ст. Брунетто Латіні, назвавши так свою систематизовану енциклопедію. Друге значення цього терміна пов'язано зі словником. Тобто словника, що фіксував, по можливості, всі контексти, в яких виступає конкретне слово. Тезаурусом стали називати словник, що не просто вбирає в себе всі лексичні багатства мови, а упорядковує їх визначеним логіко-системним чином. У словнику-тезаурусі слова зводяться в групи, а об'єднання це відбувається на основі здатності того чи іншого словапередавати визначене поняття. Зараз у це поняття вкладають значення "вся кількість накопичених знань". Перші тезауруси, що змогли задовольняти специфічні завдання інформаційного пошуку, були розроблені на початку 60-х рр. XX ст. Ідея застосування ІПТ для інформаційного пошуку документів визначається описом змісту документів та запитів за допомогою дескрипторів, що входять до його складу. Отже, тезаурус – контрольований словник термінів із зафіксованими семантичними взаємозв’язками, який охоплює одну чи більше спеціальних галузей знань. Відповідно до тематичного профілю розрізняють багатогалузеві, галузеві та вузько-тематичні тезауруси. Особливе значення має використання тематичних тезаурусів для спеціалізованих баз даних, побудова та використання політематичних тезаурусів та індексу ІПС на їх основі, бо сьогодні саме вони становлять найбільший інтерес. Лексику тезаурусів складають не тільки дескриптори, але й їх синоніми, які дескрипторами не виступають Наявність у тезаурусі синонімів має велике значення, але їх неправильне використання може призвести до втрати інформації. Щоб цього не відбувалося, із синонімів дескриптором вибирають найбільш вживане поняття, а від інших дають посилання до нього. Таке посилання означає, що замість одного терміну при формуванні пошукових образів документів чи запитів слід використовувати інший, що є дескриптором. Крім цього, в тезаурусі мають бути зафіксовані взаємозв'язки між термінами (рід - вид, частина - ціле та інше,що підвищує точність та повноту пошуку). Вступаючи до світового інформаційного простору, кожна країна повинна потурбуватися про лінгвістичне забезпечення предметного пошуку реалій своєї історії, культурних, інтелектуальних і духовних здобутків. Згідно з цим представники НПБ розробили "Інформаційно-пошуковий тезаурус НПБ України", який дозволить уніфікувати пошуковий апарат електронних каталогів різних бібліотек. В Україні в 2004 році вийшов розроблений Національною парламентською бібліотекою інформаційно-пошуковий тезаурус (далі - Тезаурус).
Тезаурус є інструментом, завдяки якому можна сформувати уніфікований пошуковий образ документа і пошуковий образ запиту користувачів з метою їхнього подальшого пошуку в автоматизованих інформаційних системах (АІС), у тому числі - автоматизованих інформаційно-бібліотечних системах (АІБС). Його можна використовувати в бібліотечних та інформаційних установах, де аналіз документів та визначення їхнього предмета здійснюється індексатором за допомогою уніфікованої пошукової мови, а також застосовувати як термінологічний словник, в якому структурні зв'язки відображають місце терміна у понятійній системі. За Тезаурусом будь-яка бібліотека або інша інформаційна установа, в залежності від документопотоку, може формувати власні авторитетні файли предметних рубрик або визначати ключові слова. У майбутньому використання саме уніфікованої інформаційно-пошукової мови забезпечить, при якісному індексуванні документів, високу точність пошуку в АІБС і дозволить оперативно реагувати на появу нових понять (термінів). Тезаурус є універсальним за змістом. До його складу включено терміни, що означають: дії і процеси; поняття наук (соціально-гуманітарних, технічних, природничих) і дисциплін; назви організацій і установ; персоналії, які не передбачають авторства; види, типи і назви матеріалів, біологічних організмів, хімікатів, сільськогосподарських культур, порід тварин тощо; назви народів, етнічних груп, мов (природних, штучних, комп'ютерних), небесних тіл; стилі, жанри, види мистецтва, літератури і архітектури; соціальні і природні явища (війни, революції, битви, катастрофи та ін.); назви священних книг, легенд, імена міфічних персонажів тощо. Також до нього включено терміни, якими означено: континенти і регіони; країни, їхній адміністративно-територіальний поділ (головним чином України); назви етнічних земель, елементів земної поверхні (океанів, морів, гір тощо), парків, заповідних зон. Загалом використано 133 джерела (термінологічні словники, енциклопедії, довідкові видання, навчальні посібники, термінологічні стандарти, таблиці УДК, ББК тощо). Тематичне охоплення Тезауруса визначається документним потоком, який опрацьовується у бібліотеках в автоматизованому режимі при створенні електронних каталогів та інших баз даних. Головний прийом побудови Тезауруса - забезпечення однозначності термінів. На відміну від термінологічних словників, де передбачається багатозначність природного слововжитку, кожний термін у Тезаурусі розуміється лише в будь-якому одному значенні - дескрипторі. Якщо те ж саме поняття має два або більше тлумачень (синонімів), тільки одне з них умовно вибирається як дескриптор. Усі інші синонімічні тлумачення, котрі могли б слугувати пошуковими елементами, мають посилання на цей дескриптор. Якщо термін є полісемічним (багатозначним) або омонімічним (звуковий збіг різних за значенням термінів), за ним у круглих дужках подаються уточнення, наприклад: мости (споруди) морфологія (біол.) мости (ходові частини) морфологія (лінгв.)
Терміни, включені до Тезауруса, подаються природною мовою, за винятком, якщо необхідно: • уточнити національні, мовні, етнографічні характеристики, наприклад: пісні українські образотворче мистецтво російське перекладні словники українсько-англійські; • дати назви теорій, законів, правил, явищ, систем тощо, складовою частиною котрих є прізвища авторів, винахідників, наприклад: Ома закон Макаренка педагогічна система; • географічні назви наприклад: Карпати, гори Дніпро, ріка
Дата добавления: 2014-11-20; Просмотров: 2026; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |