Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Інформаційно-пошуковий тезаурус. Поняття. Завдання




 

Термін "тезаурус" широко використову­ється в лінгвістиці для позначення спеціального типу словників, які тією чи іншою мірою відо­бражають "картину світу", "мовну модель світу". Давньогрецьке слово "тезаурус", що бук­вально означає "скарбниця", майже на наших очах виросло у своєму значенні. Уперше цейтермін застосував ще у XIII ст. Брунетто Латіні, назвавши так свою систематизовану енцикло­педію. Друге значення цього терміна пов'язано зі словником. Тобто словника, що фіксував, по можливості, всі контексти, в яких виступає конкретне слово. Тезаурусом стали називати словник, що не просто вбирає в себе всі лексичні багатства мови, а упорядковує їх визначеним логіко-системним чином. У словнику-тезаурусі слова зводяться в групи, а об'єднання це відбувається на основі здатності того чи іншого словапередавати визначене поняття. Зараз у це поняття вкладають значення "вся кількість накопичених знань". Перші тезауруси, що змогли задовольняти специфічні завдання інформаційного пошуку, були розроблені на початку 60-х рр. XX ст. Ідея застосування ІПТ для інформаційного пошуку документів виз­начається описом змісту документів та запитів за допомогою дескрипторів, що входять до його складу. Отже, тезаурус – контрольований словник термінів із зафіксованими семантичними взаємозв’язками, який охоплює одну чи більше спеціальних галузей знань. Відповідно до тематичного профілю розрізняють багатогалузеві, галузеві та вузько-тематичні тезауруси. Особливе значення має викорис­тання тематичних тезаурусів для спеціалізо­ваних баз даних, побудова та використання політематичних тезаурусів та індексу ІПС на їх основі, бо сьогодні саме вони становлять найбільший інтерес. Лексику тезаурусів складають не тільки дескриптори, але й їх синоніми, які дескрипторами не виступають Наявність у тезаурусі синонімів має велике значення, але їх неправильне використання може призвести до втрати інформації. Щоб цього не відбувалося, із синонімів дескриптором вибирають найбільш вживане поняття, а від інших дають посилання до нього. Таке посилання означає, що замість одного терміну при формуванні пошукових образів докумен­тів чи запитів слід використовувати інший, що є дескриптором. Крім цього, в тезаурусі мають бути зафіксовані взаємозв'язки між термінами (рід - вид, частина - ціле та інше,що підвищує точність та повноту пошуку).

Вступаючи до світового інформаційного простору, кожна країна повинна потурбуватися про лінгвістичне забезпечення предметного пошуку реалій своєї історії, культурних, інте­лектуальних і духовних здобутків. Згідно з цим представники НПБ розробили "Інформаційно-пошуковий тезаурус НПБ України", який дозволить уніфікувати пошуковий апарат електронних каталогів різних бібліотек.

В Україні в 2004 році вийшов розроблений Національною парламентською бібліотекою інформаційно-пошуковий тезаурус (далі - Тезаурус).

 

Тезаурус є інструментом, завдяки якому мож­на сформувати уніфікований пошуковий образ до­кумента і пошуковий образ запиту користувачів з метою їхнього подальшого пошуку в автоматизо­ваних інформаційних системах (АІС), у тому чис­лі - автоматизованих інформаційно-бібліотечних системах (АІБС). Його можна використовувати в бібліотечних та інформаційних установах, де ана­ліз документів та визначення їхнього предмета здійснюється індексатором за допомогою уніфіко­ваної пошукової мови, а також застосовувати як термінологічний словник, в якому структурні зв'язки відображають місце терміна у понятійній системі. За Тезаурусом будь-яка бібліотека або інша інформаційна установа, в залежності від документопотоку, може формувати власні авторите­тні файли предметних рубрик або визначати клю­чові слова. У майбутньому використання саме уні­фікованої інформаційно-пошукової мови забезпе­чить, при якісному індексуванні документів, висо­ку точність пошуку в АІБС і дозволить оперативно реагувати на появу нових понять (термінів).

Тезаурус є універсальним за змістом. До його складу включено терміни, що означають: дії і про­цеси; поняття наук (соціально-гуманітарних, технічних, природничих) і дисциплін; назви організа­цій і установ; персоналії, які не передбачають авторства; види, типи і назви матеріалів, біологіч­них організмів, хімікатів, сільськогосподарських культур, порід тварин тощо; назви народів, етніч­них груп, мов (природних, штучних, комп'ютер­них), небесних тіл; стилі, жанри, види мистецтва, літератури і архітектури; соціальні і природні явища (війни, революції, битви, катастрофи та ін.); назви священних книг, легенд, імена міфіч­них персонажів тощо. Також до нього включено терміни, якими означено: континенти і регіони; країни, їхній адміністративно-територіальний по­діл (головним чином України); назви етнічних зе­мель, елементів земної поверхні (океанів, морів, гір тощо), парків, заповідних зон.

Загалом використано 133 джерела (терміно­логічні словники, енциклопедії, довідкові видан­ня, навчальні посібники, термінологічні стандар­ти, таблиці УДК, ББК тощо).

Тематичне охоплення Тезауруса визначаєть­ся документним потоком, який опрацьовується у бібліотеках в автоматизованому режимі при ство­ренні електронних каталогів та інших баз даних.

Головний прийом побудови Тезауруса - за­безпечення однозначності термінів. На відміну від термінологічних словників, де передбачається багатозначність природного слововжитку, кож­ний термін у Тезаурусі розуміється лише в будь-якому одному значенні - дескрипторі.

Якщо те ж саме поняття має два або більше тлумачень (синонімів), тільки одне з них умовно вибирається як дескриптор. Усі інші синонімічні тлумачення, котрі могли б слугувати пошукови­ми елементами, мають посилання на цей дескриптор.

Якщо термін є полісемічним (багатозначним) або омонімічним (звуковий збіг різних за значен­ням термінів), за ним у круглих дужках подають­ся уточнення, наприклад:

мости (споруди) морфологія (біол.)

мости (ходові частини) морфологія (лінгв.)

 

Терміни, включені до Тезауруса, подаються природною мовою, за винятком, якщо необхідно:

• уточнити національні, мовні, етнографіч­ні характеристики,

наприклад:

пісні українські

образотворче мистецтво російське

перекладні словники українсько-англійські;

• дати назви теорій, законів, правил, явищ, систем тощо, складовою частиною котрих є прі­звища авторів, винахідників,

наприклад:

Ома закон

Макаренка педагогічна система;

• географічні назви

наприклад:

Карпати, гори

Дніпро, ріка




Поделиться с друзьями:


Дата добавления: 2014-11-20; Просмотров: 1969; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.016 сек.