Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Краєзнавча база даних




 

Краєзнавча база даних (БД) — це сукупність взаємопов'я­заних даних, що за своїм змістом стосуються певної місцево­сті всередині країни, поданих у відповідному форматі на ма­шинному носієві. Краєзнавча БД є важливою та найперспективнішою складовою краєзнавчих електронних ресурсів бібліотеки, яка забезпечує багатоаспектний пошук краєзнавчої інформації.

Головними складовими елементами системи краєзнавчих баз даних слід вважати:

• документографічні краєзнавчі БД, які містять упорядко­вану сукупність відомостей про краєзнавчі документи та їхго­ловні різновиди — бібліографічні й реферативні БД;

• повнотекстові краєзнавчі БД, що містять повні тексти краєзнавчих документів;

• фактографічні краєзнавчі БД, де подається інформація про конкретні факти, події, явища, пов'язані з краєм;

• адресно-довідкові краєзнавчі БД, які надають відомості про адреси, профіль діяльності місцевих підприємств, організа­цій та установ;

• персональні краєзнавчі БД, котрі містять інформацію про видатних діячів краю;

• тематичні краєзнавчі БД, що надають відомості про окре­мі аспекти життєдіяльності краю.

Система краєзнавчих БД є найдинамічнішою частиною крає­знавчих електронних ресурсів бібліотеки, що постійно попов­нюється та збагачується. До типових краєзнавчих БД краю (об­ласті) можна віднести:

• край (область) у центральних і місцевих виданнях;

• періодичні видання краю;

• календар знаменних і пам'ятних дат;

• законодавство;

• установи й організації;

• знані діячі;

• навчальні заклади;

• хроніка життя;

• видавництва;

• бібліотеки;

• краєзнавчі читання.

При створенні краєзнавчих БД найскладнішими є процеси від­бору й аналітико-синтетичної обробки краєзнавчих документів.

Відбір краєзнавчих документів супроводжується їх аналізом та індексуванням. Визначення класифікаційного індексу здій­снюється на базі прийнятої в бібліотеці схеми класифікації — УДК чи ББК для краєзнавчих каталогів бібліотек. Бібліографічні записи містять довідкову анотацію, яка стисло розкриває те­му, уточнює часові межі, вказує ім'я тієї чи іншої персони, дати її життя.

Метою аналізу є виявлення в тексті документів смислових компонентів — значущих елементів змісту, котрі в подальшо­му можна використовувати для інформаційного пошуку.

Поки що немає єдиної загальновизнаної методики формалізо­ваного аналізу змісту краєзнавчих документів. Разом з тим засто­сування методів формалізації в процесі семантичної обробки до­кументів сприяє точному відтворенню змісту первинного крає­знавчого документа у вторинному (рефераті, анотації) з метою зниження ймовірності неоднозначного розуміння його смислу. Суть формалізованого аналізу полягає в тому, що в тексті первин­ного документа виявляються головні аспекти краєзнавчого змі­сту на підставі заданого переліку маркерів та індикаторів. Саме результати семантичної обробки документів (класифікаційний індекс, сукупність ключових слів, предметних рубрик, анотації, реферати та ін.) суттєво впливають на якість пошуку краєзнавчої інформації, ефективність використання електронних краєзнав­чих ресурсів бібліотечних установ.

Особливої цінності для відтворення у краєзнавчих БД набуває краєзнавча інформація, почерпнута з центральних і місцевих періодичних видань — газет і журналів, у яких міститься до 90 % краєзнавчої інформації. Відбору підлягають насамперед статті з оригінальною фактографічною, узагальнюючою, аналі­тичною і практичною інформацією. Приділяється також увага матеріалам, що висвітлюють особливості культурного будівни­цтва, історію населених пунктів, підприємств, організацій, уста­нов, профіль їх діяльності; роботу місцевої адміністрації, право­охоронних органів, пенсійного фонду, окремих видатних діячів краю тощо. Ці матеріали підлягають першочерговій формалі­зованій семантичній обробці.

Оскільки основу газетних і журнальних статей становлять краєзнавчі документи публіцистичного характеру, у процесі створення формалізованої методики згортання інформації ви­рішуються такі завдання:

• виявляються ознаки, котрі дають змогу атрибутувати крає­знавчі документи публіцистичного характеру;

• визначається склад жанрів краєзнавчих документів пуб­ліцистичного характеру та встановлюються притаманні окре­мим із них структурно-стилістичні особливості;

• виявляється склад аспектів змісту, що характеризують кожний із жанрів, визначаються формальні текстові ознаки (мар­кери), що дають змогу відрізняти в тексті краєзнавчого доку­мента публіцистичного характеру один аспект від іншого;

• створюється формалізована методика анотування краєзнав­чих документів публіцистичного характеру.

Суть цієї методики: 1) на базі "Класифікатора жанрів" бібліотекар-бібліограф визначає жанр краєзнавчого документа публі­цистичного характеру; 2) застосовуючи аспектно-маркерну мо­дель конкретного жанру, з'ясовує краєзнавчі аспекти, що висвіт­люються в первинному документі; 3) використовуючи перелік зворотних дієслів (описується, досліджується, характеризу­ється тощо), складає текст анотації, а потім здійснює його реда­гування.

Ефективне здійснення семантичної обробки краєзнавчих до­кументів передбачає наявність відповідного нормативно-мето­дичного забезпечення: технологічних інструкцій, методик виконання технологічних операцій, карток методичних рішень і т. ін. Створення такого інструментарію базується, з одного боку, на досягненнях наукової теорії, а з іншого, — має орієнтуватися на роботу в автоматизованому та електронному режимах та ха­рактеризуватися прагматичністю. Використання формалізова­ної методики згортання краєзнавчої інформації забезпечує об'єктивність і повноту відбиття змісту первинного документа, збільшує ресурсні можливості створюваних краєзнавчих БД, розширює можливість інформаційного пошуку. Смислові ком­поненти є основою для створення предметних рубрик. Саме тому вони потребують надзвичайно точних формулювань, які б не звужували або ж, навпаки, не розширювали зміст документа. Для формування системи краєзнавчих БД бібліотеки ство­рюють спеціальні словники:

• тематичний рубрикатор (словник) (на базі "Типової схеми класифікації краєзнавчих документів");

• словник персоналій, де відомості про кожну персону від­биваються з якомога максимальною повнотою;

• географічний словник, де відбиваються всі географічні об'єкти, зокрема уточнені географічні назви й окремі об'єкти, визначення належності котрих до певної території може викли­кати деякі ускладнення;

• словник предметних рубрик, який є доповненням до тема­тичних рубрик і не повторює їх назв. Предметні рубрики фор­мулюються за допомогою довідкових видань — енциклопедій, словників, алфавітно-предметного покажчика до ББК і т. ін.;

• список періодичних видань, які є базовими для формуван­ня поля БД ("Джерела інформації") і т. ін.

Серед названих складових, що забезпечують підготовку крає­знавчих БД бібліотеки, найважливішу роль відіграє тематичний рубрикатор, змістовою основою якого є "Типова схема класифі­кації краєзнавчих документів".

Обласні універсальні наукові бібліотеки України наразі на­були певного досвіду щодо впровадження комп'ютерних техно­логій обробки та зберігання інформації з використанням різних програм для створення електронного каталогу краєзнавчих документів, а також складання оригінального словника тематич­них рубрик, який розглядається як головний інструмент лінгві­стичного забезпечення цього каталогу.

Запровадження комп'ютерних і телекомунікаційних техно­логій значною мірою збагачує ефективну бібліографічну діяль­ність бібліотек з краєзнавства, робить доступнішими її результа­ти — краєзнавчі інформаційні продукти і послуги.

Методика створення краєзнавчих БД наразі є недостатньо опрацьованою. Практика вітчизняних і зарубіжних бібліотек свідчить про те, що створення краєзнавчих БД передбачає ви­конання взаємопов'язаних послідовних процесів, а саме:

• аналізу краєзнавчого документа;

• предметизації та складання предметних рубрик;

• координатного індексування (визначення ключових слів і дескрипторів).

Слід зазначити, що ефективною вважають методику створен­ня КБД, котра сприяє дотриманню світових стандартів бібліо­графічних записів за умови найменших витрат. У структурі бі­бліографічних записів (БЗ) для електронних краєзнавчих баз даних виділяють три головні частини: бібліографічний файл, авторитетні/нормативні файли, а також файл з фізичною характеристикою примірника краєзнавчого документа.

Як відомо, до головних складових семантичної обробки до­кументів відносять їх аналіз, формування системи предметних рубрик і підрубрик, а також установлення індексів, які точно розкривають зміст документа. У зв'язку з тим, що ці процеси суттєво впливають на якість пошуку краєзнавчої інформації й ефективність використання електронних краєзнавчих ресурсів бібліотечних установ, вважаємо за доцільне зупинитися деталь­ніше на методиці виконання цих процесів.

Насамперед слід зазначити, що всі вони здійснюються безпо­середньо за самим документом (а не за відомостями про нього, вміщеними, наприклад, у бібліографічному записі), тобто озна­йомлюються з краєзнавчим документом de visu. У процесі ана­лізу бібліограф-краєзнавець має точно визначити, а надалі й розкрити зміст документа, не розширюючи і не звужуючи його. Якщо як смисловий компонент документа розглядаються будь-яка проблема, тема, об'єкт або особа, слід урахувати всі дані, що сприятимуть його ідентифікації. Залежно від актуальності проблеми, забезпеченості матеріалом, а також характеру за­питів користувачів вибірково можуть знаходити відтворення і другорядні теми документа. Це дасть змогу в майбутньому уник­нути повторного звернення до текстів певних документів і в разі необхідності збільшити рівень глибини та деталізації інформа­ції про ту чи іншу тему, а також перевірити правильність побу­дови та використання предметних рубрик і т. ін. Необхідно па­м'ятати, що для краєзнавчих баз даних відтворення територіаль­ної локалізації в смислових компонентах є обов'язковою умовою навіть у тих випадках, коли вона збігається з сучасними межа­ми краю в цілому. Отже, глибина аналізу має бути достатньою для адекватного розкриття змісту документа незалежно від мови індексування (предметні рубрики, ключові слова тощо).

Зважаючи на перелік відомостей, що виявляють, а також на правила формулювання, можна виділити такі категорії смисло­вих компонентів:

• персоналії;

• окремі організації;

• географічні назви;

• певні теми.

Значна роль у краєзнавчих джерелах інформації належить персоналіям. Під час змістового аналізу визначають такі дані про ту чи іншу особу: ім'я, роки життя, псевдоніми та змінені прізви­ща, сфера діяльності, а для узагальнюючих персоналій — і на­лежність до певної соціальної чи професійної групи населення.

Щодо окремих організацій, то слід зазначити, що вони мо­жуть бути постійно діючими і тимчасовими. Для будь-якої орга­нізації встановлюють: офіційну назву, місце розташування, різ­ні її назви за період існування, профіль діяльності її учасників, а для тимчасових — окрім того, місце і дату створення.

З погляду потреб краєзнавства географічними об'єктами вва­жають: фізико-географічні найменування (континенти, океани, географічні ландшафти, острови, гори тощо), адміністративно-політичні найменування (групи країн, що об'єднуються за пев­ною ознакою, окремі держави, адміністративні складові краї­ни), економіко-географічні найменування (Донбас, Рур тощо), історико-географічні найменування (археологічні культури, городища тощо), а також території, у найменуванні яких знаходить відтворення етнічна характеристика. У процесі аналізу встановлюють повну назву об'єкта, всі варіанти його перейме­нування, найближчу географічну одиницю, до якої входять об'єкт, його статус і тип.

Тематика краєзнавчих документів може бути надзвичайно різноманітною, тому неможливо надати чітких рекомендацій, але слід зазначити, що аналіз документа дає змогу визначити назву теми, а також всі синонімічні поняття, її зв'язок з більш широкими темами та поняттями.

Стосовно авторитетного/корпоративного контролю як важливу складову семантичної обробки краєзнавчих документів слід розглядати їх пред метизацію. Безпосереднє ознайомлення з документом, аналіз його змісту, виявлення смислових компо­нентів у змісті документа, виділення компонентів, що відтво­рюють предмет (предмети) чи аспект (аспекти) його розгляду і, нарешті, стисле формулювання предметної рубрики (ПР) — усі ці процеси можливо здійснити тільки за умови роботи з краєзнав­чими документами de visu.

Головне завдання процесу предметизації полягає в достатньо повному і точному розкритті змісту, форми і призначення до­кумента у вигляді предметних рубрик для забезпечення опера­тивного пошуку інформації. Предметна рубрика — це стисле формулювання предмета (об'єкта, аспекту, факту, події тощо), про який йдеться в документі. Для забезпечення однакових прин­ципів в методичних підходах до вибору та формулювання предмет­них рубрик використовують списки предметних рубрик (слов­ники, рубрикатори) в традиційній чи електронній формі, в яких міститься не лише їхній алфавітний перелік, але й відбиваються зв'язки між ними, що забезпечуються посилально-довідковим апаратом; визначають жорсткі правила предметизації, а також здійснюють авторитетний/нормативний контроль за правильністю ведення та застосування списку предметних рубрик.

Предметними рубриками можуть бути імена певних осіб, географічні найменування, назви організацій, уніфіковані на­зви творів, сталі терміни, що наведені в сучасних довідкових та навчальних виданнях. За спеціально встановленими правилами (але не для термінів) припускається інверсія, коли на першому місці в словосполученні зазначають слово, що має більше смис­лове навантаження (найчастіше її застосовують у сполученнях іменник + прикметник, коли на першому місці вказують саме іменник).

Між окремими рубриками встановлюються зв'язки еквівален­тності (рівнозначності), ієрархічності й асоціативності. Відно­шення еквівалентності застосовують для декількох однакових або близьких за смислом предметних рубрик, коли одна з них приймається, а інші відхиляються з метою запобігання дублювання та розпорошення майже аналогічних за змістом документів. Такі зв'язки розкриваються за допомогою посилань типу "див." (Українська Рада див. Центральна Рада). Ієрархічні зв'язки — це відношення типу "рід — вид", "ціле — частина" і "загальне — кон­кретне", які розкривають з використанням посилань "див. також" (Фольклор український див. також Вишиванки). Асоціативні відношення — це відношення типу "наука — об'єкт", "процес — об­ладнання", "дія — продукт", "процес — матеріал", "галузь — ім'я персони чи колективу", "узагальнююча персоналія — ім'я персо­ни чи колективу". Такі відношення, як і попередні, оформляють посиланнями "див. також" (Театральні діячі українські див. та­кож Курбас, Лесь (Олександр Степанович), 1887-1937).

Предметні рубрики (ПР) бувають простими (складаються тільки із заголовка) і складними (мають один або декілька під­заголовків). Заголовок складної предметної рубрики відображає головний предмет, котрий розглядається в документі, а підзаголовки — окремі аспекти його змісту, територіальної локалі­зації, призначення, форми тощо. При предметизації краєзнав­чих документів доцільно використовувати переважно складні предметні рубрики, що дасть змогу розкрити їх зміст детальні­ше (Бібліотечне краєзнавство — Вивчення — Соціологічні ме­тоди). Порядок розміщення окремих елементів складної ПР визначається змістом документа на засадах принципу послідов­ного обмеження обсягу поняття. На відміну від традиційних по­шукових систем, в електронних каталогах і БД не рекомен­дується використовувати описові предметні рубрики. Заголов­ком ПР можуть бути такі елементи мови предметних рубрик, як особа, назва колективу, географічне найменування і тема. Якщо необхідно зібрати документи про певну особу, його ім'я завжди наводиться в заголовку (Корнєйчик, Ігор Іванович, 1924-1974 — Біографія). Для відтворення літератури про ко­лектив його найменування завжди вказується в заголовку (Хар­ківський історичний музей — Колекції). У краєзнавчих БД географічні найменування, головним чином, використовуються як підзаголовки (Адміністративно-територіальний поділ — Запорізька обл.). Зазначення найменування території в заголовку припускається в загальних оглядах (географія, населення, іс­торія тощо), у документах про взаємозв'язки території, а також у разі, коли аспект вивчення території збігається з науковою дисципліною (Галицько-Волинське князівство — Економічні зв'язки, 12—13 ст., Херсон м. — Екологія).

Залежно від змісту підзаголовки поділяють на тематичні, географічні, хронологічні та формальні.

Географічні та хронологічні підзаголовки застосовуються в разі необхідності географічної чи хронологічної деталізації за­головка. До краєзнавчих БД географічні підзаголовки включа­ють до предметних рубрик, навіть тоді, коли вони збігаються з сучасною назвою краю.

Формальні підзаголовки розкривають особливості функціо­нального призначення документа, характер наведеної в ньому інформації, знакову природу тексту, функціональний стиль, ступінь аналітико-синтетичної обробки інформації, відмінності матеріальної конструкції документа тощо.

Тематичні підзаголовки можуть бути трьох видів, а саме:

• універсальні, які відтворюють найзагальніші аспекти роз­криття будь-якого предмета (розвиток, склад, структура тощо);

• типові, що використовуються для деталізації певних груп предметів. Так, для колективних персоналій ("письменники", "краєзнавці" тощо) типовими є підзаголовки: філософські по­гляди, спогади тощо). Дотриманню уніфікації в застосуванні такого виду підзаголовків сприятиме складання списків типо­вих підзаголовків для деталізації різних категорій заголовків;

• специфічні, котрі використовуються лише з конкретним заголовком предметної рубрики (Діячі козацтва — гетьмани, Військова справа — призов).

Засобом авторитетного контролю за формуванням предмет­них рубрик у традиційних каталогах є "Робоча картотека до предметного каталогу" та її друкований варіант — "Список пред­метних рубрик", де прості та складні ПР подають в алфавіт­ному порядку. В електронному каталозі (БД) список ПР існує у вигляді авторитетного файла ПР, структура записів у якому за­безпечує міжнародний або національний комунікативний фор­мат UNIMARC або UKMARC.

 

Структурними одиницями авторитетного файла є автори­тетні/нормативні записи. Кожний запис має поля та підполя, котрі залежно від призначення об'єднуються в блоки та позна­чаються певними символами. Зокрема, запис включає:

• заголовок (просту чи складну ПР);

• поля приміток;

• поля формування посилань "див.";

• поля формування посилань "див. також".

Слід зазначити, що заголовок є обов'язковою складовою ав­торитетного запису, а решта полів застосовується факультатив­но. Зважаючи на категорію, до якої належить заголовок, пред­метна рубрика подається в тому чи іншому полі блоку заголов­ків авторитетного запису:

Заголовок — Ім'я особи

— Найменування організації.

— Географічна назва.

— Родове ім'я.

— Уніфікована назва.

— Узагальнююча уніфікована назва.

— Ім'я/Назва.

— Ім'я/Узагальнювальна уніфікована назва.

— Тематична предметна рубрика.

Взаємозв'язки предметних рубрик, що входять до авторитетного файла, відбиваються у відповідних полях самостійних блоків:

Блок формування посилань "див." містить варіантні заголов­ки, від яких встановлюється посилання "див." до заголовка цьо­го запису:

Формування посилання "див."

— Ім'я особи.

— Найменування організації.

— Географічна назва.

— Родове ім'я.

— Уніфікована назва.

— Ім'я/Назва.

— Ім'я/Узагальнювальна уніфікована назва.

— Тематична предметна рубрика.

Блок формування посилань "див. також" містить пов'язані прийняті заголовки, від яких встановлюється посилання "див. також" до заголовка цього запису.

Формування посилання "див. також".

— Ім'я особи.

— Найменування організації.

— Географічна назва.

— Родове ім'я.

— Уніфікована назва.

— Ім'я/Назва.

— Ім'я/Узагальнювальна уніфікована назва.

— Тематична предметна рубрика.

Зміст і форма подання інформації в авторитетному/норматив­ному записі визначаються прийнятими у бібліотеці підходами та методикою предметизації документів.

Процеси аналізу та предметизації документів завершуються координатним індексуванням, коли як головні розпізнавальні ознаки змісту документа використовуються ключові слова чи дескриптори. Ключове слово (КС) — це слово або словосполу­чення з тексту документа чи запиту, яке в аспекті інформа­ційного пошуку має суттєве смислове навантаження. Ними можуть бути окремі слова (унітерми), словосполучення, частини мови (але ніколи не використовують дієслова). До унітерм нале­жать прості слова (географія), складні та складноскорочені слова (машинобудування, облрада), абревіатури (ЕОМ, НТІ). Ключови­ми словами можуть бути сталі словосполучення (національні ру­хи, міжнародні економічні організації). їх наводять у називно­му відмінку множини відповідно до норм української мови. Індексування ключовими словами відбувається з мінімальним ступенем нормалізації, коли бібліограф вибирає безпосередньо з тексту слова, що передають зміст документа, застосовуючи при цьому термінологію автора. Такий спосіб індексування може при­звести до того, що однакові за смислом документи можуть опини­тися в різних місцях пошукового апарату. Необхідно також за­значити, що використання КС не передбачає створення посилаль­но-довідкового апарату в будь-якій формі (списку, тезауруса чи авторитетного файла).

КС, виділені з тексту документа, можуть стати основою для створення дескрипторів. Дескриптор (слово, словосполучення або код) — це словникова одиниця інформаційно-пошукової мови, що об'єднує під певним ім'ям еквівалентні та близькі за змістом ключові слова, сприяє максимальній нормалізації індексування і робить той чи інший пошуковий апарат більш інформативним. Методика створення дескрипторної мови бага­то в чому збігається з методикою предметизації. Для забезпечен­ня її необхідно створювати тезаурус, який містить дескриптори та відтворює відношення еквівалентності, ієрархії й асоціатив­ності, застосовувати жорсткі правила індексування, а також здій­снювати авторитетний (нормативний) контроль для забезпечення правильності прийнятих рішень та ефективного використання тезауруса.

 

 




Поделиться с друзьями:


Дата добавления: 2014-11-20; Просмотров: 986; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.