КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Відображення логічної моделі документа на його геометричну модель називається алгоритмом формування текстових документів
Наступним кроком на шляху до формалізації документа є формалізація його змісту. Суть такої формалізації полягає у тому, щоб розбити кожний кінцевий компонент структури документа на елементи, кожний з яких має нести певне смислове (семантичне) навантаження. При цьому розглядаються елементи трьох видів: аї елементи, що мають відношення тільки до даного документа; б) елементи, що повторюються у багатьох документах; в) елементи, що повторюються кілька разів в одному документі. Елементи групи (в), у свою чергу, можуть поділятися на елементи виду (а) або (б). Таким чином, у пам'ять ПЕОМ заносяться І зберігаються шаблони документів, що містять у собі: текстові елементи, що є унікальними для даного виду документа; «порожні» елементи, що заповнює проектувальник для кожної конкретної версії документа даного виду; посилання на елементи, що повторюються. Перевага такого підходу полягає у натуральному поданні повно-текстового документа для розроблювача, а також у простоті зміни структури документа пря його реалізації. Аналіз видів і типів документів ІС, вимог до їхнього змісту показує, що багатьом технічним документам на ІС властива наявність однакових розділів і підрозділів. Для багатьох розділів характерне дублювання однойменних фрагментів тексту. Дублювання призводить до зростання трудомісткості розробки, збільшення обсягу робіт з підготовки технічної документації за рахунок: 1. Багаторазових описів одних і тих самих процедур обробки даних. 2. Багаторазового опису правил використання документів» порядку роботи фахівців. 3. Опису загальні правила експлуатації технічних і програмних засобів у різних документах. При цьому зміст окремих компонентів документів не формалізовано. З іншого боку, у процесі підготовки проектної документації виконуються однотипні повторювані роботи з написання фрагментів тексту. Часто ці фрагменти бувають понаповнені копіями, а мають лише певну частку повторення. Традиційним засобом автоматизації підготовки документів є текстові редактори і програми-форматизатори. Текстові редактори забезпечують автоматизоване введення, коригування, збереження і виведення текстових документів. Програми-форматизатори забезпечують правильне розміщення тексту і його елементів на друкованій сторінці, виділення заголовків, оформлення таблиць. Проте, можливостей текстових редакторів виявляється недостатньо для автоматизації процесів, підготовки комплексів технічної документації на ІС. Існують такі недоліки: ї. Відсутня можливість автоматичного встановлення зв'язків між вікнами. 2. Відсутній апарат перехресних посилань між фрагментами текстів. 3. Функції з блоками тексту не виконуються автоматично. 4. Текстова база даних являс собою набір незв'язних текстових файлів. 5. Виділення і копіювання блоків тексту вручну - рутинна робота. 6. Неможливо подати документ у вигляді деякого структурованого щаблону. 7. Швидке коригування комплекту докуменації утруднене. Проведений аналіз показує, що існуючі засоби автоматизації підготовки документації практично вичерпали можливості свого розвитку. Тому необхідний пошук і розвиток нових інформаційних технологій у цьому напрямку. Так розрізняють чотири послідовні стадії написання тексту: генерація ідей або думок; організація (ідей або думок); переведення думок у слова і речення; редагування. Друга стадія дуже важлива - при написанні тексту змістова організація і обробка плану займають близько двох третин усього часу. Розумові процеси, що проходять у голові автора моделюються у термінах семантичної сітки. У вузлах такої сітки знаходяться судження (думки). У подальшому осмисленні автором своєї задачі сітка зорганізовуеться в ієрархічну структуру. Дослідження показують, що візуалізація, винесення назовні цих розумових сіткових структур і можливість маніпулювати ними допомагають авторові краще справлятися з другою стадією написання тексту. Причому це дозволяє поєднувати другу та третю стадії. Потім на чергу стає проблема лінеаризації сітки, формування з неї вузлів змістової послідовності. Це проблема, яка стосується вже не рівня слів, а понять. Стратегії лінеаризації, перекладені в інструкції для комп'ютера, на сьогодні є не вирішеною науковою проблемою. Наведена модель процесу підготовки текстової документації базується на поняттях системи, структури, елементів, зв'язків. Але з цього не випливає, що проблема упорядкованого викладу думок і рішень. Необхідно створити систему, здатну допомогти кожному, кому треба з досить великої сукупності окремо записаних думок, висловлювань, фактів, ілюстрацій утворити послідовність, зрозумілу як ціле. Існують підходи до рішення даної проблеми у перспективних інформаційних технологіях. Технологія гіпертексту Перспективу розвитку будь-якої нової інформаційної технології визначає ЇЇ відповідність загальним тенденціям розвитку. Такою тенденцією в інформатиці є відмова від жорстких «системних» методів та ієрархічної організації систем даних і знань. Однією з нових технологій, що знаходяться на початкових етапах свого розвитку є гіпертекстова технологія. Сформулюємо визначення гіпертексту як основи нової гіпертекстової технології. Гіпертекст — це спеціальна форма (різновид) електронного документа, в якому: інформація зберігається у сітковій структурі, кожний вузол якої містить фрагмент документа або будь-який набір елементів даних; доступ до інформації здійснюється шляхом інтерактивного перегляду і вибору зв'язків для переходу до наступних вузлів. У понятті «гіпертекст» (hурег — над) знаходять відображення наче б то два зміста. По-перше, гіпертекст — деяка одиниця інформації, частинами якої є тексти. По-друге, говорячи про гіпертекст, розуміємо текст, частини якого мають «надзв'язки», тобто з'єднані один з одним безліччю різних відношень, що представлені у багатовимірному просторі. (У звичайному тексті окремі його частини з'єднані лінійним відношенням прямування.) Якщо вузли містять не тільки текстову, а й графічну, звукову, відеоінформацію або комбінації цих видів інформації, то така форма подання Інформації в ЕОМ називається гіпермедіа. У найзагальнішому вигляді гіпертекст можна визначити як СУБД, що дозволяє користувачеві поєднувати асоціативними зв'язками інформацію, яка відображується на екрані, і здійснювати прямий (непослідовний) доступ до зв'язаних між собою окремих записів тексту. Вузли у гіпертекстовій базі даних являють собою структурні одиниці тексту (аналогічно електронним карткам у каталозі) на відміну від записів у звичайних БД. У таких системах доступ до інформації здійснюється шляхом інтерактивного перегляду і вибору зв'язків для переходу до наступних вузлів. Тому у гіпертекстових системах важливим компонентом є структурний редактор для інтерактивного зв'язування вузлів, модифікацій або додавання зв'язкін між вузлами. Зв'язки встановлюються виходячи з вимог зручного та швидкого доступу до інформації. Використовується, як правило, два типи зв'язків - посильні та ієрархічні. З використанням ієрархічних зв'язків вузли організовуються у структури на основі принципу підпорядкованості «предок - нащадок». Посильні зв'язки слугують для зв'язування одержаних структур. Оргнізація доступу до інформації в гіпертекстових системах може бути забезпечена одним з таких трьох способів: у початкових вузлах гіпертексту розміщується коротка таблиця змісту; для перегляду інформації приймається спеціальна програма; проводиться індексація вузлів інформації і пошук здійснюється за вказаними індексами. Традиційні найпростіші операції, що їх виконує проектувальник, працюючи з базою даних - пошук, перегляд, виведення документів. У гіпертекстовій системі ці операції набувають статусу пізнавальних аналітичних операцій зі смисловим змістом документів. Наступний фрагмент користувач вибирає на основі професіонального аналізу змісту поточного фрагмента. У разі необхідності користувач-проектувальник може породжувати нову асоціацію, яка потім приводить до конкретних дій за вибором наступних фрагментів. 1987 року розробники з Університету Північної Кароліни (США) представили систему WЕ (А Wгіtіпg Епvігопmепt fог Ргоfеssіопаls). В основу моделі системи WЕ покладено таку ідею: читання і письмо розглядаються як симетричні в цілому процеси, які у своїх стадіях змінюють їх за взаємопротилежною черговістю. Виходячи з цього на екрані системи користувачеві пропонується два головних вікна, а саме: візуалізація мережі (сітки) для підтримки ранньої стадії створення тексту ("мозкового штурму"); вікна ієрархій для подальшої концептуальної організації. У третьому вікні користувач може редагувати текстові начерки у вузлах сітки. Зберігання, змінювання і пошук вузлів і зв'язків сітки здійснюються у реляційній базі даних. Для запитів до реляційноЇ БД виділяється четверте вікно. Система WЕ орієнтована на створення науково-технічних текстів. Лабораторією «Сіменс» (Відень) розроблена система Нуреr Аuthог. В основу системи покладено підтримку трьох фаз авторського процесу: ІДЕЇ, ПЛАН, ТЕКСТ. У першій фазі система забезпечує збирання ідей, які коротко записуються у вузлах. Змістові асоціації ідей фіксуються у вигляді гіпертекстових зв'язків, тобто будується неформальна база знань. Далі система дозволяє надати одержаній сітці ієрархічну організацію. Для цього структура проблемної сфери упорядковується від «загального до окремого» (таксономією). Таксономія зберігається у машині і розглядається як засіб навігації створеної сітки. У другій фазі документ проходить більш конкретне планування, яке не обов'язково повторює базову таксономію. При цьому сукупність ідей, що утворюють «базу знань»» перетворюється на лінійний ланцюжок блоків, які підлягають заповненню текстом. У третій фазі відбувається заповнення блоків текстом. Система Нурег Аuthог побудована як додаток до комерційної гіпер-текстової системи Нурег Shell. Зростаючі вимоги проектувальників, конструкторів, аналітиків до можливостей автоматизованих систем підготовки документації вже нині виходять за межі можливостей суто гіпертекстових систем. Так, перелік вимог до систем автоматизованого проектування може включати такі положення: зберігання текстових і географічних документів; можливість додавання s виключення документів; автоматичне виділення ключових слів у тексті; пошук документів за ключовими словами і за змістом документа; перехід від текстового або графічного документа до зв'язаних з ним інших документів; зв'язок документів з цифровими даними, побудова діаграм графічних документів. ГІпертекстова система забезпечує легкість переходу від одного документа до іншого. Але залишається ряд невирішених питань: вручну роблять посилання у документах (відсутнє автоматичне індексування); засоби пошуку дозволяють знаходити тільки такі слова і словосполучення, які точно збігаються; прив'язка до баз даних відсутня. Для реалізації зазначених вимог s усунення недоліків в існуючих системах роботи з документами за рубежем стали створювати системи нового класу — системи «text management systems» ("системи управління документацією"), в яких поєдналися різноманітні методи зберігання та обробки інформації. У загальному випадку системи управління документацією забезпечують таке: звичайний логічний пошук інформації за ключовими словами; деякі системи дозволяють проводити пошук за зразком, який містить, крім букв, спеціальні символи (wilcards), наприклад «?» або «*»; найбільш розвинені системи забезпечують пошук не лише заданого слова, але і його синонімів або зв'язаних з ним за змістом слів; групи слів і синонімів знаходяться у словниках системи; під час пошуку слів усі системи використовують індекс. Індекси можуть вказувати лише ім'я документа або файла, який його утримує, або зберігати також місцезнаходження слова у тексті; користувач може вказувати, які слова не слід включати в індекс. Системи управління документацією знаходять все ширше застосування. Про це свідчить, наприклад, той факт, що 1992 року в США на персональних комп'ютерах працювало від 80 до 100 тисяч таких систем.
Дата добавления: 2014-12-16; Просмотров: 525; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |