Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Поняття про XML-мову структурованого зберігання інформації




Орієнтація на дескриптивний маркап. SGML по визначенню припускає використання дескриптивної схеми маркапа. Дані, необхідні для якої-небудь конкретної обробки документа (наприклад форматування), чітко відокремлюються від дескриптивного маркапа, що міститься в документі. Звичайно вони зібрані за межами документа у виді відповідних алгоритмів і програм. Існують стандарти, що визначають їхній (DSSSL, HyTime).

При використанні дескриптивного маркапа один і той же документ, як вже відзначалося, може оброблятися різними способами за допомогою різних програм, кожна з який приділяє увагу тим частинам документа, що є важливими для даного методу обробки. SGML, як стандарт, підтримує і робить реально реалізованим такий принцип роботи. Наприклад, програма аналізу змісту тексту може цілком ігнорувати виноски і примітки, що зустрічаються в тексті, у той час як форматуюча програма може витягати їх з тексту і збирати всі разом, щоб потім вивести наприкінці розділу. Різні методи обробки можуть застосовуватися для тих самих частин документа. Одна програма може робити вибірку з документа всіх особистих імен і назв місць і створювати по них базу даних, у той час як інша, для тих же елементів документа, виконує їхнє форматування таким чином, щоб вони виділялися з тексту.

Об‘ектно-орієнтовна модель. SGML вводить поняття класу, чи типу, документа і спосіб його завдання й опису - Document Type Definition (DTD). Документи вважаються визначеного типу, як і будь-які інші об'єкти, які обробляються комп'ютером. Тип документа формально визначається його складовими частинами і структурою. Якщо тип документа відомий, спеціальна програма (парсер) може бути використана для перевірки того, що вміст документа відповідає його типу - всі його необхідні частини присутні і розташовані у потрібному порядку. Більш важливо, що різні документи того самого типу можуть оброблятися однаковим способом. Можуть бути написані програми, що використовують інформацію, задану у визначеному типу документа і здатні завдяки цьому робити більш значимі дії.

Незалежність від низькорівневих представлення даних. Базовою метою, що ставилася при розробці SGML, була задача забезпечення перенесення документів між різними програмними й апаратними платформами без втрати інформації. Завдяки попереднім двом особливостям ця вимога досягається на абстрактному рівні. Розглянута тут можливість забезпечує цю вимогу на фізичному рівні, за допомогою визначення значення послідовностей байтів, з яких складається документ. SGML надає механізм загального призначення для заміни рядків, тобто простий машинно-незалежний спосіб для вказівки того, що конкретна послідовність символів у документі повинна бути замінена на іншу під час обробки документа. Одне з застосувань цієї можливості - забезпечення однаковості термінології й інших параметрів документів; інше, більш важливе - забезпечення можливості переносу тексту, що містить нестандартні і т.п. символи між різними платформами, що мають різні набори символів, можливості по їхньому відображенню і т.д. Це досягається за допомогою заміни нестандартних символів на рядки, що задають їхні коди. Послідовності символів, визначені для описаної вище заміни називаються entities ("поняття").

Елемент - термін, використовуваний у SGML для позначення якої-небудь структурної одиниці тексту. Різним типам елементів даються різні імена, але SGML не надає ніякого способу визначення змісту і значення конкретного типу елемента, крім завдання його відносин з іншими елементами. Таким чином, єдине, що можна сказати про елемент (наприклад) <blort> - це те, чи можуть екземпляри цього елемента зустрічатися усередині елементів типу <farble>, і те, чи може він сам бути декомпозован на елементи типу <blortette>. Варто підкреслити, що SGML ніяким чиним не визначає семантику елементів; по стандарті вона залежить від додатка.Створення SGML-сумісного набору тегів і завдання їхнього змісту саме і є тією задачею, що вирішують додаткові стандарти, такі як HTML і XML, XSL; саме вони задають конкретну схему маркапа й у частині синтаксису роблять це в термінах SGML. При визначенні елемента йому необхідно привласнити ім'я, що відбиває його призначення; таке ім'я називається generic identifier (GI).

У тексті (document instance, екземплярі документа) кожен елемент повинний бути явно позначений деяким чином. Стандарт надає безліч можливостей зробити це, найбільше часто використовуваним є вставка тега на початку елемента (start-tag) і іншого наприкінці (end-tag). Старт- і енд- теги використовуються щоб узяти в дужки текст, що входить в елемент, точно так само, як різні дужки і лапки в звичайній пунктуації. Наприклад, цитата може бути позначена в такий спосіб:

... Rosalind's remarks <quote>This is the silliest stuff

that ere I heard of!</quote> clearly indicate...

Як видно з цього приклада, старт-тег має форму <gi>, де кутові дужки задають початок і кінець самого старт-тега, а gi - ідентифікатор тега. Енд-тег відрізняється від старт-тега тільки тим, що перед ідентифікатором ставиться коса риса: </gi>.

Можливість завдання правил, що визначають, які елементи можуть бути вкладені в інші елементи - одна з найважливіших характеристик SGML.

 

 

XML (Extensible Markup Language) - це розширювана мова розмітки гіпертексту, розроблена на базі HTML як формат універсального представлення даних в глобальних мережах. Цей формат дозволяє обмінюватися даними через Інтернет в єдиному вигляді між абсолютно різними додатками. XML розширює можливості HTML, оскільки дозволяє створювати додаткові елементи, за допомогою яких можна описувати і визначати нові дані, об'єкти і властивості, відділяючи дані від їх представлення у вигляді HTML, завдяки чому вдається подолати обмеження HTML в можливості опису нестандартних об'єктів. XML офіційно прийнятий концорциумом W3C (World Wide Web Consortium), який займається стандартами, що відносяться до World Wide Web.

Тепер поговоримо про структуру документа XML. Річ у тому, що такий документ може складатися не з одного файлу XML, а з декількох файлів різних типів. Це можуть бути файли наступних типів:

· Web-сторінка для перегляду одержаного документа (у форматі HTML або ASP);

· файл XSL, що містить опис структури зовнішнього представлення документа;

· файл XML, що включає дані, що є джерелом для заповнення документа;

· файл XSD, що містить опис структури даних, звичайно його називають схемою даних.

Це обумовлено логічним розділенням документа XML на окремі частини: дані (XML), структуру даних (XSD) і представлення даних (HTML або ASP, XSL).

Підкреслимо, що всі ці файли разом утворюють єдиний документ Web, який можна переглянути за допомогою браузера. Вони лише описують різні його частини. Проте файл XML (можливо, разом з файлом XSD) може бути використаний незалежно від інших частин такого представлення Web-документа додатками, що розпізнають цей формат даних. Файл у форматі HTML або ASP містить лише сценарій, який активізується при завантаженні сторінки і завантажує дані на сторінку з джерела у форматі XML.

Відділення самих даних від їх представлення (у форматі HTML) і поміщення їх в окремий файл у форматі XML відкриває можливість іншим додатком, що сприймають цей спеціально розроблений універсальний формат, одержувати і обробляти дані (незалежно від їх представлення) з такого документа. Наприклад, дозволяє імпортувати дані у форматі XML в базу даних. Ще відділення даних від їх представлення дозволяє різним додаткам застосовувати різноманітні способи для відображення одних і тих же даних XML за допомогою декількох різних файлів представлення даних.

Файл XSD називається схемою XML. Його зміст задовольняє стандарту XML Schema standard (XSD), офіційно прийнятому концорциумом W3C. Файл схеми XML описує структуру даних в універсальному вигляді, включаючи інформацію про назви елементів, типи даних, комбінаціях елементів, про атрибути елементів. Схема XML визначає модель представлення даних у форматі XML: задає правила для тегів і тексту. Використання схеми XML гарантує правильне сприйняття даних у форматі XML іншими додатками і правильне перетворення цих даних в інші формати даних.

Файл XML містить опис даних, але не містить опис того, як вони повинні бути відображені в програмі перегляду. Ця інформація може надаватись окремо, наприклад у файлах CSS на мові опису стилів Cascading Style Sheet. Проте це не дуже зручно, оскільки розробнику доводиться вивчати ще і мову CSS на додаток до XML, до того ж CSS надає недостатньо засобів для контролю над виведенням даних. В сучасних додатках частіше застосовується гнучкіший засіб для опису зовнішнього представлення даних XML - мова XSL (Extensible Stylesheet Language). Він дозволяє точно вибрати дані, які вимагається відобразити, задати порядок розташування елементів даних, модифікувати і додати додаткову інформацію. Крім того, ця мова схожа на XML: в XSL використовуються XML-подібні теги і HTML для створення шаблону специфічного стилю виведення даних. Зауважимо, що для відображення даних XML в Internet Explorer 5 або вище необов'язково приєднувати файли CSS або XSL, оскільки ця програма перегляду має власний опис стилю, що застосовується за умовчанням.

XML являє собою простий і в той же час потужний та гнучкий текстовий формат опису документів. У форматі XML можна зберігати дані практично будь-якого ступеня структуризації і будь-якого призначення. XML-документ за своєю структурою є деревом. Перехід на специфікації XML дозволяє описувати структуру даних без прив'язки до форми їх відображення, визначати форму подання даних незалежно від конкретного змісту, створювати метадані та керувати доступом до даних тощо.

XML був розроблений XML Working Group (групою раніше відомої як SGML Editorial Review Board), сформованої під керівництвом World Wide Web Consortium (W3C) в 1996 році.

Цілі створення XML:

1. XML буде широко поширений в Internet.

2. XML підтримуватиме великий діапазон додатків.

3. XML буде сумісний з SGML.

4. Він буде легким для написання програм, що обробляють документи XML.

5. Кількість властивостей по вибору (optional) в XML буде зведена до абсолютного мінімуму, в ідеалі — до нуля.

6. Документи XML повинні бути розбірливими і ясними за змістом.

7. Дизайн XML повинен виконуватися швидко.

8. Дизайн XML повинен бути формальним і коротким.

9. Документи XML повинні легко створюватися.

10.Стислість в розмітці XML має мінімальне значення.

XML має багато загального з мовою розмітки HTML, але вони різні по своєму призначенню. HTML, як і XML, є підмножиною SGML, але призначений тільки для відображення інформації в браузере. XML же призначений для структурованого зберігання інформації і не містить ніяких конструкцій для відображення цих даних.

XML по своєму синтаксису дуже схожий на HTML, за винятком того, що в XML можна придумувати власні теги.

По аналогії з HTML, усередині XML-тегов можна використовувати атрибути. Кожний тег в XML повинен мати відповідний закриваючий тег (в HTML це не є обов'язковим). Кожний XML-документ починається з рядка декларації, наприклад:

<?xml version='1.0' encoding='UTF-16' standalone='yes'?>

Цей рядок вказує на версію мови XML (атрибут version), кодування тексту в документі (атрибут encoding) і показує, існує документ сам по собі чи залежить від інших файлів (атрибут standalone).

Приведемо приклад XML-документа.

Нехай у нас є лист. Інформацію, що міститься в ньому, можна зберегти в наступному вигляді:

<?xml version='1.О' encoding='KOI8-R'

standalone='yes'?> <note title="Лист">

<tо>Майборода Олена</to>

<body>Привіт, Олена!

Як у тебе справи?

У мене все добре.

Давай зустрінемось у неділю.</body>

<fгоm>Петро Байдачний</from> </note>

Зберігши цей файл, наприклад, як olena.xml, ми можемо переслати його, переглянути за допомогою браузера або використати в програмі. За допомогою XML можна створити документ для опису будь-якої інформації. Для того, щоб інші розробники могли створювати документи на цій же XML-мові (тобто, використовуючи ті ж теги) і щоб можна було перевірити правильність створеного документа (його відповідність вибраній XML-мові), потрібно формально описати XML-мову, що використовується. Це робиться за допомогою механізмів DTD (Document Type Definition — Визначення типу документа) або Schemas (Схеми), які дають можливість створювати шаблони для нових типів документів. Для експериментів в домашніх умовах створювати DTD-описи необов'язково. Важливо розуміти, що XML насправді зовсім не мова, а стандарт для створення мов, що відповідають критеріям XML.

Між XML-документами можуть бути встановлені посилання, один документ може включати інший, тобто структура документа може бути скільки завгодно складною.

Зауважимо, що для відображення даних XML в Internet Explorer 5 або вище необов'язково приєднувати файли CSS або XSL, оскільки ця програма-браузер має власний опис стилю, що застосовується за замовчуванням.

 




Поделиться с друзьями:


Дата добавления: 2014-12-07; Просмотров: 786; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.03 сек.