« Поставить закладку » « Сделать стартовой »

« Форумы » « Блоги » « Статьи » « Новости » « Файлы » « Realcoding IRC » « Site map » « Поиск »


Главная Главная
Анонсы Анонсы
Форумы Форумы
Каталог Каталог
Поиск Поиск
Опросы Опросы
Книжный магазин Книжный магазин
Реклама на сайте
Публикации Публикации
Партнеры Партнеры
Карта Карта сайта
Рассылки Рассылки
RSS экспорт
Настройки Настройки
О нас пишут О нас пишут
Контакты Контакты
Гостевая книга Гостевая книга


ПнВтСрЧтПтСбВс
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  
    Популярное
Преобразование даты в формат Excel

Диалог в стиле wizard'a

Функция DeleteMetaFile

Организация поточной обработки с параметрами

Работа с графиками и диаграммами (TChart, Series)

Практический CSS: рецепт успеха

Пользователь или схема?

Автоматическая обработка ошибок

Обзор Alt Linux 4.0

Глава 5: Постоянство дизайна и другие феи программирования




    Архив файлов



    Сообщества

    Документация

    Кто на сайте
Вы не зарегистрированы.
Имя:

Пароль:

Запомнить

Регистрация позволит Вам пользоваться дополнительными сервисами.
Сейчас на сайте:
Гостей: 165
Пользователей: 0

Статьи:: Интернет технологии :: XML :: Спецификации XML 1.1 и "Пространства имен 1.1"



отправить ссылку другу версия для печати  Обсудить на форуме

Спецификации XML 1.1 и "Пространства имен 1.1"



Что следует знать об этих спецификациях

Данная статья посвящена спецификациям XML 1.1 и Пространства имен 1.1. Ее автор, главный инженер отдела программного обеспечения корпорации IBM, Арнод Ле Хорс рассказывает об изменениях, внесенных в эти спецификации, о том, как эти изменения повлияют на другие спецификации и что это будет значить для пользователей.

4 февраля 2004г. консорциум W3C опубликовал едва ли не "в обстановке повышенной секретности" новую рекомендацию "Расширяемый язык разметки (XML), версия 1.1". В этой спецификации определяется новая версия ныне повсеместно распространенного формата XML. Если учесть значимость языка XML, можно предположить, что это событие должно было бы вызвать настоящую сенсацию, однако, прошло уже несколько месяцев, и лишь относительное очень немногие слышали о существовании XML 1.1. В чем же причина?

В этой статье содержится ответ на этот вопрос, в ней рассматриваются различия между XML 1.0 и XML 1.1, поясняется, что нужно знать о новой спецификации и о связанной с нею спецификацией - "Пространства имен в XML 1.1".

Почему W3C разработал XML 1.1

Когда в 1998г. W3C опубликовал XML 1.0, консорциум выбрал в качестве основы Unicode 2.0, тогдашнюю версию стандарта Unicode. Предназначение этого стандарта - установить уникальное число - код - для каждого существующего символа, благодаря чему все символы можно представлять и корректно обрабатывать компьютерами. Разумеется, присвоение числа каждому символу - это задача, на выполнение которой требуется время. По этой причине консорциум Unicode - орган стандартизации, занимающейся разработкой стандартов Unicode - работал над этим проектом в течение нескольких лет; почти каждый год эта организация выпускает новую версию своего стандарта, причем каждая версия включает целый ряд новых символов. Это означает, что системы, которые зависят от стандарта Unicode, должны проектироваться так, чтобы быть совместимыми вперед, либо корректироваться, чтобы соответствовать новым версиям Unicode.

К сожалению, при проектировании XML 1.0 не была заложена возможность полностью подстраиваться под новые версии Unicode. Несмотря на то, что символы, которые отсутствуют в Unicode 2.0, могут использоваться в символьных данных XML 1.0, они не допустимы в важных конструкциях XML, таких как имена элементов и атрибутов или перечисляемых значениях атрибутов.

Причина этого несоответствия состоит в том, что разработчики XML 1.0 решили ограничиться в этих конструкциях рядом символов (присвоенными номерами), которые были определены в то время. Они понимали, что введение символов, которым еще не были назначены коды, неразумно и рискованно. К сожалению, это также означало, что в случае определения новых символов их использование было невозможно без изменения спецификации языка XML.

Отсутствие поддержки новых символов, которые появлялись по мере выхода очередных версий Unicode, потребовало пересмотра языка XML. Именно это, а также необходимость исправления некоторых ошибок, неизбежных для любой первой редакции спецификации, побудило W3C поручить рабочей группе XML Core заняться разработкой новой языка.

Основные различия между XML 1.1 и XML 1.0

В самом начале работ над XML 1.1 члены рабочей группы XML Core обсуждали возможность изменения основы XML с Unicode 2.0 на последнюю изданную версию Unicode (тогда это была версия 3.0) посредством простого добавления новых символов в существующие конструкции. Однако, это было бы временным решением, поскольку после выхода еще нескольких версий Unicode, рабочей группе пришлось бы начинать все с самого начала. Именно поэтому члены группа избрали более радикальный подход: совместимость снизу вверх.

Несомненно читатель знаком с обратной совместимостью: говорят, что любая система обратно совместима, если она может обрабатывать что-либо, что было создано раньше, чем она была разработана. Совместимость снизу вверх - это способность взаимодействовать с будущими версиями. Стоит обратить внимание на то, что эти характеристики не являются взаимоисключающими - что-либо может быть и обратно совместимо, и совместимо снизу вверх.

В отличие от XML 1.0, XML 1.1 совместим со стандартом Unicode снизу вверх. Это означает, что эта версия XML определена таким образом, что любой разработанный сегодня процессор XML 1.1. может обрабатывать документы, которые используют символы, назначенные только для будущих версий стандарта Unicode.

Каким образом это достигается? Дело в том, что XML 1.0, определяя конструкции, такие как имена элементов, явно допускает определенные символы и исключает любые другие. Таким образом, исключению подлежат все символы, которые еще не определены в Unicode. В случае XML 1.1 применяется противоположный подход: допускаются все возможные символы за исключением определенных символов. Как правило, такие символы либо имеют особое значение для процессоров XML, как, например, отрывающая угловая скобка (<) или символ пробела, либо использование таких символов, например, пустого символа (null character), чревато возникновением проблем. Этот подход означает, что символы, которые в будущем будут добавлены в Unicode, на самом деле уже допускаются в именах элементов и аналогичных конструкциях.

У данного подхода, однако, есть один небольшой изъян. Если потребуется использовать в XML-файле код, который еще не определен в Unicode - то есть этот код не соответствует любому реально существующему символу - процессор XML 1.1 обработает его таким, какой он есть, даже не сгенерировав простого предупреждения. Однако, в конечном счете указанные преимущества перевешивают этот недостаток - особенно если учесть, что в противном случае сначала пришлось бы генерировать такие символы, поскольку большинство инструментальных средств просто не позволяют их использовать.

Другие отличия

Начав работу над новой версией XML, членам рабочей группы показалось разумным исправить и некоторые другие недостатки тогдашней версии XML. Первый из них - это нестыковка между определением обозначением конца строки в XML и тем, как это определено в Unicode. Это несоответствие особенно влияет на IBM- и IBM-совместимые мейнфреймы, а также любые взаимодействующие с ними системы. На этих машинах инструментальные средства отмечают конец строки с помощью символа (NEL), который как таковой не признается XML 1.0. Это означает, что, если на этих системах создать XML-документ с помощью такого простого инструмента как Notepad, а потом передать его в процессор, совместимый с XML 1.0, созданный документ будет отвергнут как некорректно-оформленный. В XML 1.1 эта проблема решается путем добавления символа (#x85) в список символов, которые обозначают конец строки. Для полноты в этот список также включен символ разделителя строки (#x2028).

Кроме того, спецификация XML 1.1 разрешает добавлять в документы символы управления, используя ссылки на символы. Это касается символов управления, находящихся в диапазоне от #x1 до #x1F, большинство которых запрещено в XML 1.0.
Это означает, что теперь документы могут включать символ звуковой сигнализации, например, .. Однако, эти символы пока не могут появляться непосредственно в документах, поскольку это нарушает определение типа mime, используемого для XML (text/xml) и может вызвать проблемы с инструментами, которые ожидают, что XML-файлы будут содержать только текстовые символы, и которые обрабатывают символы управления определенным образом.

Самое последние дополнение, внесенное в XML 1.1, это проверка нормализации символов. Несмотря на то, что изначально предполагалось, что Unicode определит уникальное число для каждого символа, определенные символы - или то, что пользователи считают символами - может на самом деле быть представлено несколькими способами.
Например, "e" с диакритическим знаком (’e в слове r’esum’e) обычно обозначает как одиночный код, присвоенный этому символу (#xE9) или как эквивалентная последовательность нескольких кодов (#x65 для "e" и #x301 для диакритического знака). Кроме того, у некоторых символов вообще нет кода, как, например, седиль у "e" (седиль - это знак, находящийся ниже символа "c" в "facade"). Поэтому их можно представить только комбинируя несколько кодов (в нашем примере, #xE9 для "e", за которым следует седиль - #x327). Существует неограниченное количество возможны комбинаций. В тех случаях, если существует несколько возможных эквивалентных представлений, при простом построчном сравнении эквивалентные строки могут быть признаны как неэквивалентные. Для решения этой проблемы в Unicode определяется несколько способов нормализации строк до их обработки. В XML 1.1 предусмотрено, что процессор XML 1.1 может проверить, находится документ в обычной форме или нет; в случае отсутствия такой информации, разработчикам приложений возможно придется выполнить нормализацию или убедиться, что их код не опирается на специфическую форму текста.

Почему появление XML 1.1 прошло незамеченным

Так почему о XML 1.1 так мало пишут? Если кратко - чтобы избежать хаоса. Успех XML во многом объясняется стабильностью и универсальностью этого языка. Можно быть уверенным, что любой процессор XML 1.0 сможет обработать данные в корректно-оформленном XML-документе. Появление новой версии XML по существу подобно введению нового формата - оно чревато одновременным существованием двух групп процессоров: 1.0 и 1.1. Даже если процессоры XML 1.1 поддержат 1.0 (и, следовательно, будут понимать и документы XML 1.0, и XML 1.1), огромное число существующих инструментов 1.0 "сломаются" на документах XML 1.1. Именно по этой причине необходимо, чтобы XML 1.1 вводился с осторожностью. Поэтому консорциум W3C рекомендует приложениям, которые применяются для создания XML-документов, продолжить максимально возможно использовать XML 1.0, и XML 1.1 - только в случае необходимости. На практике это означает, что если нет причин что-то менять, то ничего менять не следует. Этим объясняет почему большинство людей еще не видело XML 1.1. И хотя инструменты, подобные Xerces поддерживают XML 1.1 уже несколько месяцев, очень не многие это заметили. Благодаря такому подходу при внедрении процессоров XML 1.1 исключается возможность возникновения путаницы, что губительно для всей компьютерной отрасли.

На практике, однако, этой рекомендации W3C, возможно, будет трудно следовать. Если подобная информация не предоставляется вместе с данными, ее будет непросто найти. Очевидно, было бы гораздо проще просто генерировать документы XML 1.1. В идеале такое время должно скоро наступить.

Однако, даже в этом случае необходимо быть готовым к одной особой ситуации. Выше уже говорилось об обратной совместимости и совместимости снизу вверх - однако, к сожалению, XML 1.1 не полностью совместим с XML 1.0 снизу вверх. Дело в том, что несколько символов XML 1.0 недопустимы в XML 1.1 - это символы управления в диапазоне от #x7F до #x9F, которые, чтобы улучшить надежность определения кодировки символов, теперь должны появляться как ссылки на символы. Это требование может показаться странным в версии, которая призвана обеспечить возможность присутствия большего числа символов непосредственно в XML-документе, однако преимущества с точки зрения определения кодировки перевесили эту несогласованность и оказались достаточно значимыми, чтобы оправдать эту небольшую несовместимость. На практике это по-прежнему означает, что при генерации XML-документов 1.1 необходимо отыскать эти символы в данных.

Совместное использование внешних сущностей в документах 1.0 и 1.1

По мере создания XML-документов 1.1, все больше и больше людей захотят использовать внешние сущности и в документах XML 1.0, и XML 1.1. Как известно, одна из особенностей XML заключается в том, содержание может быть повторно использовано - для этого оно может сохранено в отдельных файлах, которые затем могут быть включены в один в другой. Такие части XML называются внешними сущностями (external entities). С появлением XML 1.1 возник вопрос о том, как обрабатывать эти сущности в смешанной среде, т.е. когда сущности XML 1.0 включены в документы XML 1.1. Для простоты в спецификации XML 1.1 говорится о том, что сущности обрабатываются согласно документу, в котором они используются. На практике это означает, что можно использовать старые сущности XML 1.0 в новых документах XML 1.1; чтобы они были помечены как XML 1.1, их не нужно конвертировать или дублировать. Единственная возможная проблема заключается в том, что если добавить один единственный символ XML 1.1 в сущность XML 1.0, процессор не определит это и будет ее обрабатывать как входные данные в XML 1.1. Тем не менее, это единственная проблема, если впоследствии попытаться использовать эту сущность как часть документа XML 1.0.

Спецификация "Пространства имен в XML 1.1"

Одновременно со спецификацией XML 1.1 W3C выпустил спецификацию "Пространства имен в XML 1.1". Новая версия спецификации претерпела минимальное число изменений. По большей части основная причина появления этой редакции заключается в том, что спецификация "Пространства имен в XML 1.0" - в соответствии с тем как она определена - ограничивается XML 1.0, и не может, строго говоря, использоваться с XML 1.1. В новой версии решается не только эта проблема - в ней также определена новая функциональность, о которой стоит упомянуть. Нверное многие задавались вопросом: почему допустимо не объявлять пространства имен по умолчанию, но не разрешается не объявлять определенный префикс? Это решение, принятое проектировщиками первой спецификации XML, оказалось для многих очень неудобным. Действительно, модель оказывается нерегулярной, и это отражается в спецификации Infoset. В новой версии спецификации "Пространства имен в XML 1.1" для устранения этого недостатка предлагается очевидной решение - префикс можно не объявлять, ассоциировав его с пустым пространством имен, например: xmlns:foo="".

Спецификации Infoset и версия 1.1

Характер изменений, появившихся в спецификации XML 1.1 и "Пространства имен в XML 1.1", не потребовал внесения соответствующих изменений в спецификации Infoset. Опубликовав две первые рекомендации, консорциум W3C также выпустил новую редакции спецификации XML Information Set, в которой описывается влияние этих двух спецификаций, но по существу эта редакция ограничивается описанием контента, который можно найти в Infoset. Модель данных не претерпела структурных изменений, и, следовательно, нет необходимости определять новые информационные единицы или модифицировать существующие. Это означает, что разработчикам не нужно озадачиваться этим вопросом: если в программах уже обрабатываются символы Unicode, значит можно обрабатывать новые символы, появившиеся в XML 1.1, ничего не изменяя.

Что еще предстоит сделать

Несмотря на то, что спецификация Infoset не требует внесения изменений, сказанное, к сожалению, не является справедливым в отношении всех других связанных с XML спецификаций. Например, необходимо пересмотреть спецификацию XML Schema. Действительно, тип xml:string, например, определяется на основе символов, допустимых в XML 1.0. Таким образом, на допустимость не будут проверяться строки, которые содержат символы управления XML 1.1. Это означает, что на самом деле XML-схема не может быть использована для проверки документов XML 1.1. Если используются только символы XML 1.1, процессор совместимый с XML-схемой, объявит такой документ недопустимым. Пока неизвестно, как будет решаться эта проблема, однако консорциум знает о ней и занимается ее изучением.

Заключение

Автор надеется, что эта статья снимет "покрывало таинственности", окружающее спецификации XML 1.1 и "Пространства имен в XML 1.1". Этот материал поможет читателю обрабатывать XML 1.1, если от него потребуют поддержать эту версию языка в своих программах. XML 1.1 не является революционной версией - это всего лишь эволюционная версия XML, которая не привносит кардинальных изменений. Большинство людей перейдут на процессоры XML 1.1 после модернизации своих парсеров точно так, как это сделали пользователи Xerces. На самом деле с момента появления версии 2.3.0 Xerces Java может разбирать XML-документы 1.1. А после недавнего выхода 2.5.0 Xerces C++ располагает аналогичными возможностями. Поэтому, читатель может быть даже и не зная об этом, уже выбрал одну из этих или более свежую версию и уже может обрабатывать документы XML 1.1.

Поддержка Unicode в программах

В технологии Java класс String может содержать любой символ Unicode, поэтому поддержка Unicode - всегда доступна. Однако, интерфейс прикладного программирования (API), предоставляемый инструментальным комплектом поддержки разработок (JDK) довольно ограничен, если речь заходит о обработке символов Unicode. По этой причине стоит подумать об использовании международных компонент для Unicode (International Components for Unicode или ICU; см. Ресурсы), которые также существуют для разработчиков C и C++ и содержат набор библиотек для поддержки Unicode, локализации и глобализации программного обеспечения.

Ресурсы

Об авторе

Арнод Ле Хорс (Arnaud Le Hors) - главный инженер отдела программного обеспечения корпорации IBM, он занимается разработкой стандартов ПО, связанных с стратегией компаний IBM "On Demand" (По требованию). Он представляет IBM в различных hабочих группах W3C: XML Core и DOM. Арнод Ле Хорс является редактором нескольких спецификаций, в том числе XML 1.1 и "Пространства имен в XML 1.1"

Оригинальный текст статьи можно посмотреть здесь:
XML 1.1 and Namespaces 1.1 revealed

Автор: Арнод Ле Хорс
Перевод: www.iso.ru




Рубрика: XML




HTML 5: пять вещей вызывающих особый интер....

Html

HTML 5 — это грядущее обновление гипертекстового языка разметки, основного способа создания контента для размещения его во всемирной паутине. Разработка HTML остановилась в 1999 году, на версии HTML 4.01 и с тех пор web-содержимое изменилось так, что текущие спецификации HTML перестали соответствовать сегодняшним требованиям. HTML 5 нацелен на то, чтобы увеличить функциональную совместимость HTML и соответствовать растущим требованиям разнообразного и смешанного web-контента. HTML 5 так же нацелен на устранение недостатков четвертой версии. В этой статье мы взглянем на 5 новых интересных вещей в HTML 5.


Подробнее... | Рубрика: Html | Добавлено: 22.12.2008

asp.net: ListView с разных сторон.

.NET компоненты

Элемент управления ListView был представлен в .Net Framework 3.5 как замена устаревшему GridView. Новый элемент имеет более расширенный функционал, чем его предшественник, но в тоже время лишен некоторых внутренних механизмов, что впрочем целиком следствие из расширенной универсальности ListView. Среди отличий ListView и GridView можно назвать и гибкую настройку разметки, что позволяет выводить данные не только в табличном виде, но и вообще в любом каком пожелает программист. Благодаря шаблонам ItemTemplate, EditItemTemplate, InsertItemTeplate можно настроить внешний вид при любом из состояний ListView: редактировании или выборе элемента.


Подробнее... | Рубрика: .NET компоненты | Добавлено: 22.12.2008

Создание кросс-таб отчета в Stimulsoft Rep....

.NET компоненты

Компания Стимулсофт предоставляет для разработчиков мощный набор инструментов для создания отчетов для Microsoft Visual Studio .Net 2005 и 2008; эти инструменты доступны как для Windows Forms, так и для Web Forms. Это генератор отчетов Stimulsoft Reports.Net. Генератор отчетов Stimulsoft Reports.Net имеет ряд особенностей: простая работа с дизайнером отчетов, полная поддержка экспорта в PDF, Word, Excel и многие другие форматы. Crystal Report и Microsoft Reporting Service – очень хорошие программные продукты для повседневной работы, но, если Вам необходимо создать отчеты с поддержкой кросс-табов, drill down, Ajax, штрих-кодов и возможностью подключения одновременно более одного источника данных, то Stimulsoft Reports.Net поможет Вам сэкономить массу времени. Также, данный генератор отчетов позволяет пользователям создавать свои собственные отчеты любой сложности. И все эти особенности делают Stimulsoft Reports.Net хорошим выбором в сфере программных продуктов для Business Intelligence.


Подробнее... | Рубрика: .NET компоненты | Добавлено: 22.12.2008

Остальные статьи:

VivaMP - инструмент для OpenMP
Создаем контекстно-зависимое WPF-приложени...
Windows Vista SP2: что внутри и что важно?
Вышел MySQL 5.1.30, первый стабильный рели...
Тестирование параллельных программ
Архитектура AMD64 (EM64T)
Платформа 2009. Определяя будущее
Windows Vista Bridge Sample Library - упра...
Оптимизация 64-битных программ
Подгрузка через AJAX HTML-кода, содержащег...
Обзор нового релиза самой мощной Ajax библ...
Firebug 1.3 и 1.4 alpha — что нового и инт...
Релиз Microsoft Silverlight 2.0. Что новог...
XML документация в C#
Курсоры в MySQL 5
Microsoft опубликовала подробности о сесси...
Microsoft делится подробностями о том, что...
Тестируем новый javascript от нового брауз...
MySQL Query Cache
Использование провайдеров компиляции в As...


Цитата дня (все,добавить):

Портал фрилансеров

работа на дому


    Рубрикатор

Программирование

C/С++
Обучение
Windows API
XAML
Моделирование
Паттерны
Visual Basic 7 .NET
WxWidgets
Функции WinApi
Функции С++
Разработка под Mac OS
Eiffel
Visual Studio 2008
UI дизайн
Алгоритмы
Конкурсные статьи
Turbo Pascal
Visual Studio
CASE-средства
Visual Studio 2005
Без VCL
Delphi
Тех. документация
Тестирование
Software Testing
ООП
TCP/IP
Google Android
Windows Installer
.NET Framework
Драйвера
C# C Sharp
Справка
Проектирование
Информ. системы
Visual Basic
Assembler
Оптимизация кода
Gtk+
Компоненты
Реинжиниринг
Управление проектами
Extreeme programming
Lotus Notes
Алгебраическое проектирование


Интернет технологии

PHP
Perl
ASP
WAP
Cookies
SSI
CGI
Web Servers
VB Script
DNS
CSS
XML
Html
Java Script
Java2ME
Firewall
Flash
.htaccess
Apache
VRML
Протоколы
Поисковые системы
Технология JAVA
Учебник по PHP
Учебник по JavaScript
Учебник по XML
Java Q&A
AJAX
DHTML
XHTML
Dreamweaver
Web 2.0
Python
Вебмастеру
Cisco
Ruby on Rails
Silverlight

Базы данных

Access
InterBase
MySQL
Oracle
ADO .NET
Основы SQL
Учебник по Access 2002
MS
Microsoft FoxPro
Доступ к данным
XML в MS SQL Server 2000
ODBC и MyODBC
Обучение
Caché
DB2
PostgresSQL
Sybase
Теория
Хранилища данных
Безопасность
Реляционные данные
MySQL и mSQL

Остальное:

Разное
Обзоры книг
Безопасность
Графика и дизайн
Юмор
Linux
Фракталы
Microsoft Axapta
Многоядерность
Сети
Microsoft Office
Работа
MS-DOS
Криптография
Графика и игроделание
Новости SDK
Системы защиты
Учебник по AutoCad
CVS
Windows XP
Windows Server 2003
Windows Vista
Windows 7
Мероприятия