XML Schema

langage de description de format de document XML

XML Schema, publié comme recommandation par le W3C en mai 2001, est un langage de description de format de document XML permettant de définir la structure et le type de contenu d'un document XML. Cette définition permet notamment de vérifier la validité de ce document.

XSD
XML Schema
Caractéristiques
Extension
.xsdVoir et modifier les données sur Wikidata
Type MIME
application/xml, text/xmlVoir et modifier les données sur Wikidata
PUID
Signature
3C (hexa)Voir et modifier les données sur Wikidata
Développé par
Version initiale
Basé sur
Sites web

Il est possible de décrire une organisation de vocabulaires d'origines différentes, par l'usage des espaces de noms. Il est possible de combiner les schémas eux-mêmes, et d'exprimer une combinaison pour le document contenu, comme quelqu'un qui parlerait de géographie et de sociologie dans un même texte.

Il est également possible, après une validation, de savoir avec quelle règle une information particulière a été testée : il s'agit du jeu de validation post-schema, ou PSVI (post-schema-validation infoset).

Une définition se compose d'un ou plusieurs documents XML, usuellement nommée (XML Schema Definition en anglais, ou fichier XSD).

Une instance d'un XML Schema est un peu l'équivalent d'une définition de type de document (DTD). XML Schema amène cependant plusieurs différences avec les DTD : il permet par exemple de définir des domaines de validité pour la valeur d'un champ, alors que cela n'est pas possible dans une DTD ; en revanche, il ne permet pas de définir des entités ; XML Schema est lui-même un document XML, alors que les DTD sont des documents SGML.

Ce langage de description de contenu de documents XML est lui-même défini par un schéma, dont les balises de définition s'auto-définissent (c'est un exemple de définition récursive)[1].

La recommandation du W3C 1.0 se compose d'un document de présentation (non normatif), d'un document précisant comment définir la structure, et d'un document précisant comment définir les données. La dernière édition, de version 1.1, de cette recommandation, a été publiée en .

Modèle de XML Schema

modifier

La recommandation spécifie la validation des documents XML à partir d'un modèle abstrait ; elle en fournit le format XML.

Pour ce modèle abstrait, un schéma est un ensemble de composants, tels que :

  • la déclaration d'éléments (la notion d'éléments vient de la recommandation XML),
  • la déclaration d'attributs (qui vient aussi de la recommandation XML),
  • la définition de types simples (valeurs constituées uniquement à partir d'une chaîne de caractères),
  • la définition de types complexes (valeurs constituées d'attributs et d'autres valeurs).

Elle introduit également le type anyType (n'importe quel type), base de tous les types utilisés.

Chaque composant est encadré par une unité d'information, au sens de la recommandation XML Information Set (dite Infoset) du W3C.

Pour ce qui est de l'usage, XML Schema permet de définir éléments et types de valeur soit nommément, soit localement à un contexte nommé. La combinaison de ces deux modes permet de définir quatre techniques : celle dite des poupées russes (on décrit les éléments en les emboîtant les uns dans les autres), celle des tranches de salamis (définitions globales des éléments, mais locale des types), des stores vénitiens (définition locales des éléments, mais globales des types), et du jardin d'Eden (définition globale des éléments et des types)[2].

XML Schema détermine l'unicité comme une combinaison de nœuds, relativement à un contexte, par rapport à leurs composants. Ainsi, on peut par exemple affirmer et vérifier qu'une personne est unique, dans le contexte d'un annuaire, par rapport à son nom et son prénom[3].

Types de données

modifier
 
Arborescence des types de données

Les types de données intégrés sont[4] :

  • string
    • normalizedString, basé sur string
      • token, basé sur normalizedString
        • language, basé sur token
        • NMTOKEN, basé sur token, et duquel dérive NMTOKENS
        • Name, basé sur token
          • NCName, basé sur Name
            • ID, basé sur NCName
            • IDREF, basé sur NCName, et duquel dérive IDREFS
            • ENTITY, basé sur NCName, et duquel dérive ENTITIES
  • duration
  • dateTime
  • date
  • time
  • gYear
  • gYearMonth
  • gMonth
  • gMonthDay
  • gDay
  • boolean
  • NOTATION
  • Qname (Nom Qualifié[5])
  • anyURI
  • base64Binary
  • hexBinary
  • float
  • double
  • decimal
    • integer, basé sur decimal
      • long, basé sur integer
        • nonNegativeInteger, basé sur long
          • positiveInteger, basé sur nonNegativeInteger
          • unsignedLong, basé sur nonNegativeInteger
            • unsignedInt, basé sur unsignedLong
              • unsignedShort, basé sur unsignedInt, et duquel dérive unsignedByte
        • int, basé sur long
          • short, basé sur int, et duquel dérive byte
      • nonPositiveInteger, basé sur integer, et duquel dérive negativeInteger

Exemple

modifier

Un exemple de fichier XSD (personne.xsd):

  <?xml version="1.0" encoding="UTF-8"?>
  <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
    <xs:element name="personne">
      <xs:complexType>
        <xs:sequence>
          <xs:element name="nom" type="xs:string" />
          <xs:element name="prenom" type="xs:string" />
          <xs:element name="date_naissance" type="xs:date" />
        </xs:sequence>
      </xs:complexType>
    </xs:element>
  </xs:schema>

Suivi d'un fichier XML valide :

  <?xml version="1.0" encoding="UTF-8"?>
  <personne xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="personne.xsd">
    <nom>De Latour</nom>
    <prenom>Jean</prenom>
    <date_naissance>1967-08-13</date_naissance>
  </personne>

Mise en œuvre du Dublin Core

modifier

XML Schema correspond à un haut niveau de formalisation dans les schémas de classification. XML Schema permet d'implémenter le standard Dublin Core de métadonnées.

Voir : "XML Schemas to support the Guidelines for implementing Dublin Core in XML recommendation"

Les noms d'éléments sont indiqués de la façon suivante :

<xs:element name="title" type="elementType" />
<xs:element name="creator" type="elementType" />
<xs:element name="subject" type="elementType" />
<xs:element name="description" type="elementType" />
<xs:element name="publisher" type="elementType" />
<xs:element name="contributor" type="elementType" />
<xs:element name="date" type="elementType" />
<xs:element name="type" type="elementType" />
<xs:element name="format" type="elementType" />
<xs:element name="identifier" type="elementType" />
<xs:element name="source" type="elementType" />
<xs:element name="language" type="elementType" />
<xs:element name="relation" type="elementType" />
<xs:element name="coverage" type="elementType" />
<xs:element name="rights" type="elementType" />

Exemple d'utilisation

modifier

XML Schema est utilisé conjointement avec les formulaires XForms pour valider les données dès la saisie.

Historique

modifier

XML Schema est l'aboutissement de diverses propositions venant essentiellement de Microsoft en coopération avec l'université d'Édimbourg en 1998. Il trouve son origine dans le langage de description SGML. Les DTD ayant trouvé leurs limites, Microsoft proposa d'utiliser XML pour décrire des documents XML avec des formats comme XML-Data ou Document Content Description[6] et reçut l'appui de l'université de Darmstadt (Allemagne) en 1999. L'ensemble des propositions convergèrent vers une première spécification de XML Schema début [7].

Notes et références

modifier

Bibliographie

modifier
  • Les web services. Techniques, démarches et outils XML, WSDL, SOAP, UDDI, RosettaNet, UML. Hubert Kadima, Valérie Monfort, Dunod, 2003.

Voir aussi

modifier

Sur les autres projets Wikimedia :

Articles connexes

modifier

Liens externes

modifier