Entità
- I documenti XML sono costituiti da una serie di entità. Il
documento stesso è una entità.
- Tutte le entità, tranne il documento e il DTD esterno, hanno un nome.
- Le entità parsed sono quelle più comuni, e il parser XML le
sostituisce sempre col loro testo di definizione.
- Le entità unparsed possono contenere qualsiasi tipo di dato,
anche non testuale. Il parser XML non le analizza, e sono accessibili solo
usando le notazioni.
- Le entità parsed sono un modo pratico per inserire stringhe nel
documento facendo riferimento a una definizione separata, invece di
scriverle esplicitamente.
- Sono utili nel caso ci siano caratteri non digitabili direttamente,
o per espandere stringhe usate di frequente, oppure per scrivere caratteri
che non sono ammessi in maniera esplicita in un contesto, perché
riservati (come le virgolette o i segni ‘<’ e ‘>’).
Sintassi
Le entità generali, che possono rappresentare stringhe qualsiasi,
sono definite nel DTD e si
richiamano nel documento XML con la sintassi:
- dove nome è il nome dell’entità.
Le entità carattere, che rappresentano singoli caratteri, si
richiamano con la sintassi:
- dove numero è il codice decimale UNICODE per il carattere.
oppure con la sintassi:
- dove numero è il codice esadecimale UNICODE per il
carattere.
Testo
- Il testo inseribile nei documenti XML comprende tutti i caratteri
definiti in UNICODE.
- È possibile inserire caratteri speciali o riservati tramite entità
carattere.
- È possibile inserire stringhe predefinite tramite entità generali.
- Non è possibile usare esplicitamente i caratteri ‘>’, ‘<’
e ‘&’, per i quali è sempre necessario usare le corrispondenti
entità carattere.