Gli URL devono essere formati, cioè scritti, attraverso uno specifico insieme di caratteri che è lo US ASCII (composto da 127 caratteri).
Se si ha la necessità di utilizzare un carattere che non fa parte dell'insieme US ASCII, ma è parte dei primi 256 caratteri di uno specifico super insieme come UTF-8, si deve utilizzare una speciale codifica formata da un iniziale carattere di % seguito da due cifre esadecimali.
Le due cifre esadecimale rappresentano l'identificativo
del carattere nel super insieme utilizzato: %20 rappresenta il carattere di spaziatura,
%2f lo slash, %d8 lo zero barrato Ø.
Di norma i primi 256 caratteri sono gli stessi
qualsiasi sia il super set di US ASCII che si utilizza.
I sistemi operativi hanno specifici programmi per la gestione e la visualizzazione del set di caratteri; tali programmi possono essere utilizzati per conoscere i vari codici di identificazione e a quali caratteri tali codici corrispondono.
La speciale codifica deve essere utilizzata anche quando si voglio utilizzare, per formare un URL, i così detti caratteri riservati; i caratteri riservati sono quelli che hanno uno speciale significato nella sintassi stessa di un URL.
Descrizione | Simbolo | Codice |
---|---|---|
Punto e virgola | ; | %3b |
Barra | / | %2f |
Punto di domanda | ? | %3f |
Due punti | : | %3a |
Chiocciola | @ | %40 |
Uguale | = | %3d |
e Commerciale | & | %26 |
In linea di massima si può affermare che è buona regola utilizzare la speciale codifica ogni volta che per formare un URL si vogliono utilizzare caratteri che non sono nè lettere nè numeri; ciò per evitare di utilizzare caratteri che possono confondere i programmi che, di volta in volta, sono deputati ad interpretare gli URL.