UTF-16: differenze tra le versioni

1 byte aggiunto ,  10 anni fa
m
ortografia
(+ wlink nell'incipit)
m (ortografia)
La codifica UTF-16 impone che l'ordine dei byte venga dichiarato esplicitamente aggiungendo un ''[[Byte Order Mark]]'' come prefisso di ogni testo codificato. Il BOM è la forma codificata del carattere ''Zero width, non breaking space'', corrispondente all'esadecimale 0xFEFF, rappresentato come 0xFE,0xFF sui sistemi ''big endian'' e 0xFF, 0xFE sui sistemi ''little endian''.
 
Le codifiche '''UTF-16BE''' e '''UTF-16LE''' sono identiche alla codifica UTF-16, con l'eccezione che l'ordine dei byte è implicito, ''big endian'' per UTF-16BE, e ''little endian'' per UTF-16LE. Il carattere 0xFEFF all'inizio di un testo rappresentato con una di queste due codifiche viene considerato parte del testo anzicheanziché come BOM.
 
La [[IANA]] ha approvato i nomi UTF-16, UTF-16BE e UTF-16LE, indifferentemente maiuscoli o minuscoli, per l'uso su [[Internet]]. I nomi '''UTF_16''' o '''UTF16''', comunemente usati, potrebbero essere riconosciuti da specifici linguaggi di programmazione o applicazioni, ma non sono ufficialmente validi.
447 898

contributi