UTF-16: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
mNessun oggetto della modifica
Riga 15:
I codici UTF-16 vengono memorizzati come parole di 16 bit, una parola per codice. Dato che l'[[ordine dei byte]] in una parola varia a seconda dell'architettura del calcolatore, UTF-16 prevede tre schemi di codifica, UTF-16, UTF-16LE (''[[Ordine dei byte|Little Endian]]'')e UTF-16BE (''[[Ordine dei byte|Big Endian]]'').
 
La codifica UTF-16 impone che l'ordine dei byte venga dichiarato esplicitamente aggiungendo un ''[[Byte Order Mark]]'' come prefisso di ogni testo codificato. Il BOM è la forma codificata del carattere ''Zero width, non breaking space'', corrispondente all'esadecimale 0xFEFF, rappresentato come 0xFE,0xFF sui sistemi ''big endian'' e 0xFF, 0xFE sui sistemi ''little endian''.
 
Le codifiche '''UTF-16BE''' e '''UTF-16LE''' sono identiche alla codifica UTF-16, con l'eccezione che l'ordine dei byte è implicito, ''big endian'' per UTF-16BE, e ''little endian'' per UTF-16LE. Il carattere 0xFEFF all'inizio di un testo rappresentato con una di queste due codifiche viene considerato parte del testo anziche come BOM.