UTF-16: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Agnul (discussione | contributi)
Meglio tardi che mai :-)
 
Agnul (discussione | contributi)
m Correzione link a Endianness (spelling).
Riga 13:
== Varianti di UTF-16 ==
 
I codici UTF-16 vengono memorizzati come parole di 16 bit, una parola per codice. Dato che l'[[EndianessEndianness|ordine dei byte]] in una parola varia a seconda dell'architettura del calcolatore, UTF-16 prevede tre schemi di codifica, UTF-16, UTF-16LE (''[[EndianessEndianness|Little Endian]]'')e UTF-16BE (''[[EndianessEndianness|Big Endian]]'').
 
La codifica UTF-16 impone che l'ordine dei byte venga dichiarato esplicitamente aggiungendo un ''Byte Order Mark'' come prefisso di ogni testo codificato. Il BOM è la forma codificata del carattere ''Zero width, non breaking space'', corrispondente all'esadecimale 0xFEFF, rappresentato come 0xFE,0xFF sui sistemi ''big endian'' e 0xFF, 0xFE sui sistemi ''little endian''.