Versione delle 13:58, 3 dic 2006 modifica Hellis (discussione \| contributi) Utenti autoverificati 74 532 modifiche mNessun oggetto della modifica ← Differenza precedente		Versione delle 15:35, 5 dic 2006 modifica annulla 217.220.105.226 (discussione) →‎Varianti di UTF-16 Differenza successiva →
Riga 15: I codici UTF-16 vengono memorizzati come parole di 16 bit, una parola per codice. Dato che l'[[ordine dei byte]] in una parola varia a seconda dell'architettura del calcolatore, UTF-16 prevede tre schemi di codifica, UTF-16, UTF-16LE (''[[Ordine dei byte\|Little Endian]]'')e UTF-16BE (''[[Ordine dei byte\|Big Endian]]''). La codifica UTF-16 impone che l'ordine dei byte venga dichiarato esplicitamente aggiungendo un ''[[Byte Order Mark]]'' come prefisso di ogni testo codificato. Il BOM è la forma codificata del carattere ''Zero width, non breaking space'', corrispondente all'esadecimale 0xFEFF, rappresentato come 0xFE,0xFF sui sistemi ''big endian'' e 0xFF, 0xFE sui sistemi ''little endian''. Le codifiche '''UTF-16BE''' e '''UTF-16LE''' sono identiche alla codifica UTF-16, con l'eccezione che l'ordine dei byte è implicito, ''big endian'' per UTF-16BE, e ''little endian'' per UTF-16LE. Il carattere 0xFEFF all'inizio di un testo rappresentato con una di queste due codifiche viene considerato parte del testo anziche come BOM.

UTF-16: differenze tra le versioni