ASCII: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Un errore
Etichette: Modifica visuale Modifica da mobile Modifica da web per mobile
Riga 14:
Alla specifica iniziale basata su codici di 7 [[bit]] fecero seguito negli anni molte proposte di estensione ad 8 bit, con lo scopo di raddoppiare il numero di caratteri rappresentabili. Nei PC IBM si fa per l'appunto uso di una di queste estensioni, ormai [[standard de facto]], chiamata ''[[ASCII esteso|extended ASCII]]'' o ''high ASCII''. In questo ASCII esteso, i caratteri aggiunti sono vocali accentate, simboli semigrafici e altri simboli di uso meno comune. I caratteri di ASCII esteso sono codificati nei cosiddetti ''codepage''.
 
== ASCIIDifferenze edcon l'UTF-8 ==
{{vediVedi anche|UTF-8}}
Lo standard cheASCII staè prendendodestinato piede e che dovrebbead essere ilsostituito successore di ASCII èda [[UTF-8]], specie da quando è diventato la codifica principale di [[Unicode]] per internet secondo il [[W3C]], che pur non impedendo altre codifiche (purché correttamente dichiarate), lo consiglia e lo usa quasi sistematicamente negli esempi del suo sito<ref>{{Cita web|url = https://www.w3.org/International/O-charset.en.php|titolo = Character encodings|sito = W3C|accesso = 22 giugno 2015|lingua = en}}</ref> fornendo anche le istruzioni per convertire i documenti (cosa che non fornisce per tutte le codifiche)<ref>{{Cita web|url = https://www.w3.org/International/questions/qa-changing-encoding|titolo = Changing an HTML page encoding to UTF-8|sito = W3C|accesso = 22 giugno 2015|lingua = en}}</ref>. Questa codifica di [[Unicode]] che ormai è universalmente accettata da ogni nuovo programma offre caratteristiche interessanti grazie al fatto di sfruttare il bit di controllo del vecchio ASCII in modo più efficiente. Se da una parte lo prepara per la pensione, UTF-8 in un certo senso ha reso molto più longevo l'ASCII, inglobandolo in una codifica più adatta alle esigenze attuali. Infatti le comunicazioni sono in centinaia di lingue, ed inoltre diverse lingue possono convivere in uno stesso documento, o in uno stesso programma: si pensi ai [[software]] di [[messaggistica istantanea]] che possono contenere contatti da varie parti del mondo dei quali visualizzare correttamente i nomi.
 
UTF-8 infatti si distingue dalle altre codifiche Unicode perché sfrutta il vecchio bit di parità di ASCII, non come bit di controllo, bensì come indicatore: analizza ogni byte, e se al posto del vecchio bit di parità c'è 0, allora il byte sarà letto come ASCII a 7 bit e teoricamente compatibile anche da programmi obsoleti; se però il byte corrente inizia con 1, allora sarà concatenato al byte successivo (o ai successivi, in realtà il meccanismo è un poco più complesso). In tal modo riesce ad includere tutti gli alfabeti delle lingue viventi, di alcune morte e potenzialmente può essere esteso per rappresentarne ancora altri (infatti spesso viene aggiornato).