Banalità

25/10/2004

UTF-8

Tag:, — oracolo @ 5:05 pm

C’era un tempo, lontano lontano, in cui l’unica certezza era l’ASCII. Qualsiasi trasgressione a questo standard era severamente punita: se aveste usato caratteri accentati (cosa invero alquanto comune, in Italia) all’interno di una e-mail destinata ad un amico in un’altra nazione o utente di un differente sistema operativo, con buona probabilità le vostre eleganti “è” sarebbero state lette come simboli indecifrabili.

Dapprima si cercò una soluzione standardizzando anche le codepage. Poi qualcuno inventò l’Unicode, uno standard ambizioso che si prefigge di rappresentare con bit (e bit standard, soprattutto) la totalità dei glifi usati nei linguaggi umani.

C’è chi lotta perché nell’Unicode vengano accettati anche il Klingon ed il Tengwar, per darvi un’idea delle dimensioni del progetto e della varietà di caratteri standardizzati.

L’UTF-8 del titolo è una codifica che permette di rappresentare ogni carattere dell’Unicode con una sequenza di caratteri ad 8 bit, che mira ad una certa compatibilità con i formati esistenti nei casi di testi conformi allo standard ISO-8859-15. Le nostre amate accentate sono rappresentate con due byte, mentre caratteri particolarmente inusuali possono venire rappresentati con sequenze di byte più lunghe.

Il succo di questo? Se il vostro browser supporta UTF-8 ed il font che usate contiene gli appropriati glifi, potete vedere in questa stessa pagina scritte in

greco antico: Ὦ φῶς, τελευταῖόν σε προσϐλέψαιμι νῦν

arabo: السلام عليك

ebraico: אני לא מדבר עברית

cinese: 你會說漢語嗎

giapponese: わたしはあなたが好きです

o addirittura in tengwar:

󲀪󲁀 󲀐󲀟󲁀󲀇 󲀄󲀔󲁈󲀅󲀀󲁀󲀚󲁈󲀃󲁉 󲀪󲁀 󲀐󲀟󲁀󲀇 󲀇󲀅󲁌󲁄󲀀󲁀󲀚󲁈

󲀪󲁀 󲀐󲀟󲁀󲀇 󲀈󲀘󲀃󲁀󲀀󲁀󲀚󲁈󲀃󲁉 󲀯󲁀 󲀅󲀔󲁈󲀞󲀑󲁈󲀪󲁄󲀥󲁄 󲀃󲀘󲀁󲁌󲁄󲀀󲁀󲀚󲁈

ma è improbabile che vediate correttamente la frase qui sopra (che per i curiosi è la famosa “Un anello”) perché non è ancora propriamente parte dello standard ed i suoi glifi sono presenti solo in pochi font. Sigh.

Post vagamente correlati:

  1. Bricking Una nota a margine: non esiste un modo giusto di...
  2. Crittografia Cosa mi affascina nelle crittografie (quelle in senso enigmistico) nonostante...
  3. Delle faccine Sono bandite da questo blog – commenti a parte –...
  4. Ke? Nn hai kapito!!! Momento di riflessione: quanti simboli occupano lo spazio fra il...
  5. Abitudini Rasoio, schiuma da barba, asciugamano lo fa solo per pavoneggiarsi...

Nessun commento »

Non c'è ancora nessun commento.

RSS feed dei commenti a questo articolo. TrackBack URL

Lascia un commento

XHTML: You can use these tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Powered by WordPress