Unicode už používá 60 % všech webů na internetu

Každý leden Google zpracovává statistiku znakového kódování na webech, které indexuje. Podle té aktuální překročilo kódování z rodiny Unicode (hlavně webový standard UTF-8) hranici 60 % a konečně začíná vládnout světovému internetu. I český web se pomalu zbavuje znakových sad ISO-8859-2 a Windows-1250, které byly typické pro tuzemský web ještě před několika málo lety.

unicode google.png
Růst Unicode podle Googlu

Unicode je univerzální kódování, neboť díky svému rozsahu dokáže identifikovat až milion znaků. Jinými slovy, Unicode může bez problému pojmout všechny světové abecedy včetně exotických typografických a kaligrafických znaků. Není tedy žádným překvapením, že Unicode definuje i znak v podobě hromádky lejna.

pile of poo.png
Hromádka lejna – oficiální znak Unicode číslo 1F4A9

Google používá Unicode pro všechny textové procesy a všechny vstupy do tohoto kódování před zpracováním také konvertuje. S Unicode pracují také všechny současné moderní operační systémy.

Mnozí lidé si občas pletou znakovou sadu s konkrétními fonty. Znaková sada pouze systému říká, jaký má který znak číslo – identifikuje ho. Nicméně záleží pouze na autorovi písma, kolik skutečných znaků opravdu nakreslí a zavede do svého písma. A to je oříšek, Unicode verze 6.1 totiž obsahuje 110 tisíc znaků všech abeced.

Nicméně ani Unicode není dokonalý, stále totiž nepopisuje abecedu, kterou používá kód Matrixu.

Diskuze (25) Další článek: Google pro tajný projekt najal zkušeného šéfa z Applu

Témata článku: , , , ,