Šuplík Honzy Hučína

Skok na navigaci (menu)

Tento blog je v současné době uzavřen.
Pokračování blogu na bloguje.cz jsem zrušil. Pokud budu někdy pokračovat, bude to spíš tady.

Jednotlivý článek

Internet a vše kolem
18. 11. 2004

Azbuka v HTML

Umět написать русские буквы v HTML může být důležité, ať už kvůli jazykové mutaci stránek, nebo jen pro správný přepis originálu. Jelikož ale azbuka na české klávesnici a v českém lokálním nastavení Windows není, nedá se zapisovat přímo do kódu stránky.

Existují tři základní možnosti:

  1. Zapsat jednotlivé znaky azbuky pomocí entit Unicode při zachování národního kódování (Windows-1250, iso-8859-2).
  2. Použít pro celou stránku kódování UTF-8 (tagem meta).
  3. Použít pro celou stránku kódování windows-1251.

První a druhý způsob používá univerzální kódování, pomocí něhož lze zapsat prakticky všechny celosvětově používané znaky. Je ovšem trochu obtížnější na zápis a náročnější na přenos dat. Třetí cesta se použije tam, kde chceme mít (téměř) celou stránku v azbuce. Ve všech případech je ale dobré mít při ruce konverzní tabulku.

Způsob 1 těží ze schopnosti současných prohlížečů rozumět zápisům typu &#nnnn;, kde nnnn je čtyřmístné číslo. Dají se tak zapisovat znaky všelijakých abeced, prakticky z celého světa, aniž se mění základní kódování stránky. Potíž je v tom, že na jeden Unicode znak musíte napsat sedm(!) normálních znaků. Psát takhle delší text nebo celý web je děs. Lze si práci ulehčit třeba nějakým konvertorem, ale tím problémy jen posunete na uživatele. Ten totiž musí stáhnout sedmkrát větší objem dat než u textu bez Unicode kódování. Proto lze první způsob doporučit jen pro jednotlivé znaky, maximálně několik slov.

Druhý způsob je myšlenkově podobný prvnímu, pouze se speciálním způsobem musejí zapisovat jak typicky české znaky, tak azbuka. Bez softwaru, který zajistí konverzi, se zápis v kódování UTF-8 stává tvrdým oříškem.

Třetí způsob je pro přenos dat úspornější (jeden přenesený znak odpovídá jednomu vykreslenému znaku), ale neodstraňuje tak zcela potíže se zápisem. Kdo si má pamatovat, že я se zapisuje jako ß a malý tvrdý znak jako velké Ú? A jak vlastně některé podivné znaky vůbec zapsat? Naštěstí ve Windows funguje zápis pomocí Alt: podrží se (levé) Alt, na numerické klávesnici se naťuká kód, načež se Alt pustí.

Pozor na to, že na stránce kódované pomocí windows-1251 již nelze použít některé české znaky (ty se při tomto kódování změní na znaky azbuky)! Tento postup se tak dá uplatnit hlavně u stránek, které jsou celé psány azbukou.

Zde je tabulka kódování azbuky pomocí Unicode a windows-1251.

Doporučuji se podívat i na převodník kódování různých abeced.

Komentáře (počet: 13, poslední 1. 8. 2012, 17:09, nelze přidat komentář)
RSS komentářů tohoto článku
Trvalý odkaz

Poslední články:

Další články si můžete vyhledat v jednotlivých přihrádkách, případně podle data.

© Honza Hučín 2004–6

Šuplík běží na PIPNI.CZ. Díky!

sber.cermat.cz

RSS Šuplíku

RSS komentářů – souhrnně

U každého článku je samostatný RSS kanál pro komentáře.

Výběr článků

Posledních 10 článků

nebo podle data:

nebo hledání fulltextem:

Archiv všech článků

Poslední komentáře

Zabili mě, parchanti [2]

8. 8. 16:48 | Pepa

Cestou kolem blogu [2]

7. 8. 21:26 | Honza Hučín

Cestou kolem blogu [1]

7. 8. 21:02 | Honza

Vrtulník nad hlavou [3]

6. 8. 14:29 | Pepa

Taková hra na volby [1]

3. 8. 18:29 | Honza

Nejčtenější

Žádné údaje nejsou k dispozici.

O mně

*1967, absolvent MFF UK v Praze (1991)

statistik, analytik, programátor, učitel, hudebník

nyní Ústav pro informace ve vzdělávání

Životopis (RTF)

Napište mi