Šuplík Honzy Hučína

Skok na navigaci (menu)

Tento blog je v současné době uzavřen.
Pokračování blogu na bloguje.cz jsem zrušil. Pokud budu někdy pokračovat, bude to spíš tady.

Komentovaný článek

Internet a vše kolem
1. 2. 2005

Po modemech přišlo asi deset procent

Stránka o velikosti 69 KB se polovině uživatelů mých stránek načetla do dvou sekund od kliknutí na odkaz. 95 % uživatelů pak tuto stránku načetlo nejpozději do deseti sekund. Když se to přepočte na orientační rychlost stahování, vychází, že klasické „pomalé“ modemy má dnes už jen velmi malá skupina lidí, zhruba deset procent.

Vyplývá to z měření, které probíhalo na převodní tabulce s azbukou od listopadu do půlky ledna. Za přístup k logům děkuji Yuhůovi a Českému hostingu.

Celkem jsem zpracoval data za 445 přístupů z 319 IP. To samozřejmě není mnoho. A protože jsem u podstatné části uživatelů dobu načtení odhadoval z jiného údaje, mohou být data zatížena další chybou. Na žádné zobecnění si tudíž netroufám. Ale přinejmenším je to zajímavý a prakticky použitelný údaj (aspoň pro mě).

Metodika měření

Na měřicí stránce nebyly žádné obrázky ani styly, pomocí textu v komentáři jsem ji zvětšil na 69 KB. Pomocí HTTP hlaviček jsem se snažil maximálně omezit kešování – z dat vyplývá, že se to povedlo. Uživatel tak musel při každém přístupu stáhnout stránku celou, ale protože naprostá většina z ní byla skrytá v komentáři, z pohledu uživatele se zdánlivě stahovalo vždy jen asi 15 KB.

Na čtyřech místech jsem zaznamenával aktuální čas a ukládal ho javasciptem do logu:

  1. při kliknutí na odkaz vedoucí na stránku,
  2. když prohlížeč začne zpracovávat tělo stránky,
  3. když prohlížeč dokončuje zpracování těla stránky,
  4. při události onload, tedy při kompletním načtení stránky.

Už dřív jsem zjistil, že se o údaje 2 a 3 nelze přímo opřít. Prohlížeč totiž chvíli čeká, než začne stránku zpracovávat, a tak mezi událostmi 1 a 2 může uplynout delší doba než mezi 2 a 3. Pro uživatele je ale stejně nejdůležitější, jak dlouho od kliknutí trvá, než má stránku načtenou. Takže nejlogičtější a nejspolehlivější je použít události 1 a 4, resp. časový rozdíl mezi nimi.

Potíž s údajem 1 je v tom, že na měřicí stránku přicházejí lidé i odjinud (např. z Googlu) a nelze mít javascript ve všech odkazech. Takže asi polovina pozorování měla pouze údaje 2 až 4. Ukázalo se ovšem, že rozdíly mezi událostmi 2 a 4 výborně korelují s rozdíly 1 a 4 (korelační koeficient 0,756). Tím pádem jsem celkovou dobu načítání u neúplných pozorování odhadl lineární regresí.

Kromě jedné hlavní měřicí stránky jsem měl ještě dvě další s jinými velikostmi. Na nich se naměřilo málo pozorování, ale pro kontrolu hlavního měření to stačilo.

Výsledky

Graf uvádí, jak velké části uživatelů se načetla celá stránka do příslušné doby. Doba je v milisekundách, uvedené číslo v popisku je horní mezí. Tedy například od 2000 do 3000 ms stránku načítalo 13 % uživatelů.

Když se velikost stránky vydělí dobou načítání, dostaneme průměrnou rychlost zpracování. To je samozřejmě orientační údaj a není totožný s rychlostí stahování dat (ve zpracování je navíc čekání na vyřízení HTTP požadavku, činnost prohlížeče apod.). Ale rychlost stahování se z toho dá odhadnout.

V grafu opět popisky znamenají horní mez. Je vidět, že naprostá většina uživatelů má průměrnou rychlost zpracování stránky mezi 20 a 100 KB/s, víc jich je mezi 50 a 100 KB/s. U těchto rychlostí lze čekání na vyřízení požadavku zanedbat. Takže vychází, že třetina uživatelů dosahuje rychlost stahování mezi 50 a 100 KB/s, další třetina pak mírně pod 50 KB/s.

Klasičtí modemisté na telefonní lince jsou podle mého odhadu zastoupeni v prvních třech sloupcích. Když se podíly sečtou, dostáváme, že uživatelů připojených telefonní linkou a klasickým modemem je přibližně 10 procent.

Poznámky

Nevzal jsem v úvahu možnost datové komprese, nerozumím tomu. Aktivně jsem ji nenastavoval, ale je možné, že ji Pipni.cz zapíná automaticky.

Je možné, že uživatelů z pomalých připojení přišlo víc, ale odpadli z měření kvůli tomu, že zavřeli okno prohlížeče, než se stránka načetla. Několik ojedinělých podezřelých záznamů tohoto typu v datech bylo.

Vložit vlastní komentářNávrat k článkuRSS komentářů tohoto článku

Komentáře

[1] 1. 2. 2005, 13:23 – Shaman (Odkaz)

Zajímavé. Jenom mi 10 procent pořád přijde hodně (nikoliv jako "velmi malá skupina") - alespoň z hlediska optimalizace velikosti grafiky...

[2] 1. 2. 2005, 14:33 – Pachollini (Odkaz)

Já bych jenom dodal: 10% lidí, které zajímá převod azbuky na HTML entity, tedy asi webdesignérů, kteří IMHO modem moc často nepoužívají.
Informace o kompresi jsou ve Firefoxu vidět ve vlastnostech stránky nebo ještě lépe přes rozšíření Live HTTP headers.

[3] 1. 2. 2005, 15:04 – rony

za dost sporne pokladam, ze uzivatelia cakaju na dotiahnutie stranky.

dost podstatny je moment "ked mozem zacat stranku prezerat" a ten moze nastat individualne - zlozita stranka s komplikovanou strukturou sa konecne usadi na monitore casto az po nacitani, ina stranka v pohode zobrazi podstatny obsah a postupne si natahuje "dekoracie".

je jasne, ktoru stranku mam radsej ;-)

[4] 1. 2. 2005, 17:18 – kelvin (Odkaz)

Mám doma modem, protože není jiná možnost připojení. Ale za ty prachy co za to žlutá mrcha chce si projdu pár stránek a e-mail a odpojuji se.
Na blogy apod. lezu přes kolejní internet.
Rychlost načítání v sekundách - z toho se dá zjistit typ připojení? Modem mi to tu načte určitě rychleji než za 10 sekund. Naopak na koleji máme jen mikrovlné pojítko pro 800 počítačů, děsnou ztrátovost packetů a stránky se občas načítají velice pomalu, někdy vůbec.
Pokud se nemýlím, tak na pooh.cz na podzim byly uvedené statistiky, že modem má 85% českých rodin. Nepočítám gprs, které bylo pro spoustu mých známých spása.

[5] 1. 2. 2005, 18:30 – Honza Hučín (Odkaz)

Ad [2] Asi polovina uživatelů přišla na měřicí stránku přes tento nebo jiný blog. Bylo to v hlavičce Šuplíku, ale ano, byli to hlavně webdesigneři. Ti z vyhledávačů nevím, například na slovo "azbuka" jsem na první stránce českých stránek v Googlu, takže mohlo přijít i pár laických zvědavců.

[6] 2. 2. 2005, 03:19 – dgx (Odkaz)

Kontroloval jsem to a stránka se neodesílá komprimovaná.

[7] 2. 2. 2005, 08:04 – Honza Hučín (Odkaz)

Ad [4]: Modem má doma kdekdo, to je pravda. Ale daleko víc brouzdá, když má rychlejší linku, třeba v práci nebo ve škole. Dokládá to přesně i tvůj případ, já jsem na tom stejně. Tudíž je mnohem víc přístupů po rychlejších linkách.
Ad [6]: Díky.

[8] 3. 2. 2005, 02:00 – kelvin (Odkaz)

ad[4] - ok já to celkem chápu. Ovšem přes léto budu pravdepodobne jen na modemu. Jen nechci aby třeba [1], to pochopil tak, že modem má 10% lidu. Na weby načítající se pomalu po modemu se nevracím ani na rychlé lince - kvůli tomu, že nevím o čem jsou. K těm ovšem šuplík nepatří, 64 KB není nic ;).

[9] 13. 4. 2005, 17:57 – Yuhů (Odkaz)

Možná bych zpochybnil tu veličinu 10% uživatelů modemu. Zpochybňuji ty uživatele. Nemám pochyb o tom, že to bylo 10% návštěv. Návštěvy ale nejsou uživatelé.

Osobně se domnívám, že uživatelů modemu je více, jenom vyvíjejí podstatně nižší aktivitu.

[10] 14. 4. 2005, 12:58 – Honza Hučín (Odkaz)

Ad [9] Souhlasím, je to nepřesné vyjádření. Mělo by být "10% přístupů".

K tomuto článku není možné vkládat komentáře.

© Honza Hučín 2004–6

Šuplík běží na PIPNI.CZ. Díky!

sber.cermat.cz

RSS Šuplíku

RSS komentářů – souhrnně

U každého článku je samostatný RSS kanál pro komentáře.

Výběr článků

Posledních 10 článků

nebo podle data:

nebo hledání fulltextem:

Archiv všech článků

Poslední komentáře

Zabili mě, parchanti [2]

8. 8. 16:48 | Pepa

Cestou kolem blogu [2]

7. 8. 21:26 | Honza Hučín

Cestou kolem blogu [1]

7. 8. 21:02 | Honza

Vrtulník nad hlavou [3]

6. 8. 14:29 | Pepa

Taková hra na volby [1]

3. 8. 18:29 | Honza

Nejčtenější

Žádné údaje nejsou k dispozici.

O mně

*1967, absolvent MFF UK v Praze (1991)

statistik, analytik, programátor, učitel, hudebník

nyní Ústav pro informace ve vzdělávání

Životopis (RTF)

Napište mi