Šuplík Honzy Hučína

Skok na navigaci (menu)

Tento blog je v současné době uzavřen.
Pokračování blogu na bloguje.cz jsem zrušil. Pokud budu někdy pokračovat, bude to spíš tady.

Jednotlivý článek

Internet a vše kolem
1. 2. 2005

Po modemech přišlo asi deset procent

Stránka o velikosti 69 KB se polovině uživatelů mých stránek načetla do dvou sekund od kliknutí na odkaz. 95 % uživatelů pak tuto stránku načetlo nejpozději do deseti sekund. Když se to přepočte na orientační rychlost stahování, vychází, že klasické „pomalé“ modemy má dnes už jen velmi malá skupina lidí, zhruba deset procent.

Vyplývá to z měření, které probíhalo na převodní tabulce s azbukou od listopadu do půlky ledna. Za přístup k logům děkuji Yuhůovi a Českému hostingu.

Celkem jsem zpracoval data za 445 přístupů z 319 IP. To samozřejmě není mnoho. A protože jsem u podstatné části uživatelů dobu načtení odhadoval z jiného údaje, mohou být data zatížena další chybou. Na žádné zobecnění si tudíž netroufám. Ale přinejmenším je to zajímavý a prakticky použitelný údaj (aspoň pro mě).

Metodika měření

Na měřicí stránce nebyly žádné obrázky ani styly, pomocí textu v komentáři jsem ji zvětšil na 69 KB. Pomocí HTTP hlaviček jsem se snažil maximálně omezit kešování – z dat vyplývá, že se to povedlo. Uživatel tak musel při každém přístupu stáhnout stránku celou, ale protože naprostá většina z ní byla skrytá v komentáři, z pohledu uživatele se zdánlivě stahovalo vždy jen asi 15 KB.

Na čtyřech místech jsem zaznamenával aktuální čas a ukládal ho javasciptem do logu:

  1. při kliknutí na odkaz vedoucí na stránku,
  2. když prohlížeč začne zpracovávat tělo stránky,
  3. když prohlížeč dokončuje zpracování těla stránky,
  4. při události onload, tedy při kompletním načtení stránky.

Už dřív jsem zjistil, že se o údaje 2 a 3 nelze přímo opřít. Prohlížeč totiž chvíli čeká, než začne stránku zpracovávat, a tak mezi událostmi 1 a 2 může uplynout delší doba než mezi 2 a 3. Pro uživatele je ale stejně nejdůležitější, jak dlouho od kliknutí trvá, než má stránku načtenou. Takže nejlogičtější a nejspolehlivější je použít události 1 a 4, resp. časový rozdíl mezi nimi.

Potíž s údajem 1 je v tom, že na měřicí stránku přicházejí lidé i odjinud (např. z Googlu) a nelze mít javascript ve všech odkazech. Takže asi polovina pozorování měla pouze údaje 2 až 4. Ukázalo se ovšem, že rozdíly mezi událostmi 2 a 4 výborně korelují s rozdíly 1 a 4 (korelační koeficient 0,756). Tím pádem jsem celkovou dobu načítání u neúplných pozorování odhadl lineární regresí.

Kromě jedné hlavní měřicí stránky jsem měl ještě dvě další s jinými velikostmi. Na nich se naměřilo málo pozorování, ale pro kontrolu hlavního měření to stačilo.

Výsledky

Graf uvádí, jak velké části uživatelů se načetla celá stránka do příslušné doby. Doba je v milisekundách, uvedené číslo v popisku je horní mezí. Tedy například od 2000 do 3000 ms stránku načítalo 13 % uživatelů.

Když se velikost stránky vydělí dobou načítání, dostaneme průměrnou rychlost zpracování. To je samozřejmě orientační údaj a není totožný s rychlostí stahování dat (ve zpracování je navíc čekání na vyřízení HTTP požadavku, činnost prohlížeče apod.). Ale rychlost stahování se z toho dá odhadnout.

V grafu opět popisky znamenají horní mez. Je vidět, že naprostá většina uživatelů má průměrnou rychlost zpracování stránky mezi 20 a 100 KB/s, víc jich je mezi 50 a 100 KB/s. U těchto rychlostí lze čekání na vyřízení požadavku zanedbat. Takže vychází, že třetina uživatelů dosahuje rychlost stahování mezi 50 a 100 KB/s, další třetina pak mírně pod 50 KB/s.

Klasičtí modemisté na telefonní lince jsou podle mého odhadu zastoupeni v prvních třech sloupcích. Když se podíly sečtou, dostáváme, že uživatelů připojených telefonní linkou a klasickým modemem je přibližně 10 procent.

Poznámky

Nevzal jsem v úvahu možnost datové komprese, nerozumím tomu. Aktivně jsem ji nenastavoval, ale je možné, že ji Pipni.cz zapíná automaticky.

Je možné, že uživatelů z pomalých připojení přišlo víc, ale odpadli z měření kvůli tomu, že zavřeli okno prohlížeče, než se stránka načetla. Několik ojedinělých podezřelých záznamů tohoto typu v datech bylo.

Komentáře (počet: 10, poslední 14. 4. 2005, 12:58, nelze přidat komentář)
RSS komentářů tohoto článku
Trvalý odkaz

Poslední články:

Další články si můžete vyhledat v jednotlivých přihrádkách, případně podle data.

© Honza Hučín 2004–6

Šuplík běží na PIPNI.CZ. Díky!

sber.cermat.cz

RSS Šuplíku

RSS komentářů – souhrnně

U každého článku je samostatný RSS kanál pro komentáře.

Výběr článků

Posledních 10 článků

nebo podle data:

nebo hledání fulltextem:

Archiv všech článků

Poslední komentáře

Zabili mě, parchanti [2]

8. 8. 16:48 | Pepa

Cestou kolem blogu [2]

7. 8. 21:26 | Honza Hučín

Cestou kolem blogu [1]

7. 8. 21:02 | Honza

Vrtulník nad hlavou [3]

6. 8. 14:29 | Pepa

Taková hra na volby [1]

3. 8. 18:29 | Honza

Nejčtenější

Žádné údaje nejsou k dispozici.

O mně

*1967, absolvent MFF UK v Praze (1991)

statistik, analytik, programátor, učitel, hudebník

nyní Ústav pro informace ve vzdělávání

Životopis (RTF)

Napište mi