Tento blog je v současné době uzavřen.
Pokračování blogu na bloguje.cz jsem zrušil. Pokud budu někdy pokračovat, bude to spíš tady.
Stránka o velikosti 69 KB se polovině uživatelů mých stránek načetla do dvou sekund od kliknutí na odkaz. 95 % uživatelů pak tuto stránku načetlo nejpozději do deseti sekund. Když se to přepočte na orientační rychlost stahování, vychází, že klasické „pomalé“ modemy má dnes už jen velmi malá skupina lidí, zhruba deset procent.
Vyplývá to z měření, které probíhalo na převodní tabulce s azbukou od listopadu do půlky ledna. Za přístup k logům děkuji Yuhůovi a Českému hostingu.
Celkem jsem zpracoval data za 445 přístupů z 319 IP. To samozřejmě není mnoho. A protože jsem u podstatné části uživatelů dobu načtení odhadoval z jiného údaje, mohou být data zatížena další chybou. Na žádné zobecnění si tudíž netroufám. Ale přinejmenším je to zajímavý a prakticky použitelný údaj (aspoň pro mě).
Na měřicí stránce nebyly žádné obrázky ani styly, pomocí textu v komentáři jsem ji zvětšil na 69 KB. Pomocí HTTP hlaviček jsem se snažil maximálně omezit kešování – z dat vyplývá, že se to povedlo. Uživatel tak musel při každém přístupu stáhnout stránku celou, ale protože naprostá většina z ní byla skrytá v komentáři, z pohledu uživatele se zdánlivě stahovalo vždy jen asi 15 KB.
Na čtyřech místech jsem zaznamenával aktuální čas a ukládal ho javasciptem do logu:
Už dřív jsem zjistil, že se o údaje 2 a 3 nelze přímo opřít. Prohlížeč totiž chvíli čeká, než začne stránku zpracovávat, a tak mezi událostmi 1 a 2 může uplynout delší doba než mezi 2 a 3. Pro uživatele je ale stejně nejdůležitější, jak dlouho od kliknutí trvá, než má stránku načtenou. Takže nejlogičtější a nejspolehlivější je použít události 1 a 4, resp. časový rozdíl mezi nimi.
Potíž s údajem 1 je v tom, že na měřicí stránku přicházejí lidé i odjinud (např. z Googlu) a nelze mít javascript ve všech odkazech. Takže asi polovina pozorování měla pouze údaje 2 až 4. Ukázalo se ovšem, že rozdíly mezi událostmi 2 a 4 výborně korelují s rozdíly 1 a 4 (korelační koeficient 0,756). Tím pádem jsem celkovou dobu načítání u neúplných pozorování odhadl lineární regresí.
Kromě jedné hlavní měřicí stránky jsem měl ještě dvě další s jinými velikostmi. Na nich se naměřilo málo pozorování, ale pro kontrolu hlavního měření to stačilo.
Graf uvádí, jak velké části uživatelů se načetla celá stránka do příslušné doby. Doba je v milisekundách, uvedené číslo v popisku je horní mezí. Tedy například od 2000 do 3000 ms stránku načítalo 13 % uživatelů.
Když se velikost stránky vydělí dobou načítání, dostaneme průměrnou rychlost zpracování. To je samozřejmě orientační údaj a není totožný s rychlostí stahování dat (ve zpracování je navíc čekání na vyřízení HTTP požadavku, činnost prohlížeče apod.). Ale rychlost stahování se z toho dá odhadnout.
V grafu opět popisky znamenají horní mez. Je vidět, že naprostá většina uživatelů má průměrnou rychlost zpracování stránky mezi 20 a 100 KB/s, víc jich je mezi 50 a 100 KB/s. U těchto rychlostí lze čekání na vyřízení požadavku zanedbat. Takže vychází, že třetina uživatelů dosahuje rychlost stahování mezi 50 a 100 KB/s, další třetina pak mírně pod 50 KB/s.
Klasičtí modemisté na telefonní lince jsou podle mého odhadu zastoupeni v prvních třech sloupcích. Když se podíly sečtou, dostáváme, že uživatelů připojených telefonní linkou a klasickým modemem je přibližně 10 procent.
Nevzal jsem v úvahu možnost datové komprese, nerozumím tomu. Aktivně jsem ji nenastavoval, ale je možné, že ji Pipni.cz zapíná automaticky.
Je možné, že uživatelů z pomalých připojení přišlo víc, ale odpadli z měření kvůli tomu, že zavřeli okno prohlížeče, než se stránka načetla. Několik ojedinělých podezřelých záznamů tohoto typu v datech bylo.
Další články si můžete vyhledat v jednotlivých přihrádkách, případně podle data.
© Honza Hučín 2004–6
Šuplík běží na PIPNI.CZ. Díky!
8. 8. 16:48 | Pepa
7. 8. 21:26 | Honza Hučín
7. 8. 21:02 | Honza
6. 8. 14:29 | Pepa
3. 8. 18:29 | Honza
*1967, absolvent MFF UK v Praze (1991)
statistik, analytik, programátor, učitel, hudebník