Statystyki hitów Wykopu

Przy okazji startu Vagli do Senatu w pewnym momencie pojawiły się spekulacje nt. zasięgu Wykopu. Tzn. do ilu ludzi można dotrzeć przy pomocy tego serwisu, jeśli doda się ciekawe znalezisko. W pewnym momencie popełniłem analizę zasięgu Wykopu,. Ponieważ było to działanie jednorazowe, postanowiłem podejść do sprawy bardziej systematycznie, tym bardziej, że wartości były raczej niskie.

Postanowiłem zrobić automat, które będzie liczył statystyki Wykopu. Prosty skrypt w Perlu zbiera dane o wszystkich znaleziskach, które są na stronie Hity (czyli, zakładam, że są najlepsze). Następnie pobiera bezpośrednio z nich interesujące dane (wykopy, zakopy, wyświetlenia) i pakuje do bazy danych. Dzięki temu miałem nie tylko dane maksymalne, ale także dynamikę zmian w czasie. I w sumie na moje potrzeby to wystarczało, ale ponieważ rozmawiałem ostatnio z ludźmi, to stwierdziłem, że warto się podzielić.

Efekt można zobaczyć tutaj. Strona zawierająca statystyki Wykopu generowana jest raz na godzinę i jest bardzo uproszczona. Sortowanie malejąco po ilości wejść. Nie ma informacji o zakopach (żaden problem dodać, ale po co zaciemniać?), nie ma żadnych danych nt. dynamiki. Robiłem przymiarkę do prezentacji tych danych, ale wygląda brzydko i mało czytelnie, więc na razie odpuszczę.

Z ciekawostek – patrzyłem na Wykop i w pewnym momencie przy sortowaniu pojawia się słowo diggs. Doczytałem w Wikipedii, że Wykop jest/był klonem serwisu digg.com. Zastanawiam się, czy przypadkiem nie dzieli z nim (części) kodu źródłowego?

Jakość niektórych narzędzi security Linuksie

Był sobie ciekawy wpis dotyczący siły haseł i narzędzi do automatycznego jej sprawdzania. Szykowałem się do dokładniejszej zabawy i testów, ale jakoś się rozeszło po kościach, więc krótko o tym, co zauważyłem.

Wnioski na temat jakości narzędzi do generowania haseł i automatycznego sprawdzania nie są zbyt optymistyczne. Narzędzia do haseł mają błędy. Smutne błędy. Spójrzmy na następujące wynik dotyczące haseł wygenerowanych przez pwgen i sprawdzanych cracklib-checki. Za każdym razem generowane było 100 tys. haseł, o zadanej długości (poczynając do 10 i kończąc na 20). Liczba podaje, ile nie było OK wg cracklib-check.

LANG=C pwgen -s -1 10 100000 | LANG=C /usr/sbin/cracklib-check | LANG=C fgrep -cv ': OK' 
79LANG=C pwgen -s -1 11 100000 | LANG=C /usr/sbin/cracklib-check | LANG=C fgrep -cv ': OK'
122LANG=C pwgen -s -1 12 100000 | LANG=C /usr/sbin/cracklib-check | LANG=C fgrep -cv ': OK'
16LANG=C pwgen -s -1 13 100000 | LANG=C /usr/sbin/cracklib-check | LANG=C fgrep -cv ': OK'
27LANG=C pwgen -s -1 15 100000 | LANG=C /usr/sbin/cracklib-check | LANG=C fgrep -cv ': OK'
59LANG=C pwgen -s -1 16 100000 | LANG=C /usr/sbin/cracklib-check | LANG=C fgrep -cv ': OK'
98LANG=C pwgen -s -1 17 100000 | LANG=C /usr/sbin/cracklib-check | LANG=C fgrep -cv ': OK'
141LANG=C pwgen -s -1 18 100000 | LANG=C /usr/sbin/cracklib-check | LANG=C fgrep -cv ': OK'
215LANG=C pwgen -s -1 19 100000 | LANG=C /usr/sbin/cracklib-check | LANG=C fgrep -cv ': OK'
275LANG=C pwgen -s -1 20 100000 | LANG=C /usr/sbin/cracklib-check | LANG=C fgrep -cv ': OK'
373

Jak widać, ilość słabych haseł spada, osiągając minimum w okolicy dwunastoznakowych, by następnie systematycznie rosnąć. Rzut oka na generowane hasła i… wszystko jasne:

HiGFYedy6gHG: it is too simplistic/systematicnowuTUtOon4W: it is too simplistic/systematicO4rstUX43Bef: it is too simplistic/systematic1mMTsIHZyHIH: it is too simplistic/systematicSeVw3MnMnOpp: it is too simplistic/systematic

Domyślnie(?) cracklib-check uznaje powtórzenie znaków za oznakę słabego hasła. Kurtyna.

Kolejne narzędzie, które znam, lubię i którego używam często (zwykle modyfikując wynik, jednakowoż) to gpw. Okazuje się, że posiada ono brzydki błąd, który powoduje, że czasami hasło nim wygenerowane jest krótsze, niż planowaliśmy, tj. niż podane w stosownym parametrze. Przykład: 100 tys. haseł szesnastoznakowych (niby!):

gpw 100000 16 | LANG=C /usr/sbin/cracklib-check | LANG=C fgrep -v ': OK' | grep -i shortaqs: it is WAY too short

I hasło typu aqs. Jest nawet zgłoszony błąd w Debianie w tej sprawie. Też mam mieszane uczucia co do poziomu istotności błędu, ale… sprawdzanie długości otrzymanego wyniku to przecież trywialna sprawa, więc jakie inne błędy może mieć soft?

Ogólnie: mam wrażenie, że nie warto zbytnio ufać gotowym narzędziom. Może nawet nie to, żeby od razu pisać coś własnego, ale warto sprawdzić gotowce (bezpieczne! wolnoźródłowe!), nim się z nich skorzysta.

Statystyki luty 2015, era przedmobilkowa

Niedawno zauważyłem, że Blox przy starym szablonie mobilnym nie tylko narzuca wygląd (i reklamy), ale co gorsza nie wyświetla skryptów dodatkowych, szpalty bocznej itp. W tym skryptów stat4u i Piwika, których używam. Oznacza to, że wszystkie statystyki dotyczyły tylko wersji pełnej i zupełnie pomijały klientów korzystających z wersji mobilnej.

Dla pamięci:

Wg Piwika, którego mam podpiętego do moich stron, tablety + smartfony w lutym na Blox to 1,7% urządzeń. I to są ci użytkownicy, którzy przełączyli się na wygląd normalny. Na starym blogu w analogicznym okresie tablety + smartfony to 14% urządzeń. Zupełnie ostrożnie mogę założyć, że „mobilków” jest tu minimum 14%. Stawiałbym bardziej na 20-25%.

Ponieważ wczoraj zmieniłem szablon, to najwyższy czas, żeby zrobić statystyki blog, tym bardziej, że zauważyłem, że właśnie minął ponad rok od ostatnich statystyk. Najwyższy czas zrobić snapshota.

Dominujący system (i wzrost udziału) to nadal Windows 7 – 35,79%, na drugim nadal XP 25% (ewidentnie zaszłość). Vista spada na 6,2%. Minimalny wzrost udziału Linuksa – do 23,9%, podobnie wzrasta Mac OS X – 2,6%. Windows łącznie nadal 71%. Czyli praktycznie bez zmian.

W przypadku przeglądarek minimalny spadek udziału Firefoksa do 50,4%. Chrome wzrasta do 27,5%. Prawdopodobnie kosztem Opery, bo jej udział spadł do 7,7%. Podobnie jak w przypadku Windows XP głównie za sprawą starszych danych się trzyma. Najpopularniejsza z przeglądarek Microsoftu to MSIE 8.0 z udziałem 3,7% (spadek). Łączenie różne wersje IE to 8,5%, czyli delikatny spadek.

Jeśli chodzi o rozdzielczość ekranu, 1280×800 i 1280×1024 znowu spadają, tym razem na 19,5%. 1366×768 ma już 16,1% udziału. Spadek 1024×768 wyhamował – 5,8% (też pewnie w znacznej mierze zaszłości). Gwałtownie rośnie popularność 1920×1080 – 6,2%. 1680×1050 – 4.3%, 1440×900 – 3,9%.

Pagerank bez zmian – 4 tu, 3 na starym, blog muzyczny N/A.

Jeśli chodzi o reklamy Google, to zmieniłem sposób wyświetlania – podpięte są tylko do starych wpisów, na których są wejścia z wyszukiwarki. Za to w większej ilości. W ten sposób stali czytelnicy nie dostają reklam, a nadal są one wyświetlane i klikane. W sumie spadek w przychodach minimalny, a uciążliwość mniejsza.

Oczywiście dane powyżej nadal ze stat4u. Na Piwika patrzę sobie na bieżąco bardziej, pewnie za miesiąc czy dwa spojrzę, ilu tak naprawdę było użytkowników na mobilkach (tablet, smartfon).

UPDATE Cierpliwy nie jestem, spojrzałem już po tygodniu. Przestrzeliłem, bo tu też jest około 14% na mobilkach. Konkretnie 11,9% na smartfonach i 1,8% na tabletach.