Statystyki hitów Wykopu

Przy okazji startu Vagli do Senatu w pewnym momencie pojawiły się spekulacje nt. zasięgu Wykopu. Tzn. do ilu ludzi można dotrzeć przy pomocy tego serwisu, jeśli doda się ciekawe znalezisko. W pewnym momencie popełniłem analizę zasięgu Wykopu,. Ponieważ było to działanie jednorazowe, postanowiłem podejść do sprawy bardziej systematycznie, tym bardziej, że wartości były raczej niskie.

Postanowiłem zrobić automat, które będzie liczył statystyki Wykopu. Prosty skrypt w Perlu zbiera dane o wszystkich znaleziskach, które są na stronie Hity (czyli, zakładam, że są najlepsze). Następnie pobiera bezpośrednio z nich interesujące dane (wykopy, zakopy, wyświetlenia) i pakuje do bazy danych. Dzięki temu miałem nie tylko dane maksymalne, ale także dynamikę zmian w czasie. I w sumie na moje potrzeby to wystarczało, ale ponieważ rozmawiałem ostatnio z ludźmi, to stwierdziłem, że warto się podzielić.

Efekt można zobaczyć tutaj. Strona zawierająca statystyki Wykopu generowana jest raz na godzinę i jest bardzo uproszczona. Sortowanie malejąco po ilości wejść. Nie ma informacji o zakopach (żaden problem dodać, ale po co zaciemniać?), nie ma żadnych danych nt. dynamiki. Robiłem przymiarkę do prezentacji tych danych, ale wygląda brzydko i mało czytelnie, więc na razie odpuszczę.

Z ciekawostek – patrzyłem na Wykop i w pewnym momencie przy sortowaniu pojawia się słowo diggs. Doczytałem w Wikipedii, że Wykop jest/był klonem serwisu digg.com. Zastanawiam się, czy przypadkiem nie dzieli z nim (części) kodu źródłowego?

Wattmeter – nowy projecik

Dawno temu kupiłem sobie watomierz. Wykonałem też pracowicie kilkanaście pomiarów energii, różnych urządzeń w różnych konfiguracjach, których wyniki wylądowały w pliku na dysku i… nikomu się nie przydają. Od dawna chciałem podzielić się wynikami, tym bardziej, że są ciekawe i przynajmniej zastanawiające.

Z drugiej strony kupiłem sobie domenę i… nic na niej nie było uruchomionego. No i od dawna chciałem pobawić się statycznym generatorem bloga (jednym z bardzo wielu), czyli Chronicle. Najbardziej przeszkadzały mi dwie rzeczy: brak sensownych, gotowych szablonów i brak możliwości komentowania.

Odpaliłem as is, szablon tylko minimalnie zmodyfikowany i na pewno będzie wymagał poprawek. Komentowanie niby jest w nowej wersji Chronicle, ale uruchomiłem też w bardzo okrojonej i minimalnej wersji starej. Pewnie będę musiał poeksperymentować albo i pogrzebać w kodzie, chwilowo nie mam ochoty (bardziej niż czasu). Chyba przez ten upał.

Język angielski z paru powodów. Po pierwsze, Chronicle słabo wspiera polski, po drugie, przyda się większemu gronu, po trzecie, raczej zrozumiałe jest. Po czwarte, trochę poćwiczę angielski. Są błędy i źle mi się czyta moje stare teksty, ale zwykle nie poprawiam, bo w mało uczęszczanym miejscu.

Zabawna obserwacja: bardzo fajnie pisze mi się w czystym HTML. Składanie bloga z szablonów (których są cztery sztuki: index, czyli główna strona, entry, czyli pojedynczy wpis, month, czyli widok miesiąca oraz tags, dla pojedynczego tagu) i bardzo prostych – póki co – CSS też mi się podoba. Mocno przypomina Joggera, którego niedawno użyłem i wydał mi się strasznym ogórem, ale… ma to swój urok. Główne zalety Chronicle to 100% kontroli i szybkość działania strony (w końcu statyczna…).

Druga obserwacja, niezupełnie związana z tym projektem, ale związana z Google, Blogspot, WordPress i ogólnie blogami: czym tak naprawdę jest blog? Blog to zbiór stron z atrybutami author, date, title, body, comments (comment author, comment date). Pewnie jeszcze tags.

To nie jest wersja docelowa, to się będzie zmieniało, ale już teraz prezentuję projekcik ile to zużywa energii, czyli watomierz w akcji. Sugestie i uwagi tradycyjnie mile widziane. Wiem, wiem, nie wszystkie widoki się walidują.

Spam o grze na giełdzie – wzorzec, sprawdź logi

Od pewnego czasu dostaję sporo spamu dotyczącego gry na giełdzie. Polsko brzmiące From, w treści zwykle niemieccy uczeni, gra na giełdzie, sztuczna inteligencja oraz całą dobę. W różnych wariantach. Do tego link do strony.

Z tego co mi się obiło o ekran, nie tylko ja to dostaję, a z tego co widzę po skrzynkach – filtry nadawców sobie nie radzą. Poza tym, myślałem, że się skończyło, ale widzę, że nadchodzi kolejna fala.

Zgłaszałem do SpamCopa (nie bez trudności) i akurat w tej kwestii dostałem kilka odpowiedzi z podziękowaniami za zwrócenie uwagi na problem, poza tym, jest charakterystyczny ciąg w URLu, więc wygląda na działanie jakiegoś niezbyt znanego robaka.

Mianowicie wszystkie(? albo prawie wszystkie) URLe, do których odsyłają maile ze spamem zawierają ciąg:

.php?b=2

Zapewne jeśli prowadzi serwer WWW, to warto grepnąć logi pod tym kątem. Kod 200 będzie oznaczał, że prawdopodobnie strona jest zainfekowana.

Zatem prośba do adminów WWW o sprawdzenie logów pod tym kątem, a do adminów poczty o próbę uwzględnienia tego w regułach antyspamowych.

PS Jakby przyjrzeć się bliżej, to pewnie nawet okaże się, że problem dotyczy tylko starej wersji któregoś CMSa, ale tego nie chce mi się już analizować.