Nowy Piwik, czyli po co komu statystyki na blogu?

Dziś Piwik powiadomił mnie, że jest dostępna wersja 2.0.1. Lekko się zdziwiłem, bo pojawienie się 2.0.0 jakoś mi umknęło. Uznałem, że to dobry moment na podsumowanie statystyk, tym bardziej, że z Piwika korzystam od kwartału.

Pierwsze wrażenie – jest znacznie szybciej, ale kolorystyka mniej mi się podoba. Upgrade bardzo bezproblemowy, z dokładnością do tego, że upgrade bazy zrobiłem z CLI, bo przywitała mnie biała strona. Ale wszystko jest ładnie opisane w FAQ. Zdecydowanie polecam upgrade, jeśli ktoś z Piwika korzysta.

No właśnie… Czy ktoś potrzebuje Piwika? Od bardzo dawna korzystam ze statystyk stat4u.pl i przyznam, że owszem, Piwik jest ładniejszy, daje trochę więcej informacji, ale… nie odczułem jakiejś wielkiej poprawy. Jedyne co warto odnotować, to informacja, które strony na blogu są odwiedzane częściej. Szału nie ma.

Czy ktoś potrzebuje statystyk Piwik na stronie? Po odzewie na moją propozycję darmowych statystyk sądzę, że nie. Odzew wynosił okrągłe zero, co przyznam, lekko mnie zdziwiło. Ja się lubię bawić, szczególnie, że wysiłek zerowy, a dane jakby mało krytyczne. Tj. jakby mi zależało, to często gęsto jestem w stanie dość dokładnie oszacować ilość wejść na czyjegoś bloga czy najpopularniejsze wpisy. Ale jakoś mi nie zależy.

W ogóle uważam, że Google dość drastycznie zmienia obraz statystyk i ogólnie rynku reklamy w sieci. I bardziej wiąże do siebie ludzi. I stawiam, że robią to z premedytacją i będzie się to pogłębiać. Po pierwsze, wymuszenie HTTPS i idące za tym ukrycie fraz z wyszukiwarki utrudnia autorom stron analizę, czego szukają ludzie (no chyba, że ktoś korzysta z Google webmaster tools, wtedy jak najbardziej ma dostęp do danych). Po drugie, ostatni ruch czyli cache’owanie obrazków w gmailu też wpływa na rynek spa^H^H^Hmarketingu email. I nie mam złudzeń, że nie chodzi im o prywatność użytkowników, tylko przymierzają się do kolejnego kawałka tortu.

Piwik, czyli fajne darmowe statystyki na stronę

O statystykach dla stron Piwik usłyszałem dawno temu. Idea wolnego odpowiednika Google Analytics[1] bardzo mi się spodobała, ale do instalacji nie doszło. Powód prozaiczny – nie miałem maszyny 24/7 działającej na sensownym łączu i posiadającą sensowną moc obliczeniową. Sensowną, tj. taką, żeby instalacja MySQL nie wydawała mi się zabójstwem na maszyny. Niedawno o statystykach przypomniał mi wpis ryśka, a obecne na blogu statystyki stat4u są coraz bardziej niewystarczające, głównie ze względu na brak aktualizacji od dłuższego czasu (ostatnia zmiana kilkadziesiąt miesięcy temu). Szczególnie, że chciałem się pobawić w referral fun.

Postanowiłem zaryzykować i zainstalować Piwika na Dockstarze. Co prawda miałem wrażenie, że 128 MB RAM i dysk 2,5″ 5400 RPM, na dodatek w kieszeni USB to nie jest to, co MySQL lubi najbardziej, ale spróbować można. Instalacja Piwika na lighttpd jest prosta i nie ma czego tak naprawdę opisywać. Ku mojemu zdziwieniu MySQL zajął tylko ok. 10% pamięci, a statystyki się zbierały.

Niestety, kliknięcie czegokolwiek w dashboardzie było męczarnią – skrypty PHP na serwerze mieliył po procku (niby 1,2 GHz, ale ARM, poza tym jakieś drobiazgi do łapania spamerów na Blox tam działają) nieprzyzwoicie intensywnie i nieprzyzwoicie długo. Znaczy dziesiątki sekund. Ale to co zobaczyłem było bardzo obiecujące, więc wrzuciłem Piwika na tymczasowego VPSa, który zasadniczo się nudzi (hell yeah, spojrzałem i prawie drugi rok mija darmowego testu, ale to offtopic, więc spuśćmy zasłonę miłosierdzia).

Po prostu rewelacja. Piwik pokazuje wiele rzeczy, których w stat4u nie ma (o statystykach wbudowanych w Blox nie wspominam, bo trudno to nazwać statystyką). Skąd ktoś przyszedł, gdzie poszedł, ile czasu spędził na stronie, rozbicia na systemy operacyjne, wykorzystywane pluginy, aktywność, powracający użytkownicy. I do tego wszystko estetycznie podane. Niby nic kluczowego się nie dowiedziałem, ale zdecydowanie bardziej mi się to podoba. I mam nad wszystkim kontrolę. Próbka jest mała, ale już mogę stwierdzić, że stat4u ma parę błędów (pewnie skutek braku aktualizacji).

Z drobnych poprawek, które warto wykonać: mimo, że to nie high traffic site, warto doinstalować APC, jest szybciej. Być może spróbuję wrócić na Dockstara z doinstalowanym APC, ale może nic z tego nie wyjść – może PHP wisiał na zapytaniach do baz – mało czasu miałem, nie wnikałem. Poza tym, wolałbym to jednak mieć na czymś porządniejszym, niż ADSL.

W każdym razie, w ramach popularyzacji tego oprogramowania, jeśli ktoś chciałby zobaczyć jak Piwik wygląda na jego własnych realnych danych, a nie ma warunków/ochoty na stawianie go samodzielnie, to może podpiąć na swojej stronie na dłuższą chwilę[2] u mnie (free, no strings attached). Chętnych zapraszam do kontaktu mailowego. Warunki są trzy. Pierwszy: nie więcej niż powiedzmy 10k UU miesięcznie (nie apteka) ze względu na wydajność maszyny. Drugi: best effort, czyli nie gwarantuję działania systemu, mogą być przerwy, nie gwarantuję przywrócenia z backupu itp. Oczywiście można dawać znać jak coś nie będzie działać i postaram się poprawić (bo mam tam własne niekrytyczne zabawki), ale wiecie jak jest. Na ten moment uptime system to 4 m-ce. Trzeci: zastrzegam sobie prawo do absolutnie subiektywnego wyboru chętnych (zwł. znajomi (jeśli się pojawią – nie jest to warunek konieczny) mają pierwszeństwo, podobnie jak nietechniczni/nieadmini – zakładam, że techniczni jakby chcieli, to by sami sobie postawili), wyłączenia usługi w dowolnym momencie wybranym serwisom itp. Jasne, postaram się uprzedzić wcześniej. Jeśli są jakieś wątpliwości co do warunków/coś pominąłem – proszę o pytania w komentarzach.

[1] Google Analytics odpada. I tak za dużo wiedzą, więc staram się unikać produktów ze stajni Google.

[2] VPS będzie działał jeszcze jakiś miesiąc. Potem, jeśli wszystko pójdzie dobrze, planuję przeniesienie się (z gratami) na jakieś 3 m-ce na testowego dedyka, a potem… Albo będzie działać na Dockstarze, albo przedłużę dedyka, albo zawinę zabawki.

Jaką książkę warto przeczytać?

Jaką książkę warto przeczytać? to pytanie, które zadaje sobie wielu ludzi, którzy czytają książki. I chyba każdy, kto lubi tę rozrywkę i ma apetyt na więcej książek, niż przeczytać jest w stanie. Od dłuższego czasu korzystam z serwisu BiblioNETka do odnotowywania – wraz z oceną – książek, które czytałem, a także do wstępnej oceny książek przy zamawianiu (zwykle w książki zaopatruję się w antykwariatach online).

Serwis zna moje oceny, więc nie powinien mieć problemu ze znalezieniem kolejnych pozycji, które powinny mi odpowiadać. Tym bardziej, że prezentują się jako serwis polecający książki. Niestety, algorytm z którego korzystają jest mało skuteczny i wg mnie sprowadza się do jak użytkownik czytał i lubi Lema, to polecamy Lema. Niezupełnie o to mi chodzi, bo nie wszystkie książki danego autora są równie dobre, poza tym, warto czasem poszerzać horyzonty.

Wydawało mi się, że do skutecznego polecania, a tak naprawdę przewidywania przyszłych ocen danego użytkownika da się zaprząc statystykę, a konkretnie współczynnik korelacji. Zasada jest prosta – jeśli użytkownicy mają ocenionych n takich samych książek i oceniali je podobnie, to pewnie n+1 pozycję również ocenią podobnie. Zresztą, dawno, dawno temu robiliśmy coś podobnego ze znajomymi dla ocen filmów, tyle, że w Excelu. I jakoś tam działało, tylko próbka (i ludzi, i filmów) była niewielka.

Okazuje się, że istnieje serwis korzystający z ocen BiblioNETki, ale używający alternatywnego sposobu polecania książek. Opartego właśnie na współczynniku korelacji. Serwis nie wygląda nowocześnie, ale nie o to przecież chodzi. Na pierwszy rzut oka wygląda, że ma szansę działać dobrze – jest polecanie zwykłe, polecanie „pewniaków”, polecane książki można zawęzić gatunkami. Z listy polecanych pozycji („pewniaków”), po zawężeniu gatunków, wygląda, że robi dokładnie to, czego oczekuję – niekoniecznie poleca autorów, których znam, a w liście jest parę pozycji, o których słyszałem, że warto przeczytać i tak naprawdę są w planie.

Jednak jeszcze ciekawszą opcją jest, moim zdaniem, znajdowanie użytkowników, z którymi mamy dużą zbieżność w ocenach. Potem wystarczy zobaczyć, jakie książki ocenili wysoko i… jest spora szansa, że nam też się spodobają. Dla użytkownika, z którym mam najwyższą zbieżność sprawdza się w moim przypadku doskonale (zresztą, musi – przecież statystyka nie kłamie ;-)) – jest parę pozycji, które bardzo mi się podobały, ale zapomniałem ich dodać, a które u niego mają najwyższą ocenę.

Wady serwisu to: wygląd i zepsute linki do stron użytkowników w BiblioNETce – ta ostatnia zmieniła niedawno format linka. Zgłoszone autorowi.

A może znacie inny niż BiblioNETka (niekoniecznie polski) serwis zbierający oceny książek i mający sensowny algorytm polecania?

UPDATE: Linki zostały poprawione, skreślam.