Bez Disqusji!

Od dłuższego czasu popularność na różnych blogach zdobywa Disqus[1], czyli niezależny od platformy blogowej system komentowania. Nie dziwi mnie to specjalnie, bo Disqus jest dość wygodny. Zalogować się do systemu można przez „wielką trójkę”, czyli Twittera, Facebooka i Google. Oczywiście można też mieć osobne konto tylko na Disqus. Można w końcu komentować jako gość. Dodatkowo komentarze ułożone są w estetyczny i sensowny sposób, z wątkowaniem. Na deser jest jeszcze głosowanie, udostępnianie komentarzy w mediach społecznościowych, możliwość otrzymywania powiadomień o odpowiedziach mailem czy ustawienia moderacji. Cud, miód i orzeszki po prostu. Szczególnie, jeśli porówna się to z wynalazkami wymyślonymi odnośnie komentarzy przez niektóre serwisy blogowe. Rozwiązanie fajne do tego stopnia, że np. Tumblr w ogóle nie ma komentarzy na blogach i Disqus jest jedyną opcją na komentarze tamże. Przyznam, że i ja się skusiłem na moim tumblrowym blogu na to rozwiązanie.

Do niedawna[2] nie zwracałem na to szczególnej uwagi, ale postanowiłem dodać komentarz na blogu Łukasza Bromirskiego. Komentarz zawierał sporo URLi do polskich około technicznych blogów pracowicie wygrzebanych z mojego czytnika RSS (nie wiem co Łukasz planuje, ale możecie podrzucić blogi, których nie ma na liście, czy Łukaszowi, czy tutaj w komentarzu). Ponieważ od jakiegoś czasu nie ograniczam się do podpisu, tylko loguję, na koniec edycji postanowiłem się zalogować. Nawet się udało, tyle, że cała treść komentarza zniknęła. Uśmiechnąłem się tylko, bo przecież od dawna na takie okazj mam Lazarusa (polecam!). I zonk! Lazarus nie radzi sobie z Disqus. Pewnie dlatego, że Disqus to nie typowy formularz na stronie, a javascript. W każdym razie musiałem przepisywać.

Potem było tylko weselej. Wysyłam komentarz i nie ma. Nie wiadomo, czy błąd po stronie Disqusa i komentarz należy uznać za MIA, nie przeszedł przez wbudowany antyspam (w końcu bardzo dużo linków w treści, szczególnie patrząc na stosunek linki/treść) czy po prostu nie przeszedł przez moderację. W każdym razie napisałem i nie ma. I tak jakoś trzy razy (przyznaję, cierpliwy jestem).

Zacząłem się zastanawiać nad tematem i doszedłem do wniosku, że korzystanie z Disqus powoduje implikacje dotyczące wolności i prywatności. Ameryki w tym momencie nie odkrywam, bo część jest opisana w artykule na Wikipedii w części dotyczącej kontrowersji Disqus. Zatem do ograniczeń wolności i prywatności przez Disqus[3]:

  • Obecność na wielu stronach powoduje możliwość śledzenia użytkowników, nie tylko komentujących, ale po prostu odwiedzających strony. Dodatkowo w przypadku komentujących możliwe jest łatwe śledzenie ich zainteresowań i poglądów. Jeśli chodzi o odwiedzających, można to minimalizować przy pomocy wtyczek do przeglądarek typu NoScript, Adblock czy Ghostery. Śledzącym może być Disqus, ale może też chodzić o śledzenie wszystkich komentarzy jednego użytkownika przez innego.
  • Możliwość cenzurowania komentarzy, zarówno w momencie ich zamieszczania, jak i wstecznie. Czy to po słowach kluczowych, autorze, IP z którego jest zamieszczany komentarz… W sumie, w skrajnym wypadku, możliwa byłaby nawet zmiana treści i mamy gotową sytuację z Rok 1984 – szybko można zmienić treść czyjegoś komentarza, by odzwierciedlał obecnie poprawną linię. Można oczywiście podpisywać komentarze przy pomocy PGP. Przynajmniej dopóki Disqus nie odrzuci ich z automatu. 😉
  • Brak możliwości backupu bloga z komentarzami. Proste rozwiązania do backupu bloga nie zadziałają, a przynajmniej nie w 100%. Nie udało mi się pobrać przy pomocy wget tak, by mój komentarz z linkami był widoczny.
  • Zamknięcie Disqus (albo nawet prosta zmiana typu modny ostatnio paywall) spowoduje, że komentarze na wielu stronach, które IMO w przypadku blogów są istotną częścią strony, bezpowrotnie znikną. Obejściem jest regularne robienie backupu komentarzy przez administratora strony. W XML, Disqus way.

I co w związku z tym? W sumie nic, nie przestałem korzystać z Disqus jako autor bloga (skoro już się pojawił kiedyś), nie zlikwidowałem konta na Disqus. Nawet nie zapowiem, że nic nie skomentuję przy jego pomocy. Ale szanse na użycie przeze mnie tego systemu komentarzy drastycznie spadły. Na pewno (na 99,9%) nie wykorzystam go w kolejnym projekcie. Jak widzę, że wpis jest na blogu z podpiętym Disqus, to generalnie nie komentuję. A ponieważ komentowanie (a przynajmniej jego możliwość) jest dla mnie istotną częścią blogowania, to będzie to uwzględnione przy następnej czystce feedów RSS.

[1] Taki eufemizm, bardziej można by go nazwać monopolistą – Wikipedia podaje badanie wskazujące na 75% udziału na stronach wykorzystujących zewnętrzne (3rd party) systemy komentowania. Aż dziwne, że znaleźli niszę, w końcu Facebook takes it all. Przy czym do tej pory kojarzyłem go raczej na zachodnich blogach, ostatnio patrząc w RSS zwróciłem uwagę i na polskich też się rozpanoszył.

[2] No dobra, nie tak niedawna, bo chodziło o ten wpis (BTW chyba nic nie wynikło, a szkoda) – jak widać prawie pół roku połowiczny szkic tej notki przeleżał…

[3] Będzie czarnowidztwo i paranoizowanie, przynajmniej chwilami. Zostaliście ostrzeżeni.

Jak zrobić backup bloga?

Na wstępie wyjaśnienie, skąd ten wpis. Na forum Blox co jakiś czas pojawiają się osoby, które straciłydorobek paru lat życia. Znaczy takie, których blog – z różnych przyczyn – przestał być dostępny. I zniknęły cenne wpisy (pół biedy, bo to ludzie czasem mają zapisane lokalnie) oraz jeszcze cenniejsze komentarze. Widziałem narzekania na administrację Blox, gorzkie żale, próby wyciągania treści z cache Google itp. hardcore, na dodatek nie zawsze skuteczny. Wszystko niepotrzebnie, bo ww. opisanym tragediom[1] można w prosty sposób zapobiec robiąc backup bloga. Oczywiście problem nie dotyczy tylko Blox, tak samo może zdarzyć się na innych platformach.

Trzeba uświadomić sobie dwie rzeczy. Po pierwsze, blog, a dokładnie jego zawartość jest treścią tworzoną samodzielnie, przez długi okres czasu, trudno odtwarzalną. Szczególnie, jeśli uwzględnimy komentarze. Po drugie, żaden serwis, a już na pewno nie darmowy, nie daje specjalnych gwarancji na to, że dane nie znikną. Jasne, zwykle nie znikają. Co więcej, jeśli nawet znikną, to zwykle administracja serwisu ma backup, który może przywrócić. Jednak awarie i błędy ludzkie (samodzielne skasowanie notatki lub bloga) się zdarzały, zdarzają i będą zdarzać.

Przed takimi sytuacjami można w prosty sposób się zabezpieczyć robiąc samemu backup swojego bloga. Szansa, że nastąpi awaria krytyczna awaria w dwóch różnych miejscach, jest pomijalna. Tak naprawdę samo jednorazowe skopiowanie to jedno polecenie, jeśli chcemy zautomatyzować, warto skorzystać z prostego skryptu. Wybrałem wariant najprostszy, z użyciem programu wget, dostępnego w każdej dystrybucji Linuksa[2], który powinien działać na każdej platformie blogowej (udostępniającej wszystkie wpisy bez logowania), a tworzy backup, który można bezpośrednio wgrać na dowolny serwer WWW i treść będzie od razu dostępna i wyglądająca praktycznie identycznie, jak na blogu. Oczywiście po takim przywróceniu działać będzie tylko odczyt, bez możliwości dodawania komentarzy itp. Co prawda średnio da się z tego automatycznie przywrócić w pełnej formie czy przenieść na inny silnik blogowy, ale najważniejsza rzecz, czyli treść, jest zachowana.

Backupowane są strony z wpisami (i oczywiście komentarzami), hostowane lokalnie zdjęcia i skrypty JS. W przypadku Blox także te strony statyczne, do których jest „przejście” przy pomocy linków. Nie są bacupowane strony, do których nie ma przejścia, linkowane strony, materiały umieszczone na zdalnym hostingu (np. muzyka umieszczona na soundcloud). Najlepiej i najprościej uruchomić i samemu sprawdzić, co się pobrało. Przy zmianie szablonu i linkowań może rzecz jasna dojść do zmiany zawartości nowych backupów.

Koniec tego przydługiego, ale koniecznego moim zdaniem wstępu. Prawda jest taka, że najsłabszym ogniwem jest człowiek i jeśli nie uruchomi się automatycznego backupu, to w najpotrzebniejszym momencie danych nie będzie. A samo się nie włączy. Czyli klasyczne ludzie dzielą się na tych, którzy robią backupy i tych, którzy będą je robić.

Do rzeczy. Aby zrobić automatyczny backup bloga korzystam z polecenia:

wget -q -m -p -E -k http://rozie.blox.pl

Opcje (krótko): q – brak wyświetlania wyjścia, m – mirror, p – ignorowanie poziomu rekursji, E – konwersja plików do HTML niezależnie od rozszerzenia, k – konwersja linków na lokalne. Bardziej szczegółowy opis każdej opcji w pomocy programu.

Cały skrypt dla Linuksa, który można dodać do crona, żeby raz na jakiś czas się uruchamiał – poniżej. Wersja moja, trzeba sobie dostosować. Łatwo daje się przerobić na backupowanie kilku blogów.

Mam nadzieję, że będzie parę tragedii mniej. Chętnie usłyszę uwagi do tego sposobu i propozycje poprawy. Jakby ktoś chciał popełnić dokładny opis dla Windows, to zapewne ludziom się to bardziej przyda.

Przydatne linki (stąd wiem, że działa także dla Blogspot i WordPress, a także podpatrzyłem kilka opcji):

Automatyzacja backupu bloga Blogspot

Automatyzacja backupu bloga WordPress

[1] Tak, nabijam się. Zawartość bloga, konta na FB czy µbloga nie jest dla mnie tak ważna. Ale wiem, że niektórzy podchodzą do tego inaczej.

[2] Jest też wersja wget dla Windows, kiedyś używałem i działała. Oczywiście cały skrypt wymaga przepisania na platformę Windows, co nie jest trudne. Przydadzą się zapewne gzip dla Widnows oraz tar dla Windows, chyba, że od razu skorzysta się z jakiegoś natywnego archiwizera plików typu rar, zip itp.

UPDATE Przy okazji zrobieniu backupu starego bloga (zamknięcie Joggera) wyszła pewna wada – przynajmniej w przypadku Joggera braku http:// na początku URLi całość się nieprzyjemnie pętli i puchnie. Pewnie da się to obejść nie robiąc -m, tylko limitując poziom rekursji. Ja wolałem poprawić URLe. Wadliwe wpisy można prosto namierzyć po wielkości katalogów.

Polska planeta Debiana – reaktywacja?

Jakiś czas temu, pod adresem planetadebiana.pl działała polska planeta Debiana. Nigdy nie wyszła poza parę blogów, ale była. Parę miesięcy temu adres przestał odpowiadać, niedawno domena była na sprzedaż, teraz wisi tam jakiś blog.

Dziś zauważyłem w statystykach wejście z debian.zuchmanski.com i okazuje się, że jest tam planeta, co więcej, wygląda, że działa – pojawiają się nowe wpisy. Szybkie porządki w linkach zatem i dorzucam do RSS. Ciekawe, czy działała cały czas pod tym adresem i czy poszło info o zmianie domeny (TBH nie subskrybowałem, bo i tak prawie wszystkie wpisy istotniejsze wpisy okołolinuksowe lądują na linuxportal.pl)… A może (oby) reaktywacja?