Blogday 2013

Z okazji BlogDay 2013 kilka blogów, które czytam.

Kowalstwo obłoków – w sumie o różnych rzeczach (samochody, praca w Szkocji) i powiedziałbym prywatny, ale fajnie napisany i lubię go czytać. Częste wpisy.

Towar niezgodny z umową – blog ze stajni Agory o robieniu konsumentów w konia na różne sposoby. I jak nie dać się nabrać.

RysioBrag – blog trochę nietypowy, bo np. nie można (niestety!) komentować wpisów, a którego autorem jest Michał „rysiek” Woźniak, czyli obecny prezes FWiOO. Oczywiście sporo o wolności, prywatności i wolnym oprogramowaniu. Niestety wpisy dość rzadko.

Ze Zbocza Tajgetublog o życiu z niepełnosprawnością. Najpierw poznałem człowieka (uczestnik/prezentujący na paru eventach poznańskiego IT), potem trafiłem na bloga i zauważyłem, że jest niepełnosprawny. Ciekawe i szkoda, że tak rzadko pojawiają się (nie tylko jego – są także występy gościnne) wpisy.

Majsterkowo.pl – czyli zrób to sam. Ciekawe pomysły (z różnych dziedzin, głównie majsterkowanie i elektronika), które można samodzielnie zrealizować. Pierwszy blog tego typu po polsku, który znalazłem, który regularnie publikuje i ogólnie IMO ma zapędy na bycie profesjonalnym blogiem. Ale w tej formie, którą lubię, tj. z interesującym wkładem własnym, a nie wodolejstwo i przedruki.

I to byłoby tyle tym razem. W zeszłym roku jakoś mi umknęło, a tu wpisy z Blogday 2010 i 2011.

Statystyki bloga, zmiana licencji.

Pora na przegląd parametrów bloga, który okresowo robię, żeby móc porównać zmiany w czasie. Na początek tradycyjnie systemy operacyjne: Windows XP 34,2%, Windows 7 – 30,4%, Vista – 8,6% czyli łącznie 73%. Linux spadek do 22%, Mac OS X bez zmian 2,2%. Tradycyjnie efekt większego udziału wejść z wyszukiwarki. Znaczne umocnienie się Windows 7, lekki spadek XP.

Przeglądarki praktycznie bez zmian: Firefox 50%, Chrome 23,4%, Opera trzyma ma wiernych fanów we względnie stałej ilości 10,7%. IE w różnych wersjach 10%, przy czym 5,6% to IE 8.

W przypadku rozdzielczości nadal dominują 1280×800 lub 1280×1024 z 30% (nadal spadek), przy czym na drugiej pozycji pojawia się 1366×768 z 13,7% udziału. Mocne jest też nadal 1024×768 – 12,2%.

Znowu zmiany w pagerank – tym razem spadek tego bloga na 4, stary blog i blog muzyczny mają od dłuższego czasu 3.

Reklamy od Google mają się dobrze – bez wysiłku (w zasadzie: totalnie bezobsługowo) i bez rewelacji, minimalnie tylko gorzej od AdTaily, które wymagało jednak więcej zaangażowania, więc sobie chwalę.

Zmianie ulega licencja bloga (dead link), a dokładniej treści wpisów na nim. Taki efekt P.I.W.O. 2012, a dokładnie prezentacji i rozmowy z ryśkiem (thx!). Wspominałem, że było inspirująco? 😉 Stanęło na  CC BY-SA, która jest IMO najbliższym odpowiednikiem GPL, z małymi dodatkowymi wymaganiami co do informacji o pochodzeniu treści. Nie jest prosto, ładnie i składnie napisać wymagania, a pech chciał, że jak widziałem u kogoś coś podobnego ładnie zrobionego, to nie mogłem znaleźć, jak było potrzebne. Oczywiście znalazłem wkrótce po tym, jak skończyłem. ;-/ Ale i tak się przydało… Gdyby ktoś miał uwagi i propozycje poprawy – chętnie usłyszę. Wkrótce dodam wersję angielską wymagań.

Myślałem jeszcze o CC BY-ND oraz o czym z NC, ale przekonało mnie, że skoro ktoś będzie potrafił zrobić z tego pieniądze, jak ja nie umiem, to chwała mu za to (info o autorze i tak będzie). No i żyjemy w świecie pełnym reklam, do których CC ma dziwne podejście. Z kolei ND jest IMO nieporozumieniem w świecie wolnego oprogramowania. Cały dowcip w tym, żeby ktoś mógł tłumaczyć, poprawiać i czerpać. Teraz mogę z czystym sumieniem męczyć RMS o źdźbło w jego oku. 😉

Nie, nie mam złudzeń co do jakości tekstów. Pewnie zwykle nikt ich nie wykorzysta. Tym bardziej nie widzę powodu, żeby się nie dzielić.

Jak zrobić backup bloga?

Na wstępie wyjaśnienie, skąd ten wpis. Na forum Blox co jakiś czas pojawiają się osoby, które straciłydorobek paru lat życia. Znaczy takie, których blog – z różnych przyczyn – przestał być dostępny. I zniknęły cenne wpisy (pół biedy, bo to ludzie czasem mają zapisane lokalnie) oraz jeszcze cenniejsze komentarze. Widziałem narzekania na administrację Blox, gorzkie żale, próby wyciągania treści z cache Google itp. hardcore, na dodatek nie zawsze skuteczny. Wszystko niepotrzebnie, bo ww. opisanym tragediom[1] można w prosty sposób zapobiec robiąc backup bloga. Oczywiście problem nie dotyczy tylko Blox, tak samo może zdarzyć się na innych platformach.

Trzeba uświadomić sobie dwie rzeczy. Po pierwsze, blog, a dokładnie jego zawartość jest treścią tworzoną samodzielnie, przez długi okres czasu, trudno odtwarzalną. Szczególnie, jeśli uwzględnimy komentarze. Po drugie, żaden serwis, a już na pewno nie darmowy, nie daje specjalnych gwarancji na to, że dane nie znikną. Jasne, zwykle nie znikają. Co więcej, jeśli nawet znikną, to zwykle administracja serwisu ma backup, który może przywrócić. Jednak awarie i błędy ludzkie (samodzielne skasowanie notatki lub bloga) się zdarzały, zdarzają i będą zdarzać.

Przed takimi sytuacjami można w prosty sposób się zabezpieczyć robiąc samemu backup swojego bloga. Szansa, że nastąpi awaria krytyczna awaria w dwóch różnych miejscach, jest pomijalna. Tak naprawdę samo jednorazowe skopiowanie to jedno polecenie, jeśli chcemy zautomatyzować, warto skorzystać z prostego skryptu. Wybrałem wariant najprostszy, z użyciem programu wget, dostępnego w każdej dystrybucji Linuksa[2], który powinien działać na każdej platformie blogowej (udostępniającej wszystkie wpisy bez logowania), a tworzy backup, który można bezpośrednio wgrać na dowolny serwer WWW i treść będzie od razu dostępna i wyglądająca praktycznie identycznie, jak na blogu. Oczywiście po takim przywróceniu działać będzie tylko odczyt, bez możliwości dodawania komentarzy itp. Co prawda średnio da się z tego automatycznie przywrócić w pełnej formie czy przenieść na inny silnik blogowy, ale najważniejsza rzecz, czyli treść, jest zachowana.

Backupowane są strony z wpisami (i oczywiście komentarzami), hostowane lokalnie zdjęcia i skrypty JS. W przypadku Blox także te strony statyczne, do których jest „przejście” przy pomocy linków. Nie są bacupowane strony, do których nie ma przejścia, linkowane strony, materiały umieszczone na zdalnym hostingu (np. muzyka umieszczona na soundcloud). Najlepiej i najprościej uruchomić i samemu sprawdzić, co się pobrało. Przy zmianie szablonu i linkowań może rzecz jasna dojść do zmiany zawartości nowych backupów.

Koniec tego przydługiego, ale koniecznego moim zdaniem wstępu. Prawda jest taka, że najsłabszym ogniwem jest człowiek i jeśli nie uruchomi się automatycznego backupu, to w najpotrzebniejszym momencie danych nie będzie. A samo się nie włączy. Czyli klasyczne ludzie dzielą się na tych, którzy robią backupy i tych, którzy będą je robić.

Do rzeczy. Aby zrobić automatyczny backup bloga korzystam z polecenia:

wget -q -m -p -E -k http://rozie.blox.pl

Opcje (krótko): q – brak wyświetlania wyjścia, m – mirror, p – ignorowanie poziomu rekursji, E – konwersja plików do HTML niezależnie od rozszerzenia, k – konwersja linków na lokalne. Bardziej szczegółowy opis każdej opcji w pomocy programu.

Cały skrypt dla Linuksa, który można dodać do crona, żeby raz na jakiś czas się uruchamiał – poniżej. Wersja moja, trzeba sobie dostosować. Łatwo daje się przerobić na backupowanie kilku blogów.

Mam nadzieję, że będzie parę tragedii mniej. Chętnie usłyszę uwagi do tego sposobu i propozycje poprawy. Jakby ktoś chciał popełnić dokładny opis dla Windows, to zapewne ludziom się to bardziej przyda.

Przydatne linki (stąd wiem, że działa także dla Blogspot i WordPress, a także podpatrzyłem kilka opcji):

Automatyzacja backupu bloga Blogspot

Automatyzacja backupu bloga WordPress

[1] Tak, nabijam się. Zawartość bloga, konta na FB czy µbloga nie jest dla mnie tak ważna. Ale wiem, że niektórzy podchodzą do tego inaczej.

[2] Jest też wersja wget dla Windows, kiedyś używałem i działała. Oczywiście cały skrypt wymaga przepisania na platformę Windows, co nie jest trudne. Przydadzą się zapewne gzip dla Widnows oraz tar dla Windows, chyba, że od razu skorzysta się z jakiegoś natywnego archiwizera plików typu rar, zip itp.

UPDATE Przy okazji zrobieniu backupu starego bloga (zamknięcie Joggera) wyszła pewna wada – przynajmniej w przypadku Joggera braku http:// na początku URLi całość się nieprzyjemnie pętli i puchnie. Pewnie da się to obejść nie robiąc -m, tylko limitując poziom rekursji. Ja wolałem poprawić URLe. Wadliwe wpisy można prosto namierzyć po wielkości katalogów.