Ile cyfr potrzeba, by numer konta był unikatowy?

Temat (nie)unikatowych numerów kont pojawił się w tej dyskusji nt. tokenów (dead link, domena przejęta), a szerzej opisany jest w tym wpisie, ile cyfr potrzeba, by numer rachunku bankowego był unikatowy. Przyznam, że nie miałem zielonego pojęcia nt. algorytmu weryfikacji numeru IBAN, ale na chłopski rozum kolizje zdarzą się wszędzie. Stwierdziłem, że najlepsza metoda nauki to napisać skrypt do sprawdzania. Oczywiście w Perlu. Przy okazji wyszło mi, że Perl średnio sobie radzi z dużymi liczbami, a Python dobrze, ale dzięki temu znalazłem pięknego gotowca w postaci modułu do sprawdzania poprawności numeru IBAN.

Pierwsze, co rzuca się w oczy, to fakt, że tak naprawdę numer IBAN jest zamieniany na liczbę, a czy jest poprawny określane jest tylko na podstawie jednego testu – jeśli reszta z dzielenia tej dużej cyfry przez 97 wynosi 1, to numer jest poprawny.

Chwila zabawy programem i okazuje się, że dla 3 brakujących cyfr w dowolnym miejscu rachunku można wygenerować ok. 10 kolizji. Pewnie ma to coś wspólnego z faktem, że 97 jest liczbą pierwszą, a samo 97 mieści się w każdym tysiącu właśnie 10-11 razy, ale tutaj już by się matematyk przydał i zasady podzielności przez 97 (hasło do Google cechy podzielności przez 97 nic sensownego nie znalazło niestety).

Inna szansa, że nasze PL na początku numeru (które wraz z następującymi po nim dwiema cyframi jest przesuwane na koniec i zamieniane na liczby patrz algorytm weryfikacji numeru IBAN) jest na tyle pechowe, że powoduje taką przykrą przypadłość. Ale to łatwo sprawdzić – dzięki użyciu ogólnej biblioteki skrypcik do bruteforce’owania numerów IBAN powinien działać dla wszystkich krajów.

Póki co konkluzja jest taka, że aby numer był unikatowy, to trzeba podać wszystkie cyfry. Przy dobrym wietrze może się zdarzyć, że 1 można opuścić.

PS. Nie cierpię słowa unikalny. Dla mnie oznacza ono możliwy do uniknięcia. Zamiast niego możnaby używać słowa unikatowy. Niestety SJP traktuje je jako synonimy.

Jak często powinny występować cyfry w kodzie jednorazowym?

Wszystko zaczęło się od tego wpisu, którego głównym bohaterem jest paradoks urodzin, a który przeczytałem niedawno. Kto by pomyślał, że wybierając losowo (tylko) tysiąc liczb ze zbioru (aż) czterech milionów liczb mamy (aż!) 10% szans na to, że wybrane liczby się powtórzą? Co prawda nie liczyłem samodzielnie, ale wynik wygląda na prawidłowy. WolframAlpha co prawda wymięka dla czterech milionów, ale dla jednego miliona liczy i wychodzi ok. 39%.

Przypomniało mi się niedawne narzekanie – nie pamiętam niestety czyje – że w hasłach jednorazowych przysyłanych przez mbank SMSem takie same cyfry występują obok siebie się zbyt często, więc chyba generator pseudolosowy jest słaby czy też wręcz zepsuty. Jak mi się przypomniał ten temat, to postanowiłem policzyć prawdopodobieństwo zdarzenia, że SMS, który dostaliśmy, zawiera hasło jednorazowe z powtarzającymi się obok siebie cyframi.

Cyfr w przysyłanym haśle jednorazowym jest osiem. Prawdopodobieństwo, że cyfra kolejna jest różna od cyfry poprzedniej wynosi dokładnie 0,9. Czyli, żeby cyfry się nie powtarzały, to druga musi być inna, niż pierwsza, trzecia inna, niż druga, …, i na koniec ósma inna, niż siódma. Pierwsza cyfra nie ma się z czym powtarzać, oczywiście.

Prawdopodobieństwo zdarzenia, że wszystkie cyfry są różne wynosi zatem dla ośmiocyfrowego hasła jednorazowego 0,9^7 (pierwsza cyfra nie ma znaczenia, bo nie ma się z czym powtarzać) czyli 47,83%. Jaka jest zatem szansa, że cyfry się koło siebie powtórzą? Oczywiście prawdopodobieństwo odwrotne, czyli 1 – 0,9^7. Czyli 52,17%. Zatem, jeśli wszystkie cyfry mają takie samo prawdopodobieństwo wylosowania na wszystkich pozycjach (a tak teoretycznie być powinno), to częściej dostaniemy hasło jednorazowe, gdzie mamy powtarzające się cyfry koło siebie, niż takie, w którym się nie powtarzają. Nie ma to oczywiście nic wspólnego z pierwotnym paradoksem urodzin, ale jest ciekawe.

Nawiasem, prawdopodobieństwo, że którekolwiek cyfry w otrzymanym haśle jednorazowym się powtórzą (niekoniecznie obok siebie) wynosi aż 98% (i to już liczymy wykorzystując wzór do paradoksu urodzin).

Super Cebula czyli łamanie GPL po polsku.

Sprawa została opisana m. in. na osnews i w sumie ten wpis miał być jednym z komentarzy, ale z różnych względów lepiej jak zostanie tutaj (a trackbacka się nie dorobili). Na wstępie disclaimer: nie uruchamiałem gry, więc będę opierał się na dostępnych screenshotach, video i lekko spekulował.

Przede wszystkim mam wątpliwości, czy w ogóle kiedykolwiek doszło do złamania GPL, a przynajmniej w tym obszarze, który zarzuca się autorom gry Super Cebula (dead link). Jak znam życie, to zmianie uległy jedynie grafiki (nie podejrzewam autorów o umiejętność zmiany czegokolwiek w kodzie, skoro mieli problem ze 100% czystym użyciem licencji GPL, zrobieniem spolszczenia itd., sorry). Co oznacza, że (interaktywna) informacja o licencji była dostępna w identyczny sposób, jak w oryginale (chyba, że dany fragment lub plik do którego się odnosi został wycięty, o co jak pisałem nie podejrzewam autorów).

Licencja GPL (nie mówię o jej pochodnych), a przynajmniej niektóre jej wersje, nie zabrania linkowania do niewolnych bibliotek czy mediów. Dlatego nawet jeśli oryginalne grafiki są na GPL (która nawiasem średnio się nadaje do licencjonowania czegoś innego niż kod źródłowy/tekst), to można je bezkarnie zmienić.

Faktem jest, że wygląda, że pierwotnie zabrakło informacji o źródle. Piszę wygląda, bo nie mam pewności, czy link do strony domowej, skąd można pobrać kod nie pojawia się w samej grze. Ale tak naprawdę jeśli chodzi o ducha GPL to jest zachowany – nikt nie będzie miał problemu ze zrobieniem własnego klona gry, choćby o nazwie Super Kaczka (Super Che, Super whatever). Jedyne co musi mieć, to parę grafik.

Faktem jest też, że na uwagi zareagowali szybko i prawidłowo (oby wszyscy łamiący GPL tak reagowali…).

Gorzej, że gra nadal przedstawia się ona jako Super Tux – widoczne na video ok. 3. sekundy:

Nie powinno to mieć miejsca – twórcy Super Tux wypuścili normalną grę dla dzieci, a nie agitkę o dyskusyjnych walorach estetycznych. I to jest tak naprawdę jedyne łamanie GPL, o którym można mówić, a chyba na które nikt nie zwrócił uwagi. W sumie nawet nie tylko GPL, tylko być może naruszenie osobistych praw autorskich – całkiem jakbym wziął kawałek jakiegoś zespołu (na wolnej licencji), zmienił tekst, podłożył mój lichy wokal i rozprowadzał to dalej pod ich nazwą. Ciekawe, czy to też poprawią, biorąc pod uwagę istniejące dokonania, może być z tym problem…

Wygląda, że niechcący zafundowano kandydatowi PO lepszą reklamę, niż sztab zakładał tworząc samą grę. Swoją drogą mam mieszane uczucia co do samego pomysłu – z jednej strony jest ciekawy, z drugiej – komu by się chciało łazić głową jakiegoś faceta? I kto jest adresatem gry? Bo chyba dzieci nie będą grały w nędzną agitkę i podniecały się wskoczeniem na PiS…

Jeśli chodzi o świadomość nt. GPL w społeczeństwie, to nie sądzę by sprawa coś zmieniła. Sporo w tym winy samej GPL (v. 2.0), która ma sporo alternatyw i nie jest prosta i jednoznaczna.

BTW na której wersji licencji GPL jest Super Cebula i Super Tux z którego korzystali? Przyjąłem, że 2.0, ale jeśli nie, to może być weselej…