Na początku XX wieku uwagę matematyków przykuł tzw. aksjomat wyboru, który przyprawił ich o niemały zawrót głowy i mocno podniósł kwestię tego co w matematyce wolno.
W każdej dziedzinie zdarzają się kontrowersje. W matematyce również. Jedną z nich, na początku XX wieku, był właśnie aksjomat wyboru. W 1904 Ernst Zermelo, w swojej pracy Beweis, daß jede Menge wohlgeordnet werden kann (tj. Dowód, że każdy zbiór może być dobrze uporządkowany), użył w dowodzie sformułowanego przez siebie, tytułowego aksjomatu.
Zanim przejdziemy do szczegółów musimy sobie uzmysłowić jaka sytuacja panowała wtedy w matematyce. A matematyka była w tamtych czasach inna. Obecnie, taką domyślną podstawą matematyki są tzw. aksjomaty Zermela-Fraenkla z tytułowym aksjomatem wyboru. Jest to powszechnie przyjęty zestaw reguł dotyczących zbiorów, taki punkt wyjścia. Bo od czegoś w końcu zawsze trzeba zacząć. Reguły te to podstawowe narzędzia matematyczne, które trzymają w logicznych ryzach wnioskowanie o zbiorach. Można powiedzieć, że jest to zgodny z naszą ludzką intuicją pojmowania zbioru zestaw niezbędnych narzędzi do posługiwania się tym pojęciem. Wśród tych aksjomatów można znaleźć m.in.
Aksjomat sumy mówiący, że dla dowolnej rodziny zbiorów \(\mathcal U\) istnieje zbiór złożony z tych i tylko tych elementów, które należą do jakiegoś zbioru z \(\mathcal U\).
Czyli aksjomat ten gwarantuje istnienie sumy zbiorów. Innym aksjomatem jest np. aksjomat nieskończoności gwarantujący istnienie zbioru nieskończonego, którym de facto jest zbiór liczb naturalnych. Możemy więc powiedzieć, że zbiory nieskończone istnieją bo… zakładamy, że istnieją. Ale zgodzimy się chyba, że mało jest obiektów matematycznych, których chcielibyśmy używać jak właśnie zbiór \(\mathbb N\).
Naturalnie rozważa się również inne zestawy aksjomatów, ale w tym wpisie zbytnio nie o tym. Przed pracą Zermela zasadniczo nie było takiej aksjomatyki dotyczącej chyba najważniejszego obiektu matematyki jakim jest zbiór. Takie pojęcia jak zbiór czy przynależność do zbioru są intuicyjnie oczywiste. Na tej podstawie, korzystając z logiki dowodzono nowych twierdzeń i po prostu poszerzano i rozwijano matematykę. Był to czas tzw. naiwnej teorii mnogości (tzn. naiwnej teorii zbiorów). Okazało się jednak, że takie podejście prowadzi do problemów i sprzeczności. Przykładem jest tzw. antynomia Russella.
Russell rozważał zbiory, które nie są swoimi elementami. Jeżeli tworzą one zbiór \(A\), to pojawia się pytanie. Czy \(A\) jest swoim własnym elementem? Jeżeli tak, to z definicji zbioru \(A\) nie może nim być. Jeśli zaś \(A\) nie jest swoim własnym elementem, to znowu z definicji zbioru \(A\), zbiór ten jest swoim elementem. Każda z opcji prowadzi do sprzeczności!
Do tego, był to w miarę świeży czas po słynnych pracach Georga Cantora, który jako pierwszy pokazał, że są różne nieskończoności. Przykładowo liczb rzeczywistych jest więcej niż naturalnych mimo iż oba zbiory są nieskończone. Liczbę mówiącą nam ile elementów ma zbiór liczb naturalnych oznaczamy \(\aleph_0\) i nazywamy alef zero. Z kolei liczbę mówiącą nam ile elementów ma zbiór liczb rzeczywistych oznaczamy \(\mathfrak c\) i nazywamy continuum. Są to tzw. liczby kardynalne. Więcej o liczbach nieskończonych można poczytać w tym wpisie. Z prac Cantora wynika, że \[\aleph_0 \lt\mathfrak{c}.\] Cantor postawił hipotezę, że nie istnieje zbiór mający więcej elementów niż \(\aleph_0\) i jednocześnie mniej niż \(\mathfrak c\). Innymi słowy, nie istnieje liczba kardynalna \(\mathfrak a\) taka, że \[\aleph_0 \lt \mathfrak a \lt\mathfrak c.\] Hipoteza continuum spędzała sen z powiek matematykom do lat 60. XX wieku kiedy to sprawa została finalnie rozwiązana dzięki Kurtowi Gödlowi (tu już w latach 30.) oraz Paulowi Cohenowi. Okazało się, że hipotezy continuum nie da się ani udowodnić ani dowieść, że jest prawdziwa. Ale szczegóły zdecydowanie wykraczają poza ramy tego wpisu.
Oprócz zaskakujących i na pierwszy rzut oka, nieraz sprzecznych z intuicją wyników, z prac Cantora wynikało, że trzeba być bardzo ostrożnym w definiowaniu nowych zbiorów. Bo Cantor pokazał m.in., że nie istnieje zbiór wszystkich zbiorów. W skrócie mówiąc, zbiorów jest za dużo aby można było stworzyć z nich zbiór. To pokazało, że trzeba być bardzo ostrożnym i uważnym, gdy definiujemy nowe zbiory, czy ogólniej pojęcia, bo nawet wydawałoby się proste i oczywiste dla ludzi rzeczy mogą okazać się jednak problematyczne z logicznego punktu widzenia. Z tego tez względu dobrą praktyką w matematyce jest sprawdzanie poprawności definicji nowych obiektów.
Drugim ważnym, i w kontekście tytułowego aksjomatu chyba ważniejszym, problemem postawionym przez Cantora była hipoteza znana dziś jako twierdzenie o dobrym uporządkowaniu (to właśnie w dowodzie tego twierdzenia Zermelo użył aksjomatu wyboru) mówiące, że każdy zbiór można dobrze uporządkować. Co to znaczy? Otóż zbiór dobrze uporządkowany składa się z dwu składowych. Pierwszą z nich, co za niespodzianka, jest dowolny zbiór \(A\), a drugą uporządkowanie (czyli mniej ściśle kolejność) jego elementów. Ale to uporządkowanie nie byle jakie! Mające tę własność, że każdy podzbiór zbioru \(A\) ma element najmniejszy. Przykładem zbioru dobrze uporządkowanego jest zbiór liczb naturalnych ustawionych zgodnie ze zwykłym porządkiem \[0, 1, 2, 3,\ldots\] Mówiąc najmniejszy element mamy tu na myśli kolejność. Nie należy jej mylić z tym, która liczba jest mniejsza, a która większa, gdy porządkujemy podzbiory \(\mathbb R\). Lepiej to widać w przypadku zbioru liczb całkowitych \(\mathbb Z\) ze zwykłym porządkiem, który już nie jest dobrze uporządkowany. Przykładowo, w jego podzbiorze składającym się z liczb ujemnych nie ma liczby najmniejszej. Możemy jednak zmienić kolejność jego elementów na poniższą \[0, -1, 1, -2, 2, -3, 3, -4, 4 \ldots\] Reguła ustawiania kolejnych elementów jest chyba dobrze widoczna. Przy takim uporządkowaniu już każdy niepusty podzbiór zawiera element najmniejszy. Przy czym, mówiąc najmniejszy odnosimy się do kolejności w jakiej kolejne liczby się pojawiają. W tym przypadku podzbiór liczb ujemnych ma element najmniejszy, którym jest -1 bo jest to pierwsza w kolejności liczba ujemna. Cała sztuka w przypadku zbioru \(\mathbb Z\) się udała bo byliśmy w stanie ustawić liczby całkowite w ciąg indeksowany liczbami naturalnymi. A czy da się w podobny sposób dobrze uporządkować zbiór liczb wymiernych \(\mathbb Q\)? Tu jeszcze się da. Zacznijmy od liczb wymiernych nieujemnych. \[\frac 01,\ \frac 11,\ \frac 12,\ \frac 21,\ \frac13,\ \frac 31,\ \frac 14,\ \frac 23,\ \frac 32,\ \frac 41\ldots\] Idea jest wbrew pozorom prosta. Każdą liczbę wymierną nieujemną przedstawmy w postaci ułamka nieskracalnego \(\frac ab\), gdzie \(b>0\). Możemy wówczas liczby te uporządkować wpierw rosnąco względem sumy \(a+b\), a w obrębie każdej z grup względem rosnącego licznika. Na koniec jeżeli po każdej liczbie dodatniej wciśniemy liczbę do niej przeciwną, to mamy dobrze uporządkowany zbiór liczb wymiernych. \[\frac 01,\ \frac 11,\ -\frac 11,\ \frac 12,\ -\frac12,\ \frac 21,\ \ldots\] Natomiast przysłowiowego konia z rzędem temu kto umiałby wskazać regułę dobrze porządkującą cały zbiór liczb rzeczywistych!
Twierdzenie o dobrym uporządkowaniu mówi, że każdy zbiór można w jakiś sposób dobrze uporządkować. Może się zdarzyć, że nie będziemy w stanie wskazać jakiegoś konkretnego porządku na danym zbiorze \(A\). Być może nawet nie jest po prostu możliwe wskazanie jakiejś konkretnej reguły dobrego porządku, ale prawdziwość tego twierdzenia gwarantowałaby, że zawsze jakiś dobry porządek na zbiorze \(A\) istnieje.
Antynomia Russella czy kwestia ,,zbioru” wszystkich zbiorów pokazały, że potrzebne jest inne podejście niż naiwna teoria mnogości. Z tego względu pojawiła się próba aksjomatyzacji Zermela. Obecnie aksjomaty te znamy teraz jako aksjomaty Zermela-Fraenkla. Wraz z tytułowym aksjomatem wyboru (zwanym też pewnikiem wyboru), stanowią one aktualnie standardowy zestaw aksjomatów będący podstawą teorii mnogości. Choć jak wspomnieliśmy, rozważa się inne zestawy aksjomatów lub ogólniej podejścia.
Żaden z aksjomatów nie wzbudził jednak takich kontrowersji i nie był tak dyskutowany jak właśnie aksjomat wyboru. Dziś już nie budzi on żadnych większych sprzeciwów, ale w poprzednim wieku naprawdę działo się w jego temacie. Sprawił on, że zaczęto śmielej pytać co to znaczy istnieć w matematyce?
Ale o co się właściwie rozchodzi? Załóżmy, że mamy rodzinę niepustych zbiorów. Aksjomat wyboru mówi, że możemy z każdego wybrać po dokładanie jednym elemencie i stworzyć z nich nowy zbiór. Można również spotkać się z wersją, gdzie zakładamy, że zbiory są dodatkowo parami rozłączne. Nie ma to jednak żadnego większego znaczenia, gdyż obie wersje są równoważne.
Tak jak na rysunku powyżej. Mamy pewne niepuste zbiory i z każdego wybieramy po jednym elemencie i tworzymy z nich nowy zbiór. Aksjomat wyboru mówi, że jest to zawsze możliwe.
Sam Zermelo rozważał zbiór \(M\). Przez \(M’\) oznaczał dowolny niepusty podzbiór zbioru \(M\). Zaś rodzinę wszystkich takich niepustych podzbiorów zioru \(M\) oznaczał \(\mathbb M\). Tu trochę zmieniliśmy czcionkę, aby uniknąć nieporozumień przez podobne oznaczenia. Dalej rozważał tzw. pokrycia. pamiętajmy, że język i pewne sformułowania, w tym także matematyczne, różniły się od dzisiejszych. Swój aksjomat (w pracy z 1904 roku) sformułował następująco:
co oznacza:
1) Niech \(M\) będzie dowolnym zbiorem o mocy \(\mathfrak m\), którego elementy możemy oznaczyć przez \(m\), a \(M^{‘}\) o mocy \(\mathfrak m^{‘}\) niech będzie jednym z jego podzbiorów, który musi zawierać co najmniej jeden element \(m\), ale może również zawierać wszystkie elementy \(M\). Zbiór \(M-M^{‘}\) będzie podzbiorem „dopełniającym” względem \(M^{‘}\). Dwa podzbiory uznaje się za różne, jeśli jeden z nich zawiera jakikolwiek element, który nie występuje w drugim. Zbiór wszystkich \(M^{‘}\) oznaczmy przez \(\mathbb M\).
2) Każdemu podzbiorowi \(M^{′}\) przypisuje się dowolny element \(m_1^{‘}\), który znajduje się w samym \(M^{′}\) i będzie nazywany „wyróżnionym” elementem \(M^{′}\). W ten sposób powstaje „pokrycie” \(\gamma\) zbioru \(\mathbb M\) pewnymi elementami zbioru \(M\). Liczba tych przyporządkowań jest równa iloczynowi \(\prod\mathfrak m^{‘}\), rozciągniętemu na wszystkie \(M^{′}\) i jest z pewnością różna od zera. W dalszej części wybierzemy dowolne przyporządkowanie \(\gamma\) i na jego podstawie wyprowadzimy określoną pożądaną kolejność elementów \(M\).
Przyporządkowywanie podzbiorom ich elementów prowadzi do innego, popularnego sformułowania aksjomatu wyboru mówiącego o tzw. funkcji wyboru. Mianowicie, dla dowolnej rodziny niepustych zbiorów \(\mathcal A\), istnieje funkcja wyboru (zwana też selektorem) \[f:\mathcal A\to\bigcup\limits_{A\in\mathcal A}A\] taka, że \(f(A)\in A\) dla każdego \(A\in\mathcal A\). Innymi słowy, istnieje funkcja, która każdemu zbiorowi z \(\mathcal A\) przyporządkowuje jakiś jego własny element. Możemy więc wymiennie mówić o istnieniu zbioru lub funkcji.
Praca Zermela, a dokładniej tytułowy aksjomat, szybko stała się przedmiotem krytyki ze strony wielu uznanych matematyków tamtych czasów jak np. Borel czy Lebesgue mimo iż na pierwszy rzut oka może wydawać się dziwne czemu taki aksjomat miałby być kontrowersyjny. W końcu skoro mamy zbiory niepuste, to w każdym z nich jest co najmniej jeden element, więc z każdego jesteśmy w stanie coś wybrać. Na koniec wrzucamy wybrane elementy do jednego worka i tak oto mamy nowy zbiór. Może więc dziwić, że jest tu jakikolwiek problem. Pamiętajmy, że nasza ludzka intuicja, która jest zależna od tego jak postrzegamy świat (no a to jest bez wątpienia związane z tym jak zbudowane są nasze mózgi), a logika, to dwie różne rzeczy. To co nam ludziom, wydaje się intuicyjnie oczywiste, może okazać się co najmniej problematyczne z logicznego punktu widzenia.
Pierwszym zagadnieniem jest problem istnienia w matematyce. Bez aksjomatu wyboru nie zawsze jesteśmy w stanie zdefiniować stosowny zbiór (lub wymiennie funkcję wyboru). I to nie dlatego, że jesteśmy za głupi aby to zrobić, tylko dlatego, że bez aksjomatu wyboru jest to zwyczajnie niemożliwe. Zaś aksjomat mówi nam, że jest to możliwe lecz nie mówi zupełnie nic o tym jak wybierać elementy ze zbiorów. Wiemy tylko tyle, że stosowny zbiór (lub funkcja wyboru) istnieje, nie wiedząc w zasadzie nic o naturze tego obiektu. Aksjomat wyboru, w sytuacji, gdy nie mamy możliwości skonstruowania funkcji wyboru jawnie, każe nam zasadniczo uwierzyć na słowo, że jakaś funkcja wyboru istnieje. Dzięki niemu jesteśmy w stanie powoływać do matematycznego życia obiekty, których bez niego nie dałoby się nijak inaczej zdefiniować i rozważać. No chyba, że przyjmiemy inny aksjomat, który nam na to pozwoli. Jest tu widoczny kontrast z innymi aksjomatami teorii mnogości, które gdy mówią o istnieniu jakiegoś zbioru, to go definiują. Patrząc z innej strony, możemy zapytać czy niemożność zdefiniowania konkretnej funkcji wyboru musi oznaczać, że żadna nie istnieje?
Ale przejdźmy do małej analizy aksjomatu. Rozważmy najpierw sytuację najprostszą, gdy mamy do czynienia z jednym tylko zbiorem niepustym \(A_1\). Jest to równoważne stwierdzeniu, że istnieje \(a_1\in A_1\). Może się zdarzyć, że nie będziemy w stanie wskazać konkretnego elementu ze zbioru \(A_1\), ale jego niepustość jest równoważna temu, że coś z niego możemy wybrać. Jeżeli weźmiemy rozłączny z nim niepusty zbiór \(A_2\), to analogicznie możemy z niego wybrać element \(a_2\). Aksjomaty teorii mnogości (inne niż aksjomat wyboru) dają nam pewność, że jesteśmy w stanie utworzyć z nich zbiór \(\{a_1, a_2\}\). I tak dalej możemy utworzyć stosowny zbiór \[A=\{a_1, a_2, \ldots, a_n\}\] dla dowolnej, skończonej rodziny rozłącznych, niepustych zbiorów \[\mathcal A=\{A_1, A_2, \ldots, A_n\}.\] Choć zwróćmy uwagę, że cały czas zasadniczo mówimy o czasach, gdy ogólnie przyjętej aksjomatyki teorii mnogości jeszcze nie było. Dopiero była tworzona. Jednakże w przypadku skończenie wielu zbiorów nikt nie kwestionował istnienia stosownego zbioru \(A\). Sytuacja zmienia się gdy zbiorów jest nieskończenie wiele. Wówczas musielibyśmy dokonać nieskończenie wielu wyborów do czego potrzebowalibyśmy nieskończonego czasu.
Dlatego gdy mamy nieskończenie wiele zbiorów, to musimy raczej poszukać jakiejś reguły, która pozwoli nam wybrać z każdego z nich po jednym elemencie. A wymyślenie takiej reguły wymaga pewnej wiedzy na temat zbiorów, z których chcemy wybierać elementy. Może się zdarzyć, że w danym przypadku wiemy zbyt mało aby skonstruować funkcję wyboru. Posłużmy się pewnym nie do końca matematycznym, acz pouczającym, przykładem pochodzącym zdaje się od Russella.
Wyobraźmy sobie, że mamy nieskończenie wiele zbiorów, z których każdy zawiera parę butów. Tj. w każdym zbiorze znajduje się but lewy oraz but prawy. W tej sytuacji możemy funkcję wyboru zdefiniować bardzo łatwo. Z każdego zbioru wybieramy np. but prawy. Tutaj byliśmy w stanie bezproblemowo z każdego zbioru wybrać po jednym elemencie. Skorzystaliśmy w tym celu z natury elementów, z których zbiory butów się składają. Dało nam to wiedzę o tych zbiorach, dzięki której mogliśmy łatwo z każdego wybrać po jednym bucie. Jeżeli jednak rozważymy zbiory składające się nie z butów lecz skarpetek, to sytuacja wygląda już odmiennie. Skarpetki zasadniczo zbyt rozróżnialne nie są dla ludzkiego oka. W teorii (i tak na potrzeby tego przykładu załóżmy) obie skarpetki z tej samej pary powinny być dla człowieka nieodróżnialne. W tej sytuacji nie mamy żadnego sposobu wyróżnienia, a tym samym wybrania, w skończonym czasie, po jednej skarpetce z każdego zbioru. A co za tym idzie, nie mamy możliwości zdefiniowania żadnej konkretnej funkcji wyboru przy tak skromnej wiedzy o zbiorach skarpetek. No chyba, że posiadamy jakąś dodatkową wiedzę o naszych skarpetkach typu, że np. każda para skarpetek została położona tak, że jedna jest z lewej, a druga z prawej strony. Jednakże bez żadnej dodatkowej wiedzy nie będziemy w stanie wyróżnić, a więc i wybrać z każdego zbioru po jednej skarpetce.
Teraz rozważmy nieco bardziej matematyczny przykład. Weźmy nieskończoną rodzinę zbiorów, których elementami są liczby. Oznaczmy je \(Z_i\) dla indeksów \(i\) przebiegających pewien nieskończony zbiór \(\mathcal I\). Najpierw rozważmy sytuację, w której elementami każdego \(Z_i\) są liczby naturalne. Zbiór liczb naturalnych jest dobrze uporządowany, więc ma tę własność, że dowolny jego niepusty podzbiór ma element najmniejszy. Nawet jeśli rozważamy podzbiór nieskończony zbioru \(\mathbb N\), to i tak jest w nim element najmniejszy. Owa własność zbioru \(\mathbb N\) pozwala w bardzo łatwy sposób zdefiniować funkcję wyboru. Wystarczy powiedzieć, że z każdego \(Z_i\) wybieramy element najmniejszy. Jest to prosty, matematyczny przykład kiedy nie potrzebujemy aksjomatu wyboru aby z każdego \(Z_i\) wybrać po jednym elemencie. Posiadana wiedza o zbiorach \(Z_i\) nam to umożliwiła.
Sytuacja wygląda zgoła inaczej, gdy zbiór liczb naturalnych zamienimy na zbiór liczb rzeczywistych \(\mathbb R\). Tutaj już bardzo często element najmniejszy czy największy nie istnieje. Przykładowo przedziały obustronnie otwarte takiego nie mają. I zasadniczo, w ogólności, mając nieskończoną rodzinę podzbiorów \(\mathbb R\), nie jesteśmy w stanie wskazać konkretnej funkcji wyboru jeśli nie mamy dodatkowej, pozwalającej to zrobić, wiedzy na temat zbiorów \(Z_i\).
Pierwszy problem z aksjomatem wyboru jest, można powiedzieć, natury nieco filozoficznej. Drugim problemem, znacznie bardziej namacalnym, są konsekwencje jakie za sobą niesie przyjęcie prawdziwości aksjomatu wyboru. Bo mimo iż sam aksjomat może wydawać się intuicyjnie prawdziwy, zwłaszcza na pierwszy rzut oka, to z jego przyjęcia wynika istnienie obiektów i twierdzeń, które są już szalenie nieintuicyjne. Choć swoją drogą, jak już wspomnieliśmy, nasza ludzka intuicja, a logika to dwie różne sprawy. Naturalnie i odrzucenie pewnika wyboru ma swoje dalekosiężne konsekwencje. Ale o tym w dalszej części. Bez wątpienia następstwa odrzucenia aksjomatu wyboru znacząco przyczyniły się do jego ogólnej akceptacji.
Podamy (niechronologicznie) dwa intrygujące przykłady do czego prowadzi przyjęcie pewnika wyboru. W pierwszym przykładzie łatwe do zrozumienia będzie co się stało, choć mętne będzie dlaczego. Zaś drugi przykład, mimo iż nieco dłuższe będzie zrozumienie co się stało, rozjaśni część ,,dlaczego” z przykładu pierwszego. No ale przejdźmy do konkretów.
W 1924 dwaj polscy matematycy, Stefan Banach i Alfred Tarski, pokazali, że jeśli założymy pewnik wyboru, to można rozbić kulę o promieniu 1 na dosłownie kilka (tj. skończenie wiele!) kawałków i złożyć z nich, dokładnie tak jakbyśmy układali puzzle, dwie kule o promieniach równych także 1. To znaczy, rozbijamy kulę na skończenie wiele rozłącznych kawałków. Nie stosujemy żadnych sztuczek typu rozciąganie, zgniatanie, jakiekolwiek zmiany kawałków kuli, tworzenia nowych kul z jakimiś dziurami w środku czy rozbijanie kuli wyjściowej na nieskończenie wiele części. Kawałków jest skończenie wiele i po prostu je układamy dosłownie tak jak gdyby to były trójwymiarowe puzzle. Bez żadnych matematycznych sztuczek, które są możliwe dzięki temu, że kula składa się z nieskończenie wielu punktów. No może oprócz jednej sztuczki, która jest na razie niezbyt widoczna, i która pozwala nam odpowiednio rozbić kulę na części. Innymi słowy, w świecie matematycznym, w którym możemy korzystać z pewnika wyboru możliwe jest ,,cudowne” rozmnożenie chleba, niemal jak w Biblii. Na czym polega cały trik? To nam wyjaśni następny przykład.
Rozważmy przedział \(I=[0,1]\). Powiemy, że liczby \(x,y\in I\) są ze sobą w relacji \(\sim\), o ile różnica \(x-y\) jest liczbą wymierną. Relacja ta ma bardzo ważną własność. Pozwala rozbić przedział \(I\) na rozłączne podzbiory. Oznaczmy przez \([x]\) zbiór wszystkich elementów \(I\), które są we wspomnianej zależności z \(x\), tj. \[ [x] = \{y\in I: x-y\in\mathbb Q\}.\] Okazuje się, że dla dowolnych dwu elementów \(x,y\in I\) zbiory \([x]\) oraz \([y]\) są albo identyczne albo rozłączne. Przykładowo zbiór \([0]\) składa się ze wszystkich liczb wymiernych, bo jeżeli od zera (jak i od każdej innej liczby wymiernej) odejmiemy inną liczbę wymierną, to wynik też taką liczbą będzie. Dlatego, mimo wyboru innego reprezentanta, zbiory postaci \([q]\), gdzie \(q\) jest wymierne, są identyczne.
Skoro mamy przedział \([0,1]\) rozbity, przy pomocy relacji \(\sim\), na nieskończenie wiele rozłącznych podzbiorów \([q_i]\), to możemy zastosować aksjomat wyboru. Daje on nam gwarancję, że istnieje zbiór \(V\) zawierający po dokładnie jednym elemencie z każdego \([q_i]\). Zbiór ten bywa nazywany zbiorem Vitalego.
No i teraz zaczyna się zabawa. Pomyślmy o mierzeniu, a dokładniej o długości. Możemy sobie zadać pytanie: czy każdy podzbiór \(A\subseteq I\) powinien mieć jakąś długość? Lub może nazwijmy to miarą jaką część przedziału \(I\) zajmuje podzbiór \(A\). Wiemy, że przedział \(I\) ma długość 1. Odcinek \([0,\frac 12]\) zajmuje połowę przedziału więc jego długośc/miara to \(\frac 12\).
Zbiór \(V\) jest niezwykle paskudny, nie może być żadnym odcinkiem. Jest taki hmm mocno poszarpany i dziurawy. Coś jak np. zbiór liczb wymiernych (zbiór niewymiernych również). Okazuje się, że przyjmując pewnik wyboru nie możemy zbiorowi Vitalego \(V\) przypisać żadnej długości! Nie to, że nie potrafimy policzyć jaka ona powinna być. Wbrew pozorom potrafimy przypisywać prawidłową długość wielu niezbyt przyjemnie wyglądającym zbiorom, które równie są dziurawe i postrzępione. Przykładowo podzbiorom liczb wymiernych czy niewymiernych z odcinka \(I\) potrafimy przypisać prawidłową długość. Także obiektom podobnym do słynnego zbioru Cantora. Ach ten Cantor, wszędzie się tu pojawia! Chodzi o to, że przypisanie zbiorowi Vitalego jakiejkolwiek długości prowadzi do sprzeczności. Innymi słowy, jak to mawiają matematycy, istnieją zbiory niemierzalne! Jak to pokazać?
Jeżeli zbiór \(V\) przesuniemy o pewną wymierną długość \(q\), to otrzymamy nowy zbiór \(V+q\). Przesunięcie o \(q\), to nic innego jak dodanie liczby \(q\) do każdego elementu zbioru \(V\). Pisząc bardziej matematycznie \[V+q=\{v+q:v\in V\}.\] Oczywistym jest, że jeśli zbiór długości \(l\) jedynie przesuwamy, to taki przesunięty zbiór powinien mieć taką samą długość/miarę.
Ponieważ wybraliśmy po dokładnie jednym elemencie z każdego \([q_i]\), to różnica dwóch dowolnych elementów zbioru \(V\) jest liczbą niewymierną. Wynika to wprost z określenia relacji \(\sim\). Do tego, dla dwu różnych liczb wymiernych \(q_1, q_2\), zbiory \(V+q_1\) oraz \(V+q_2\) są rozłączne. I teraz powoli przechodzimy do finału. Jeżeli przesuniemy zbiór \(V\) o każdą liczbę wymierną z przedziału \([-1,1]\), to otrzymamy nieskończenie wiele rozłącznych zbiorów postaci \(V+q\). Każdy z tych zbiorów powinien mieć tę samą długość oraz jest zawarty w przedziale \([-1,2]\). Do tego w sumie tych zbiorów, zawiera się przedział \([0,1]\). Zatem łączna długość sumy wszystkich \(V+q\) jest od 1 do 3. W szczególności \(V\) nie może mieć długości/miary równej 0, musi ona być dodatnia. Ale dodając do siebie nieskończenie wiele razy tę samą liczbę dodatnią, otrzymamy nieskończoność. A więc \(V\) nie może mieć też miary dodatniej. Sprzeczność! Nie da się temu zbiorowi przypisać żadnej długości/miary. Jak to mawiają matematycy, jest to przykład zbioru niemierzalnego. Przyjęcie pewnika wyboru sprawia, że takie zbiory istnieją.
Czyli aksjomat wyboru coś nam nie tylko dale, lecz także coś zabiera. Z jednej strony mamy dostęp do bogatego matematycznie świata, w którym możemy korzystać z dobrodziejstw istnienia funkcji wyboru w każdej sytuacji. Z drugiej zaś strony musimy się pogodzić z faktem, że nie wszystko da się zmierzyć.
I właśnie istnienie zbiorów niemierzalnych jest sednem paradoksalnego rozkładu kuli Banacha-Tarskiego. Co prawda rozbijamy kulę na skończenie wiele zbiorów, ale niemierzalnych! Tym razem trójwymiarowych niemierzalnych. Te zbiory nie mają miary/objętości. Kula została rozbita na zbiory o niezwykle paskudnej naturze, niezwykle porozdzierane, takie które w świecie rzeczywistych raczej nie istnieją. Więc niestety w prawdziwym świecie, nie da się rozmnożyć chleba ot tak jak w Biblii. I do tego, mimo iż z jednej kuli otrzymujemy dwie, to nie możemy na tej podstawie twierdzić, że 1=2. Może się to wydawać kuszące, wszak mamy skończenie wiele zbiorów rozłącznych, które jednym sposobem możemy złożyć w jedną kulę, a innym sposobem w dwie. Aby móc rozważać sumy objętości zbiorów rozłącznych, z założenia musimy mieć zbiory objętość mające tzn. mierzalne.
Aby rozstrzygnąć sprawę aksjomatu wyboru należało podejść do sprawy poważnie i metodycznie tak jak zaproponował Wacław Sierpiński:
Niezależnie od naszej osobistej skłonności do zaakceptowania aksjomatu wyboru, musimy wziąć pod uwagę, w każdym przypadku, jego rolę w teorii mnogości i analizie matematycznej. Z jednej strony, ponieważ aksjomat wyboru został zakwestionowany przez niektórych matematyków, istotne jest, by wiedzieć, które twierdzenia zostały udowodnione z jego pomocą oraz dokładnie uświadomić sobie, w którym miejscu dowód został oparty na aksjomacie wyboru; ponieważ często zdarzało się, że różni autorzy używali aksjomatu wyboru w swoich dowodach, nie zdając sobie z tego sprawy. W końcu, nawet gdyby nikt nie kwestionował aksjomatu wyboru, warto byłoby zbadać, które dowody są na nim oparte, a które twierdzenia można udowodnić bez jego pomocy – jak wiemy, podobne analizy są przeprowadzane również w odniesieniu do innych aksjomatów.
Niezwykle pożądane jest rozróżnienie między twierdzeniami, które można udowodnić bez pomocy aksjomatu wyboru, a tymi, których nie jesteśmy w stanie udowodnić bez jego użycia. Analizując dowody oparte na aksjomacie wyboru, możemy:
- ustalić, że dany dowód korzysta z pewnego szczególnego przypadku aksjomatu wyboru,
- określić szczególny przypadek aksjomatu wyboru, który jest wystarczający do udowodnienia danego twierdzenia, oraz przypadek, który jest niezbędny do tego dowodu,
- określić ten szczególny przypadek aksjomatu wyboru, który jest zarówno konieczny, jak i wystarczający do udowodnienia danego twierdzenia.
Zanim przejdziemy dalej, należy uwypuklić to o czym wspomniał Sierpiński, że zdarzało się, iż matematycy nieopatrznie wcześniej, przed pracą Zermela, używali aksjomatu wyboru w swoich twierdzeniach. I to nawet jego krytycy! Jednym z nich był sam Henri Lebesgue, który użył go w dowodzie, że suma przeliczalnej liczby mierzalnych podzbiorów \(\mathbb R\) jest zbiorem mierzalnym.
Wspomnieliśmy już o konsekwencjach przyjęcia aksjomatu wyboru. Teraz, w duchu słów Sierpińskiego, należy wspomnieć o konsekwencjach jego odrzucenia. A te są również daleko idące. Niestety wielu wartościowych twierdzeń, także tych, które intuicyjnie wydają się być prawdziwe, bez pewnika wyboru udowodnić się nie da. Zacznijmy od ważnego twierdzenia z analizy matematycznej.
W analizie, o czym na pierwszym roku studiów dowiaduję się studenci nie tylko matematyki, są dwa pojęcia ciągłości funkcji \(f:\mathbb R\to\mathbb R\) w punkcie \(x\in \mathbb R\). Pierwsza z nich to definicja Cauchy’ego tzw. epsilonowo-deltowa, a druga to ciągowa definicja Heinego. Przy założeniu aksjomatu wyboru obie te definicje są równoważne. Odrzucenie pewnika wyboru spowodowałoby, że albo matematycy musieliby wybrać jedną z tych definicji albo przyjąć dwa pojęcia ciągłości.
Nie można też pominąć wspomnianego już twierdzenia o dobrym uporządkowaniu. Okazuje się, że jest ono równoważne aksjomatowi wyboru. Niektórzy być może dostrzegli pewne podobieństwo. Zarówno pewnik wyboru jak i twierdzenie o dobrym uporządkowaniu mówią o istnieniu pewnego obiektu, pewnej reguły czy to wyboru czy porządku, kompletnie pomijając definicję i naturę tychże obiektów. Ot po prostu istnieją, wierzcie na słowo i tyle w temacie. Warto zwrócić uwagę, że dla wielu, na pierwszy rzut oka, aksjomat wyboru wydaje się prawdziwy, a twierdzenie o dobrym uporządkowaniu już nie. A okazuje się, że albo oba są prawdziwe jednocześnie albo nie.
Kolejnym przykład może być zaskakujący. Przypomnijmy sobie konstrukcję zbioru Vitalego. Podzieliliśmy wtedy odcinek jednostkowy na rozłączne podzbiory. Okazuje się się, że bez aksjomatu wyboru, nie jesteśmy w stanie udowodnić, że zbiorów tych jest nie więcej niż liczb ze wspomnianego odcinka! To znaczy, mamy odcinek jednostkowy i dzielimy go na nieskończenie wiele niepustych podzbiorów. Każdy z tych podzbiorów ma nieskończenie wiele elementów. Intuicyjnie oczywiste jest, że takich podzbiorów nie może być więcej niż punktów odcinka. Ba, nawet wydaje się nieprawdopodobne, że mogłoby być inaczej! No ale jak wiemy ludzka intuicja a matematyczna, wynikająca z praw logiki, prawda, nie zawsze idą ze sobą w parze. I okazuje się, że bez aksjomatu wyboru nie jesteśmy w stanie udowodnić wspomnianego faktu!! Swoją drogą, jeszcze przed pracą Zermela bo 1902, zwrócił na to uwagę Beppo Levi w swojej pracy Intorno alla teoria degli aggregati..
Wynika to zasadniczo z faktu, że liczby elementów zbiorów nieskończonych porównujemy wykorzystując funkcje między zbiorami. O czym można więcej poczytać w tym wpisie. I bez aksjomatu wyboru nie zawsze da się stosowne funkcje zdefiniować. Z tego też wynika, że bez aksjomatu wyboru nie da się, w pełnej ogólności, porównywać liczby elementów dowolnych zbiorów nieskończonych. Chodzi naturalnie o zbiory nieskończone. Liczby określające ile elementów mają zbiory to tzw. liczby kardynalne. Sama zaś liczba elementów danego zbioru bywa nazywana jego mocą. Gdy zbiór jest skończony to jego moc jest liczbą naturalną. W przypadku zaś zbioru nieskończonego, jest liczbą kardynalną nieskończoną. Okazuje się, że sama możliwość porównywania liczb kardynalnych jest równoważna aksjomatowi wyboru. Dokładniej, dla dowolnych liczb naturalnych \(a, b\) zawsze zachodzi \[a\lt b\ \textrm{ albo }a=b\ \textrm{ albo }a\gt b. \] Wydaje się, że i dla liczb nieskończonych analogiczne prawo trychotomii siłą rzeczy musi zachodzić. Jest to (znów!) intuicyjnie prawdziwe, lecz niekoniecznie w praktyce. Otóż, prawo trychotomii dla liczb kardynalnych jest równoważne pewnikowi wyboru.
Idźmy dalej. Istnienie funkcji wyboru mówi de facto, że iloczyn kartezjański dowolnej rodziny niepustych zbiorów jest niepusty. I w istocie, niepustość iloczynu kartezjańskiego dowolnej rodziny niepustych zbiorów jest równoważna pewnikowi wyboru. Intuicyjnie fakt, że takowy iloczyn nie jest pusty, wydaje się być tym czego byśmy oczekiwali. Może to stanowić przesłankę za przyjęciem aksjomatu wyboru.
Dalej warto wspomnieć o w zasadzie o grupie twierdzeń, które orzekają o istnieniu obiektu w pewnym sensie maksymalnego. Natura owego obiektu i sens owej maksymalności zależy naturalnie od kontekstu. Jednym z najbardziej znanych przykładów jest tzw. lemat Kuratowskiego-Zorna. Mówi on, że:
Jeżeli w zbiorze częściowo uporządkowanym \(\mathcal P\) każdy łańcuch ma ograniczenie górne, to \(\mathcal P\) zawiera element maksymalny.
Dalej warto wspomnieć takie twierdzenia jak to, że każda przestrzeń liniowa ma bazę czy np. twierdzenie Krulla mówiące, że nietrywialny pierścień przemienny z jedynką ma ideał maksymalny. Tego typu twierdzeń, których nie da się udowodnić bez aksjomatu wyboru, lub które są z nim wręcz równoważne, można by wymienić znacznie więcej. Mnogość twierdzeń i to istotnych twierdzeń, których bez pewnika wyboru byśmy nie mieli w pełnej ogólności, stanowi kolejną przesłanką za akceptacją tego aksjomatu, który w zasadzie z tego powodu stał się, z czasem, wręcz niezbędny w matematyce. Chociaż jak to ktoś kiedyś powiedział:
Aksjomat ma wiele eleganckich następstw. Ale to argument za interesowaniem się nim od strony matematycznej, a nie jego prawdziwością.
Na koniec należy wspomnieć o jeszcze jednej rzeczy. Mianowicie o związkach pewnika wyboru z resztą aksjomatów teorii mnogości. Dokładniej, jak pokazał Kurt Gödel, jeśli aksjomaty Zermela-Fraenkla są niesprzeczne, to dodanie do nich aksjomatu wyboru nie doprowadzi do sprzeczności. Natomiast Paul Cohen udowodnił, że dodanie do aksjomatów ZF zaprzeczenia pewnika wyboru również nie doprowadzi do sprzeczności. Innymi słowy aksjomat wyboru jest niezależny od pozostałych aksjomatów Zermela-Fraenkla.
Chyba właśnie znaczenie aksjomatu wyboru w matematyce, to ile ważnych twierdzeń nie można by było udowodnić bez niego, oraz jego niezależność od reszty aksjomatów przesądziły o jego powszechnej akceptacji. I to mimo jego niekonstruktywnej natury i również zaskakujących, sprzecznych z intuicją konsekwencji jego przyjęcia. Jednakże dowodząc jakieś twierdzenie zawsze lepiej, jeśli to tylko możliwe, udowodnić je nie korzystając z pewnika wyboru. Nawet jeżeli znacznie to wydłuży sam dowód. Twierdzenie, w którego dowodzie nie jest wymagany aksjomat wyboru jest prawdziwe w teorii opartej na pozostałych aksjomatach teorii mnogości. Twierdzenia korzystające z aksjomatu wyboru nazywają się niekonstruktywnymi. Z powodu użycia pewnika wyboru, pojawia się w nich obiekt (np. zbiór lub funkcja wyboru), który nie został jawnie skonstruowany i którego istnienie gwarantuje dopiero aksjomat wyboru. Z tego względu dowody z użyciem pewnika wyboru nieraz w książkach (zwłaszcza tych starszych) są specjalnie oznaczane.
Literatura
J.L. Bell, The Axiom of Choice, Stanford Encyclopedia of Philosophy (link)
A. Błaszczyk, S. Turek, Teoria mnogości, PWN (2007)
H. Herrlich, Axiom of Choice, Springer (2006)
K. Kuratowski, A. Mostowski, Teoria Mnogości, PWN (1978)
B. Levi, Intorno alla teoria degli aggregati, R. Sct. Lomb. di Sc. e Lett. II 35 (1902), s. 863-868
W. Sierpiński, Cardinal and ordinal numbers, PWN (1965)
E. Zermelo, Beweis, daß jede Menge wohlgeordnet werden kann, Math. Annalen, 59 (1904), s. 514–516