Zdanie, że odległość z punktu A do punktu B jest równa tyle i tyle wydaje się być oczywiste. Czy aby na pewno? I dlaczego kula może być kwadratem?
W szkole uczymy się, że odległość między dwoma liczbami rzeczywistymi \(a, b\) jest równa \[|a-b|\] co jest równe długości przedziału, którego końcami są liczby \(a\) oraz \(b\). Zaś między dwoma punktami na płaszczyźnie \(A=(a_1,a_2)\) oraz \(B=(b_1,b_2)\) odległość wyraża się wzorem \[d(A,B)=\sqrt{(a_1-b_1)^2+(a_2-b_2)^2}\] Jest to po prostu wzór na długość odcinka łączącego punkt \(A\) z punktem \(B\).
Analogiczny wzór \[d(A,B)=\sqrt{(a_1-b_1)^2+(a_2-b_2)^2+(a_3-b_3)^2}\] jest prawdziwy, gdy \(A\) oraz \(B\) są punktami przestrzeni trójwymiarowej. Ogólniej \[d(A,B)=\sqrt{\sum_{i=1}^n (a_i-b_i)^2}\] gdy \(A=(a_1,a_2,\ldots,a_n)\), \(B=(b_1,b_2,\ldots,b_n)\) są punktami przestrzeni \(n\)-wymiarowej. Tak zdefiniowana odległość nazywa się metryką euklidesową.
Aby rozważyć sytuację bliższą naszej rzeczywistości, możemy założyć, że owe punkty znajdują się na naszej planecie. Powiedzmy, że punkt \(A\) znajduje się w Krakowie (np. gdzieś przy pomniku Mickiewicza na krakowskim rynku), a \(B\) w Atenach (np. gdzieś na Akropolu Ateńskim).
Jeżeli wybierzemy jakiś układ współrzędnych, to jesteśmy w stanie, korzystając ze wzoru przedstawionego wyżej, policzyć odległość od punktu \(A\) do punktu \(B\), o ile tylko znamy ich współrzędne. Tylko, że hmmm ta odległość \(d(A,B)\) będzie, jak wiemy, długością odcinka. Gdybyśmy się wybrali w podróż z \(A\) do \(B\), to nie da się tego zrobić tak aby trasa miała długość \(d(A,B)\). Ze względu na to, że Ziemia jest (w przybliżeniu) kulą, wymagałoby to poruszania się przez jej wnętrze. Zobrazujmy to na przykładzie okręgu.
Odległość między zaznaczonymi punktami może być długością łączącego je odcinka. Można powiedzieć, że przypadek ten zachodzi, gdy naszym nazwijmy to, światem jest płaszczyzna, na której znajduje się okrąg. Wówczas najkrótsza trasa między punktami wiedzie po łączącym je odcinku. Jednakże jeżeli naszym światem jest tylko okrąg i możemy się poruszać jedynie po nim, to dwa różne punkty dzielą okrąg na dwie części. Odległość między tymi punktami jest równa nie dłuższej części okręgu. Na rysunku zaznaczono ją ciemniejszym kolorem.
W przypadku kuli już takie oczywiste nie jest czym jest odległość między dwoma punktami. Jeżeli nie ma żadnych ograniczeń w poruszaniu się po jej powierzchni, to naturalnym jest, że powinna to być najkrótsza krzywa łącząca owe punkty i znajdująca się w całości na powierzchni kuli. Krzywych łączących te punkty jest nieskończenie wiele. Nie jest, wbrew pozorom, takie oczywiste, że jest wśród nich ta najkrótsza, ale w istocie najkrótsza istnieje.
Powyższe rozważania pokazują, że istnieje wiele różnych sposobów określenia odległości między tymi samymi punktami. Czym więc jest odległość z matematycznego punktu widzenia? Czy można podać ogólną definicję odległości?
Po pierwsze, odległość określamy między jakimiś punktami. Mogą to być punkty płaszczyzny, przestrzeni trójwymiarowej, sfery lub ogólniej jakiegokolwiek zbioru \(X\). Innymi słowy, odległość jest pewną funkcją \[d:X\times X\to\mathbb R.\] Zbiór \(X\times X\), to po prostu zbiór par \((x,y)\), gdzie \(x,y\in X\). Dokładniej są to pary uporządkowane. Ważna jest tu kolejność, tzn. \((x,y)\neq (y,x)\), o ile \(x\neq y\).
Jakie warunki powinna spełniać funkcja \(d\) abyśmy mogli nazwać ją odległością? Sporo jesteśmy w stanie powiedzieć jeżeli przyjrzymy się bliżej temu co jest dla nas najbardziej intuicyjne, czyli zwykłej odległości na płaszczyźnie. Dokładniej, skupmy się na tym jakie jej własności uznamy za na tyle oczywiste aby spełniała je każda funkcja, którą chcemy utożsamiać z jakimś rodzajem odległości.
Po pierwsze, odległość, podobnie jak długość odcinka, nie może być ujemna. Co matematycznie zapisalibyśmy jako \[d(x,y)\geqslant 0\] Co więcej, \(d(x,y)=0\) jedynie w przypadku, gdy \(x=y\). Wszak odcinek łączący punkt \(x\) z nim samym jest zdegenerowany, jest punktem. Ma więc długość 0. Jeżeli \(x\neq y\), to \(d(x,y)\gt 0\).
Odległość nie powinna zależeć od tego czy mierzymy ją od punktu \(x\) do \(y\) czy odwrotnie, tzn. \[d(x,y)=d(y,x)\]
Ponadto, \(d(x,y)\) powinna oznaczać długość najkrótszej drogi łączącej dane dwa punkty. Nie powinno być sytuacji, że przechodząc z punktu \(x\) do punktu \(z\), a następnie z punktu \(z\) do \(x\) przejdziemy łącznie trasę krótszą niż \(d(x,y)\). Wobec tego matematycy dodają jeszcze jedną własność aby funkcję \(d\) można było nazwać odległością, lub mówiąc bardziej matematycznie, metryką. Ta własność to tzw. nierówność trójkąta, tzn. \[d(x,y)\leqslant d(x,z)+d(z,y)\] dla dowolnych \(x,y,z\in X\). Gwarantuje ona, że do takich patologii dochodzić nie będzie.
Własność tę znamy bardzo dobrze z geometrii. Jeśli odcinki \(a,b,c\) są bokami trójkąta, to zawsze \[a+b>c.\] Stąd też zresztą jej nazwa. Nierówność trójkąta mówi nam, że droga z \(x\) do \(y\) przez jakikolwiek punkt pośredni nie może być krótsza niż \(d(x,y)\).
Podsumowując, możemy powiedzieć, że metryka na zbiorze \(X\) to taka funkcja \(d:X\times X\to\mathbb R\), że
- \(d(x,y)=0\Leftrightarrow x=y\)
- \(d(x,y)=d(y,x)\)
- \(d(x,y)\leqslant d(x,z)+d(z,y)\)
dla dowolnych \(x,y,z\in X\).
Niektórzy być może zwrócili uwagę na fakt, że w definicji tej nie zakładamy, że funkcja \(d\) przyjmuje wartości nieujemne, mimo iż wcześniej o tym wspomnieliśmy. Okazuje się, że nie jest to koniecznie, gdyż wynika z pozostałych warunków. Dokładniej \[0=d(x,x)\leqslant d(x,y)+d(y,x)=2d(x,y).\] Warto jeszcze wspomnieć, że każdą parę \((X,d)\) (tj. zbiór i metryka na nim określona) nazywamy przestrzenią metryczną.
Zdefiniowaliśmy pojęcie odległości czyli metryki, to teraz czas na przykłady. Najbardziej znaną metryką jest oczywiście metryka euklidesowa czyli zwykła odległość punktów utożsamiana z długością łączącego je odcinka. Dokładniej mamy tu więcej niż jedną metrykę, bo po jednej dla każdego \(\mathbb R^n\). Mamy metrykę euklidesową określoną na prostej \(\mathbb R^1\), płaszczyźnie \(\mathbb R^2\), przestrzeni trójwymiarowej \(\mathbb R^3\) oraz na przestrzeniach wyżej wymiarowych.
Kolejny, dosyć naturalny przykład, to tzw. metryka taksówkowa. Jej idea jest bardzo prosta. Wyobraźmy sobie miasto (lub jego fragment) z następującym rozkładem ulic
oraz to, że chcemy się przemieścić samochodem (np. taksówką!) z punktu A do punktu B. Możemy się naturalnie poruszać jedynie ulicami. Przykładowe drogi przedstawiono poniżej.
Układ ulic sprawia, że (w przybliżeniu) poruszać możemy się jedynie w pionie lub poziomie. Obie narysowane drogi są takiej samej długości, gdyż w obu przypadkach pokonujemy taką samą odległość w górę i taką samą w prawo. Co więcej, obie drogi są najkrótsze bo pokonujemy najkrótsze możliwe drogi w górę i w prawo aby przemieścić się od A do B.
Mówiąc matematycznie, mając punkty \(A=(a_1,a_2), B=(b_1,b_2)\) odległość między nimi w metryce taksówkowej jest równa \[d(A,B)=|a_1-b_1|+|a_2-b_2|.\] Intuicyjnie odpowiada to drodze czerwonej. Dodajemy część poziomą do pionowej.
Kolejnym znanym przykładem jest tzw. metryka rzeka. Jej idea również jest bardzo prosta. Jeżeli dwa punkty \(A=(a_1,a_2)\) oraz \(B=(b_1,b_2)\) znajdują się na tej samej prostej pionowej (tj. \(a_1=b_1\)), to odległość między nimi jest równa długości odcinka je łączącego. W przeciwnym wypadku, idziemy (pionowo) z punktu \(A\) do osi poziomej OX czyli do punktu \((a_1,0)\). Następnie przesuwamy się po osi OX, aż znajdziemy się nad/na/pod punktem \(B\), tj. przesuwamy się do punktu \((b_1,0)\). Na koniec przesuwamy się pionowo do punktu \(B\). Graficznie wygląda to tak:
Odległość \(d(A,B)\) jest równa długości czerwonej łamanej. Matematycznie, jeśli \(A=(a_1,a_2)\) oraz \(B=(b_1,b_2)\), to \[d(A,B)=\left\{\begin{array}{lll}|a_2-b_2| & \textrm{ gdy } & a_1=b_1,\\ |a_2|+|a_1-b_1|+|b_2| & \textrm{ gdy } & a_1\neq b_1\end{array}\right.\] Dlaczego metryka ta nazywa się metryką rzeka? Wyobraźmy sobie, że oś OX to rzeka znajdująca się w dżungli, w której są takie zarośla, że można się przemieszczać jedynie prostopadle w kierunku rzeki (np. po wydeptanych ścieżkach). Natomiast przy samej rzecze można się już bez problemu przemieszczać wzdłuż niej, jak i ją przejść bo jest płytka. Wówczas podróż z punktu A do punktu B wyglądałaby tak jak na rysunku powyżej. Trochę to naciągane, ale zdaje się stąd swoją nazwę wzięła metryka rzeka.
Dotychczasowe przykłady mimo iż czasami nieco naciągane, to mniej lub bardziej odpowiadały jakiejś rzeczywistej sytuacji. Dlatego następny przykład może się wydawać nieco dziwny. Jest nim tzw. metryka dyskretna. Jest ona bardzo prosta i można ją określić na dowolnym zbiorze \(X\) (np. na płaszczyźnie). Dokładniej \[d(x,y)=\left\{\begin{array}{lll} 0 & \textrm{ gdy } & x=y,\\ 1 & \textrm{ gdy } & x\neq y\end{array}\right.\] Wszystkie (różne) punkty w tej metryce są od siebie równoodległe.
Idźmy dalej. Rozważmy zbiór \(X_n\) słów (z sensem lub nie) długości \(n\) zapisanych literami jakiegoś alfabetu (np. łacińskiego). Dla słów \(a,b\in X_n\) określamy przez \(d(a,b)\) jako liczbę pozycji, na których odpowiadające sobie litery w obu słowach są różne. Okazuje się, że tak określona funkcja \(d\) jest metryką! Jest to tzw. metryka Hamminga. Ma ona zastosowania w informatyce.
Przykładowo jeśli a=mama, zaś b=tata, to \(d(a,b)=2\), bo tylko na pierwszym i trzecim miejscu mamy różne litery w obu słowach.
Natomiast odległość Hamminga między poniższymi słowami jest równa 3.
Metryka to pojęcie na tyle ogólne, że pozwala sensownie zdefiniować pojęcie odległości między przeróżnymi obiektami, np. funkcjami. Jeżeli \(f,g\) są funkcjami ciągłymi na odcinku \([1,10]\) (lub jakimkolwiek innym odcinku domkniętym) wówczas \[\max_{x\in [1,10]}|f(x)-g(x)|\] jest metryką na zbiorze takich funkcji.
Podobnie jak całka \[\int\limits_0^{10}|f(x)-g(x)|dx,\] która jest po prostu polem między wykresami funkcji.
Odległość można mierzyć również między zbiorami! Pozwala na to metryka Hausdorffa. Przedstawiliśmy jedynie kilka przykładów metryk, które pozwalają zobaczyć jak bogate, z matematycznego punktu widzenia, jest pojęcie odległości. Przestrzeń metryczna, to pojęcie, które znajduje się na pograniczu analizy matematycznej oraz topologii. Dzięki niemu jesteśmy w stanie zdefiniować, w naturalny sposób, wiele pojęć znanych z analizy matematycznej w szerszej klasie obiektów.
Jeśli \((X,d)\) jest przestrzenią metryczną, to kulą otwartą o środku w punkcie \(x\in X\) i promieniu \(r>0\) nazywamy zbiór \[K(x,r)=\{y\in X: d(x,y)\lt r\}.\] Innymi słowy, jest to zbiór tych punktów \(X\), które są odległe od \(x\) o mniej niż \(r\). Pojęcie to jest uogólnieniem odcinka otwartego, koła oraz kuli właśnie. Dokładniej ich wnętrz, bez brzegu. Jeżeli w tej definicji znak \(\lt\) zamienimy na \(\leqslant\), to otrzymamy pojęcie kuli domkniętej.
W przypadku metryki euklidesowej, to na osi rzeczywistej kulą otwartą jest przedział otwarty, na płaszczyźnie wnętrze koła (tj. bez brzegowego okręgu), a w przestrzeni trójwymiarowej jest to wnętrze kuli. Kola domknięte w tych przestrzeniach to odpowiednio: odcinek domknięty, koło oraz kula właśnie. A jak to wygląda w przypadku innych przestrzeni metrycznych?
Okazuje się, że w metryce centrum kula jest… kwadratem! Dokładniej (tutaj środkiem jest początek układu współrzędnych) wnętrzem kwadratu wyglądającym tak:
Kwadratowe kule występują również w metryce rzeka. Tu jednak jest nieco więcej ich rodzajów.
W metryce dyskretnej, jeżeli \(r\leqslant 1\), to \(K(x,r)\) jest zbiorem jednoelementowym, zaś gdy \(r\gt 1\), to \(K(x,r)\) jest całą przestrzenią!
Szkoda, że zabrakło wytłumaczenia istoty rzeczy.
Mógłby Pan rozwinąć swoją myśl? 🙂
Wydaje mi się, że istota rzeczy została wyjaśniona. Być może Panu Marcinowi zabrakło bardziej wyczerpującej odpowiedzi na postawione na początku pytanie ” I dlaczego kula może być kwadratem?”. Dla osób nie w temacie (a chyba dla takich osób jest ten artykuł) nie jest oczywiste, że np. w metryce rzeki kula jest… kwadratem na sznurku.