rozkład Bernoulliego

Czy Miejsce Odrzańskie jest miejscem niezwykłym?

Miejsce Odrzańskie, czyli wieś w województwie opolskim, stała się znana ze względu na to, że jak grzmiały nagłówki w gazetach i Internecie, przez 10 lat nie urodził się tam żaden chłopiec. Czy z matematycznego punktu widzenia jest to podejrzane? Czy Miejsce Odrzańskie jest więc miejscem niezwykłym? Ile takich Miejsc Odrzańskich powinno się w Polsce znajdować? I co ma z tym wspólnego rozkład Bernoulliego?

Czar Miejsca Odrzańskiego pryska, gdy się dowiadujemy, że przez owe 10 lat urodziło się tam zaledwie 12 dziewczynek. Czy z matematycznego punktu widzenia to podejrzane? Czy może jednak Miejsce Odrzańskie jest miejscem niezwykłym? W tym wpisie odpowiemy sobie na te pytania oraz powiemy nieco o tym ile, statystycznie, powinno być w Polsce wsi, w których wystąpiła taka seria. Jest to świetna okazja do tego aby wspomnieć o rozkładzie Bernoulliego.

Rzut monetą jest jednym z najprostszych doświadczeń losowych. Są nim męczeni uczniowie w szkołach na lekcjach matematyki poświęconych rachunkowi prawdopodobieństwa. Dla prostoty rozważa się tzw. monetę symetryczną, choć nigdy się nie mówi o jaką symetrię chodzi.

Ze wszystkich monet jakie w życiu miałem w ręku, chyba o żadnej nie mógłbym powiedzieć, że jest w dobrym przybliżeniu symetryczna. Bardziej poprawnie powinno się mówić o monecie uczciwej. Używanie tego sformułowania ma oczywiście na celu sprowadzenie rzutu monetą do sytuacji idealnej, gdzie szanse na orła są takie same jak na reszkę. Jest to wygodniejsze i szybsze niż napisanie wprost: proszę przyjąć, że prawdopodobieństwo…

Sytuacje realne na ogół nie są tak idealne. W przypadku rzutu monetą, założenie, że jest uczciwa, często jest bardzo dobrym przybliżeniem rzeczywistości. Należy jednak pamiętać, że moneta może mieć np. taki rozkład masy, że szanse na orła będą istotnie większe.

Podobnie jest z płcią dzieci. W zadaniach szkolnych często się przyjmuje, że szanse na urodzenie chłopca są takie same jak na dziewczynkę. Jednak w rzeczywistości nieco częściej rodzą się chłopcy. Poniżej zestawienie urodzeń w Polsce w ostatnich latach. Źródło.

Rok Chłopcy % Dziewczynki %
2019 193 327 51,39% 182 865 48,61%
2018 200 468 51,47% 195 572 48,53%
2017 206 410 51,35% 195 572 48,65%

Natomiast w latach 2010-2019 (tj. okres 10 lat) chłopców urodziło się \(51,46\%\) (zaokrąglając do 2 miejsc po przecinku).

Jak widzimy częstość nie jest tutaj rozłożona równomiernie. Chłopców rodzi się więcej i jest to ogólny trend, nie tylko w Polsce.

Przyjmijmy liczbę \(0,5146\) za prawdopodobieństwo urodzenia chłopca oraz \(0,4854\) urodzenia dziewczynki. Wówczas szanse, że urodzi się 12 dziewczynek z rzędu są równe w przybliżeniu \(0,000171\). Czyli są znikome. Można więc poniekąd powiedzieć, że Miejsce Odrzańskie jest wyjątkowe. Tak jak mogłaby powiedzieć o sobie osoba, która trafiła szóstkę w lotka. Ale czy kogoś dziwi, że jakaś osoba trafiła szóstkę w lotka? Chyba nie. Zdarza się to dosyć regularnie. Czy więc powinno nas dziwić, że trafiła się miejscowość z taką serią dziewczynek?

Zanim przejdziemy do rozkładu Bernoulliego, musimy najpierw zacząć od pojęcia próby Bernoulliego. Rozważmy doświadczenie spełniające poniższe warunki:

  • możliwe są tylko dwa wyniki, które nazywać będziemy sukcesem i porażką;
  • prawdopodobieństwo sukcesu jest równe \(p\), a porażki, w takim razie, \(1-p\);

Nazywamy takie doświadczenie próbą Bernoulliego. Będziemy jednak zainteresowani wielokrotnym powtarzaniem prób Bernoulliego (czyli tzw. schematem Bernoulliego) spełniającym warunek:

  • wszystkie powtórzenia doświadczenia są od siebie niezależne, tj. wyniki wcześniejszych doświadczeń nie mają żadnego wpływu na przyszłe.

Dobrym przykładem jest rzut, niekoniecznie uczciwą, monetą. Są dwa możliwe wyniki (nie bierzemy pod uwagę możliwości, że moneta może zawisnąć w powietrzu lub stanąć na sztorc 😉 ). Wynik konkretnego rzutu w żaden sposób nie zależy od poprzednich. Można również rozważać doświadczenie mające więcej możliwych wyników, o ile jesteśmy w stanie je podzielić na dwie grupy.

Tu za przykład niech posłuży ruletka. W jej europejskiej odmianie wypaść może jedno z 37 pól (od 0 do 36). Oprócz 0 każde ma kolor czarny lub czerwony. Jeżeli postawiliśmy na kolor czerwony, to gdy kulka zatrzyma się na którymkolwiek polu tego koloru, będzie to dla nas sukces. Szanse na to wynoszą \(\frac{18}{37}\). Każdy inny wynik, to nasza porażka.

Podobnie jeżeli postawiliśmy u bukmachera na zwycięstwo Barcelony w meczu z Realem, to wygrana Katalończyków jest dla nas sukcesem. Remis lub wygrana Królewskich, to nasza porażka.

Próba Bernoulliego może być powtarzana wielokrotnie lub też zachodzić, nawet w tym samym czasie, w wielu miejscach, o ile tylko wyniki w żaden sposób od siebie nie zależą. Wykorzystamy rozkład Bernoulliego do tego aby zobaczyć, że Miejsce Odrzańskie wcale takie niezwykłe nie jest. Przynajmniej z matematycznego punktu widzenia.

Jeżeli powtarzamy próbę Bernoulliego \(n\) razy, to możemy się zastanawiać jakie są szanse, że odniesiemy sukces np. dokładnie 5 razy albo co najmniej 3 razy itd.

Rozkład Bernoulliego, oznaczany \(B(n;p)\), pokazuje jakie jest prawdopodobieństwo tego, że otrzymamy dokładnie jeden sukces, dokładnie dwa lub żadnego itd. Czyli pokazuje jak, przy wspomnianych założeniach, prawdopodobieństwo jest rozłożone pomiędzy liczby \(0, 1, \ldots, n\).

Spójrzmy na kilka prostych przykładów. Jeżeli rzucamy uczciwą monetą dwa razy, to mamy następujące możliwe wyniki: \[(O,O), (O,R), (R,O), (R,R).\]

Powiedzmy, że orzeł to sukces. Wówczas szanse na 0 sukcesów (czyli dwie reszki) są równe \(\frac 14\). Na dokładnie 1 sukces \(\frac 12\), a na dwa sukcesy \(\frac 14\). Jest to rozkład \(B(2;0,5)\). To jak rozłożone jest prawdopodobieństwo lepiej zobaczyć, zwłaszcza dla większych \(n\), na wykresie. Poniżej rozkład prawdopodobieństwa \(B(2;0,5)\).
rzut monetą

W przypadku 10 rzutów uczciwą monetą wygląda to tak:
rozkład Bernoulliego

Szanse na brak (lub 10) sukcesów nie są zerowe, tylko są tak małe (dokładnie \(\frac{1}{1024}\)), że są w zasadzie niewidoczne na wykresie.

Jak widać największe szanse są na otrzymanie pięciu sukcesów. Nie oznacza to, że zawsze liczba sukcesów będzie równa pięć. Prawdopodobieństwo otrzymania dokładnie pięciu sukcesów (czyli orłów) jest równe w przybliżeniu \(0,246\). Czyli częściej otrzymamy inną liczbę orłów/sukcesów niż 5. Poniżej wykres dla \(n=10\) oraz \(p=0,75\).
rozkład Bernoulliego

Tym razem największe szanse mamy mamy na 8 sukcesów.

Ogólnie, dokładnie \(k\) sukcesów, w \(n\) próbach, może się zdarzyć na tyle sposobów, na ile jesteśmy w stanie rozmieścić \(k\) sukcesów na \(n\) miejscach. Czyli na tyle sposobów, ile jest \(k\) elementowych podzbiorów zbioru \(n\) elementowego.

Wobec tego prawdopodobieństwo \(P(k)\) dokładnie \(k\) sukcesów w \(n\) próbach Bernoulliego (\(k\leq n\)) jest równe \[P(k)={n\choose k}p^k(1-p)^{n-k}\]

Gdy rzucamy uczciwą monetą, to wiemy że średnio powinno wypadać mniej więcej tyle samo orłów jak i reszek. Nie oznacza to, że długie serie np. orłów nie powinny się zdarzać. Wbrew pozorom, powinny się pojawiać coraz dłuższe serie, im dłużej rzucamy. O tym jak policzyć prawdopodobieństwo tego, że np. wypadnie 10 orłów z rzędu przy stukrotnym rzucie monetą można poczytać tutaj.

Rzucanie monetą możemy traktować jak serię prób Bernoulliego, gdzie \(p=0,5\). Jeżeli rzucamy monetą \(n\) razy, to średnio padnie \(0,5n\) orłów. Mówiąc nieco bardziej matematycznie, powiedzielibyśmy, że wartość oczekiwana zmiennej losowej o rozkładzie \(B(n;0,5)\) jest równa \(0,5n\).

W przypadku rozkładu Bernoulliego \(B(n,p)\) średnia liczba sukcesów jest równa \(np\). Nie oznacza to, że zawsze tyle otrzymamy.

Jak już wiemy szanse, że urodzi się 12 dziewczynek z rzędu są równe około \(0,000171\). Wsi w Polsce jest 43037 (źródło).

Rozważmy następujący eksperyment. Od określonego momentu, w każdej polskiej wsi zaczynamy odnotowywać urodzenia dzieci aż do dwunastego dziecka. Za sukces uznajemy urodzenie się 12 dziewczynek z rzędu. Ponieważ urodzenia dzieci w dwu różnych wsiach od siebie nie zależą, to mamy poprawnie określony schemat Bernoulliego.

Średnia liczba sukcesów to \[43037\cdot 0,000171…\approx 7,36.\]

Nie oznacza to jednak, że w Polsce miejscowości z 12 dziewczynkami z rzędu byłoby około 7. To jedynie oznacza, że gdyby wziąć Polskie wsie i np. po taką samą ilość wsi w innych krajach, to mogłoby się okazać, że w Polsce odnieślibyśmy 1 sukces (czyli Miejsce Odrzańskie), a np. w Hiszpanii 15.

W ramach ciekawostki poniżej znajdują się wyniki prostego programu komputerowego symulującego opisany wyżej eksperyment. Tj. dla każdej z 43037 wsi losujemy 12 dzieci i patrzymy na płeć każdego z nich. Jeżeli pierwsze 5 dzieci to dziewczynki, a szóstym dzieckiem jest chłopak to dla danej wsi przypisujemy wynik 5. W tabeli znajduje się liczba wsi z poszczególnymi wynikami. Pierwszy wiersz zawiera liczbę wsi z wynikiem 0 w poszczególnych symulacjach, tj. pierwszym dzieckiem był chłopak. Piąty wiersz liczbę wsi z wynikiem 4 itd.

0 22067 21972 22167 22188 22197 22069 22201 22238 22041 22170
1 10914 10790 10801 10726 10763 10784 10709 10819 10770 10769
2 5186 5421 5177 5194 5168 5255 5121 5063 5252 5219
3 2573 2479 2540 2570 2491 2468 2587 2513 2534 2557
4 1170 1201 1209 1234 1269 1238 1275 1234 1270 1167
5 589 608 601 557 584 644 593 571 612 602
6 290 310 284 293 299 292 290 317 287 296
7 131 129 132 146 134 147 135 156 146 141
8 63 73 59 68 64 74 66 58 63 59
9 35 39 31 34 34 29 33 36 32 30
10 9 8 22 16 11 18 13 15 17 14
11 4 5 9 5 10 8 7 11 8 5
12 6 2 5 6 13 11 7 6 5 8

Ani razu nie zdarzyło się aby nie było wsi z 12 dziewczynkami z rzędu. Najmniejsza ich liczba to 2, a największa 13. Zaś średnia liczba wsi z 12 dziewczynkami z rzędu jest równa 6,9.

Zatem nie ma niczego nadzwyczajnego w tym, że są w Polsce miejscowości, gdzie urodziło się 12 dziewczynek z rzędu. Tym bardziej, że rozważyliśmy przypadek mocno uproszczony, tj. taki, w którym urodzenia zaczynamy odnotowywać od pewnego momentu i w każdej wsi bierzemy pod uwagę tylko 12 urodzeń.

Gdybyśmy wzięli pod uwagę np. 30 urodzeń i za sukces uznali urodzenie się co najmniej 12 dziewczynek z rzędu w trakcie tej serii, to oczekiwana liczba sukcesów byłaby większa. Obliczenia w tym przypadku są nieco trudniejsze i, z matematycznego punktu widzenia, jest to już inna historia.

Pokazuje to jednak, że miejscowości, w których pojawiła się tak długa seria dziewczynek, zwłaszcza gdyby wziąć pod uwagę kilkudziesięcioletnią historię, najprawdopodobniej było co najmniej kilka. Tylko nikt nie zwrócił na inne miejscowości uwagi na tyle, aby pisać o tym w gazetach.

O ile mieszkańcy Miejsca Odrzańskiego, mogą się upierać, że stało się u nich coś niezwykłego, o tyle nie powinno to nikogo dziwić, że gdzieś w Polsce taka seria dziewczynek się zdarzyła. To tak jak ze, wspomnianym już, lotkiem. To, że ktoś trafi szóstkę nie jest niczym niezwykłym. Choć osoba, która ją trafiła z pewnością uważa, że spotkało ją coś niezwykłego.

Nawet mimo iż szanse na szóstkę w Dużym Lotku są znikome, to biorąc pod uwagę, że na ogół gra bardzo dużo osób, to szanse na to, że ktoś wygra już takie znikome nie są.

Odpowiedz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *