kwiecień 2016 - wariancja

Miniwykład o wariancji

Przed miesiącem poznaliśmy pojęcie wartości oczekiwanej zmiennej losowej. Wartość oczekiwana jest matematycznym sformalizowaniem tego, co moglibyśmy określić jako średnią wartość losowego eksperymentu, gdy eksperyment ten powtarzać będziemy bardzo wiele razy. Tym razem zastanowimy się nad tym, jak mierzyć rozproszenie potencjalnych wyników eksperymentu wokół wartości oczekiwanej.

Przykład 1. Rozważmy dwie zmienne losowe X i Y przyjmujące wartości ze zbioru {-1, 0, 1, 2, 3}. Niech X będzie wynikiem uzyskanym przez pierwszego gracza w pewnej grze losowej, natomiast Y niech będzie wynikiem drugiego gracza w tej samej grze. Prawdopodobieństwa przyjmowania przez zmienne losowe X i Y poszczególnych wartości zostały podane w tabeli:

k -1
0 1 2 3
P(X=k) 0,1 0,2 0,4 0,2 0,1
P(Y=k) 0,2 0,1 0,4 0,1 0,2

Jak łatwo możemy obliczyć,

EX = -1 · P(X=-1) + 0 · P(X=0) + 1 · P(X=1) + 2 · P(X=2) + 3 · P(X=3) =

     = -1 · 0,1 + 0 · 0,2 + 1 · 0,4 + 2 · 0,2 + 3 · 0,1 = -0,1 + 0 + 0,4 + 0,4 + 0,3 = 1,

EY = -1 · P(Y=-1) + 0 · P(Y=0) + 1 · P(Y=1) + 2 · P(Y=2) + 3 · P(Y=3) =

     = -1 · 0,2 + 0 · 0,1 + 1 · 0,4 + 2 · 0,1 + 3 · 0,2 = -0,2 + 0 + 0,4 + 0,2 + 0,6 = 1.

Obie zmienne losowe mają taką samą wartość oczekiwaną. Oznacza to, że gdybyśmy rozegrali wiele partii gry i obliczyli średnie wyniki uzyskane przez obu graczy, byłyby one podobne i wynosiłby około 1 (bo EX = EY = 1). Zwróćmy jednak uwagę, że zmienna losowa Y z większym prawdopodobieństwem przyjmuje wartości odległe od 1, podczas gdy zmienna losowa X z większym prawdopodobieństwem przyjmuje wartości bliższe 1.

Możemy powiedzieć, że grając wiele razy w tę grę, obaj gracze średnio wygrają tyle samo, jednak gracz drugi, podejmując grę, więcej ryzykuje, bowiem za każdym razem może więcej stracić niż gracz pierwszy. Oczywiście może też więcej zyskać niż jego przeciwnik. Potrzebujemy zatem miary ryzyka w takiej grze. Miarą taka będzie mierzyć rozproszenie potencjalnych wyników graczy wokół wartości oczekiwanej.

Za miarę ryzyka, o której mowa w przykładzie 1, możemy przyjąć wariancję. Wariancję zmiennej losowej X będziemy oznaczali poprzez Var(X) i zdefiniujemy ją w następujący sposób:

Var(X) = E(X-EX)2.

Stosując interpretację wartości oczekiwanej jako średniej wartości zmiennej losowej, możemy powiedzieć, że wariancja mierzy, jak średnio wartości zmiennej losowej różnią się (w sensie kwadratu różnicy) od jej wartości oczekiwanej.

Przykład 2. Obliczmy wariancje zmiennych losowych z przykładu 1. Aby zrobić to wprost z definicji, musimy ustalić, jakie wartości przyjmują zmienne losowe (X-EX)2 = (X-1)2 i (Y-EY)2 = (Y-1)2 (jako że EX = EY = 1).

  • Jeśli X=-1 lub X=3, to (X-1)2 = 22 = 4, a zatem
P((X-1)2=4) = P(X-1 = -2 lub X-1=2) = P(X=-1 lub X=3) = P(X=-1) + P(X=3) = 0,1+0,1 = 0,2.
  • Jeśli X=0 lub X=2, to (X-1)2=12=1, a zatem
P((X-1)2=1) = P(X-1=-1 lub X-1=1) = P(X=0 lub X=2) = P(X=0) + P(X=2) = 0,2+0,2 = 0,4.
  • Jeśli X=1, to (X-1)2 = 02 = 0, a zatem
P((X-1)2=0) = P(X-1=0) = P(X=1) = 0,4.
 Widzimy, że 0, 1 i 4 to wszystkie możliwe wartości zmiennej losowej (X-1)2. Wobec tego

Var(X) = E(X-EX)2 = E(X-1)2 = 0 · P((X-1)2=0) + 1 · P((X-1)2=1) + 4 · P((X-1)2=4) =

                                            = 0 · 0,4 + 1 · 0,4 + 4 · 0,2 = 0 + 0,4 + 0,8 = 1,2.

  • Jeśli Y=-1 lub Y=3, to (Y-1)2 = 22 = 4, a zatem
P((Y-1)2=4) = P(Y-1 = -2 lub Y-1=2) = P(Y=-1 lub Y=3) = P(Y=-1) + P(Y=3) = 0,2+0,2 = 0,4.
  • Jeśli Y=0 lub Y=2, to (Y-1)2 = 12 = 1, a zatem
P((Y-1)2=1) = P(Y-1=-1 lub Y-1=1) = P(Y=0 lub Y=2) = P(Y=0) + P(Y=2) = 0,1+0,1 = 0,2.
  • Jeśli Y=1, to (Y-1)2 = 02 = 0, a zatem
P((Y-1)2=0) = P(Y-1=0) = P(Y=1) = 0,4.

Widzimy też, że podobnie jak poprzednio 0, 1 i 4 to wszystkie możliwe wartości zmiennej losowej (Y-1)2. Wobec tego

Var(Y) = E(Y-EY)2 = E(Y-1)2 = 0 · P((Y-1)2=0) + 1 · P((Y-1)2=1) + 4 · P((Y-1)2=4) =

                           = 0 · 0,4 + 1 · 0,2 + 4 · 0,4 = 0 + 0,2 + 1,6 = 1,8.

Powyższe rachunki można nieco uprościć, jeśli zauważymy, że znajdowanie prawdopodobieństw, z jakimi zmienne losowe (X-1)2 i (Y-1)2 przyjmują poszczególne możliwe wartości, nie jest konieczne. Można bowiem liczyć w następujący sposób:

Var(X) = E(X-EX)2 = E(X-1)2 = (-1-1)2 · P(X=-1) + (0-1)2 · P(X=0) +

           + (1-1)2 · P(X=1) + (2-1)2 · P(X=2) + (3-1)2 · P(X=3) =

           = (-2)2 · P(X=-1) + (-1)2 · P(X=0) + 02 · P(X=1) + 12 · P(X=2) + 22 · P(X=3) =

           = 4 · 0,1 + 1 · 0,2 + 0 · 0,4 + 1 · 0,2 + 4 · 0,1 = 0,4 + 0,2 + 0 + 0,2 + 0,4 = 1,2,

Var(Y) = E(Y-EY)2 = E(Y-1)2 = (-1-1)2 · P(Y=-1) + (0-1)2 · P(Y=0) +

          + (1-1)2 · P(Y=1) + (2-1)2 · P(Y=2) + (3-1)2 · P(Y=3) =

          = (-2)2 · P(Y=-1) + (-1)2 · P(Y=0) + 02 · P(Y=1) + 12 · P(Y=2) + 22 · P(Y=3) =

          = 4 · 0,2 + 1 · 0,1 + 0 · 0,4 + 1 · 0,1 + 4 · 0,2 = 0,8 + 0,1 + 0 + 0,1 + 0,8 = 1,8.

Jak można się było spodziewać, Var(X) < Var(Y).

Często przy obliczaniu wartości wariancji w miejsce wzoru podanego wyżej wygodniej jest zastosować inny wzór:

Var(X) = EX2-(EX)2.

Zwróćmy uwagę na użycie nawiasów w powyższym wzorze: odjemna to wartość oczekiwana kwadratu zmiennej losowej X, odjemnik to kwadrat wartości oczekiwanej zmiennej losowej X. Obie te wielkości najczęściej nie są sobie równe (choć niektórzy błędnie utożsamiają te wielkości), w przeciwnym bowiem razie wariancja każdej zmiennej losowej wynosiłaby 0, a tak nie jest.

Spróbujmy udowodnić powyższy wzór:

Var(X) = E(X-EX)2 = E(X2-2EX·X+(EX)2) = EX2-E(2EX·X)+E(EX)2 =

= EX2-2EX·EX+(EX)2 = EX2-2(EX)2+(EX)2 = EX2-(EX)2.

W powyższym rachunku dwa miejsca powinniśmy przeliczyć szczególnie uważnie. W składniku 2EX·X wielkością losową jest tylko X występujący po znaku mnożenia, natomiast 2EX jest już ustaloną liczbą (nielosową), a zatem zgodnie z własnościami wartości oczekiwanej, które poznaliśmy, E(2EX·X) = 2EX·EX. Podobnie E(EX)2 = (EX)2, bo (EX)2 jest ustaloną liczbą (nielosową), a wartość oczekiwana liczby jest jej równa.

Przykład 3. Obliczmy wariancje zmiennych losowych z przykładu 1, korzystając z powyższego wzoru.

  • Jeśli X=0, to X2=0, a zatem P(X2=0) = P(X=0) = 0,2.
  • Jeśli X=-1 lub X=1, to X2=1, a zatem P(X2=1) = P(X=-1 lub X=1) = P(X=-1) + P(X=1) = 0,1+0,4 = 0,5.
  • Jeśli X=2, to X2=4, a zatem P(X2=4) = P(X=2) = 0,2.
  • Jeśli X=3, to X2=9, a zatem P(X2=9) = P(X=3) = 0,1.

0, 1, 4 i 9 to wszystkie możliwe wartości zmiennej losowej X2. Wobec tego

Var(X) = EX2-(EX)2 =

           = 0 · P(X2=0) + 1 · P(X2=1) + 4 · P(X2=4) + 9 · P(X2=9) - (EX)2 =

           = 0 · 0,2 + 1 · 0,5 + 4 · 0,2 + 9 · 0,1 - 12 = 0 + 0,5 + 0,8 + 0,9 - 1 = 1,2.

  • Jeśli Y=0, to Y2=0, a zatem P(Y2=0) = P(Y=0) = 0,1.
  • Jeśli Y=-1 lub Y=1, to Y2=1, a zatem P(Y2=1) = P(Y=-1 lub Y=1) = P(Y=-1) + P(Y=1) = 0,2+0,4 = 0,6.
  • Jeśli Y=2, to Y2=4, a zatem P(Y2=4) = P(Y=2)=0,1.
  • Jeśli Y=3, to Y2=9, a zatem P(Y2=9) = P(Y=3) = 0,2.

0, 1, 4 i 9 to wszystkie możliwe wartości zmiennej losowej Y2. Wobec tego

Var(Y) = EY2-(EY)2 =

          = 0 · P(Y2=0) + 1 · P(Y2=1) + 4 · P(Y2=4) + 9 · P(Y2=9) - (EY)2 =

          = 0 · 0,1 + 1 · 0,6 + 4 · 0,1 + 9 · 0,2 - 12 = 0 + 0,6 + 0,4 + 1,8 - 1 = 1,8.

Powyższe rachunki możemy trochę uprościć, postępując w podobny sposób, jak to uczyniliśmy w przykładzie 2:

Var(X) = EX2-(EX)2 =

          = (-1)2 · P(X=-1) + 02 · P(X=0) + 12 · P(X=1) + 22 · P(X=2) + 32 · P(X=3) - (EX)2 =

          = 1 · 0,1 + 0 · 0,2 + 1 · 0,4 + 4 · 0,2 + 9 · 0,1 - 12 = 0,1 + 0 + 0,4 + 0,8 + 0,9 - 1 =

          = 1,2,

Var(Y) = EY2-(EY)2 =

          = (-1)2 · P(Y=-1) + 02 · P(Y=0) + 12 · P(Y=1) + 22 · P(Y=2) + 32 · P(Y=3) - (EY)2 =

          = 1 · 0,2 + 0 · 0,1 + 1 · 0,4 + 4 · 0,1 + 9 · 0,2 - 12 = 0,2 + 0 + 0,4 + 0,4 + 1,8 - 1 =

          = 1,8.

Przykład 4. Obliczmy wariancję zmiennej losowej X oznaczającej wynik rzutu sześcienną kostką do gry. W takim wypadku P(X=1) = P(X=2) = P(X=3) = P(X=4) = P(X=5) = P(X=6) = 1/6. Przed miesiącem obliczyliśmy, że EX = 3,5. W takim razie

Var(X) = E(X-EX)2 = (1-3,5)2 · P(X=1) + (2-3,5)2 · P(X=2) + (3-3,5)2 · P(X=3) +

           + (4-3,5)2 · P(X=4) + (5-3,5)2 · P(X=5) + (6-3,5)2 · P(X=6) =

           = (-2,5)2 · 1/6 + (-1,5)2 · 1/6 + (-0,5)2 · 1/6 + (0,5)2 · 1/6 + (1,5)2 · 1/6 + (2,5)2 · 1/6 =

           = 1/6 · (6,25 + 2,25 + 0,25 + 0,25 + 2,25 + 6,25) = 1/6 · 17,5 = 1/6 · 35/2 = 35/12.

Prowadząc rachunki według drugiego poznanego wzoru, możemy napisać:

Var(X) = EX2-(EX)2 = 12 · P(X=1) + 22 · P(X=2) + 32 · P(X=3) + 42 · P(X=4) +

            + 52 · P(X=5) + 62 · P(X=6) - (EX)2 =

           = 1 · 1/6 + 4 · 1/6 + 9 · 1/6 + 16 · 1/6 + 25 · 1/6 + 36 · 1/6 - (3,5)2 =

           = 1/6 · (1 + 4 + 9 + 16 + 25 + 36) - 12,25 = 91/6 - 49/4 = 182/12 - 147/12 = 35/12.

Wypada podać jeszcze kilka własności wariancji, które nietrudno udowodnić:

(i)   Var(X) ≥ 0,

(ii)  Var(X+a) = Var(X) dla dowolnej liczby a,

(iii) Var(cX) = c2 · Var(X) dla dowolnej liczby c,

(iv) jeśli X i Y są niezależnymi zmiennymi losowymi, to Var(X+Y) = Var(X)+Var(Y).

Obliczmy wariancję zmiennej losowej Sn o rozkładzie b(n,p), p∈[0,1], pamiętając o tym, że Sn = X1+X2+...+Xn, gdzie X1, X2, ... , Xn są niezależnymi zmiennymi losowymi takimi że P(Xi=1) = p i P(Xi=0) =1-p, gdzie i∈{1, 2, ..., n}. (O rozkładzie Bernoulliego mówiliśmy przed dwoma miesiącami) W takim razie

Var(Sn) = Var(X1+X2+...+Xn) = Var(X1)+Var(X2)+...+Var(Xn).

Pamiętamy, że EXi = p. Zwróćmy też uwagę, że zmienna losowa Xi przyjmuje tylko wartości 0 i 1, a zatem Xi2 = Xi. W takim razie Var(Xi) = EXi2-(EXi)2 = EXi-(EXi)2 = p-p2 = p(1-p). Wobec tego Var(Sn) = np(1-p).

Możemy zatem powiedzieć, że jeśli Sn~b(n,p), p∈[0,1], to Var(Sn) = np(1-p).

Bywa, że zamiast wariancji rozważa się wielkość o nazwie odchylenie standardowe. Odchyleniem standardowym zmiennej losowej X nazywamy √Var(X).

Warto zwrócić uwagę, że wariancja jest wyrażona w kwadracie jednostki, w której mierzona jest zmienna losowa, np. jeśli rozważaną zmienną losową jest wzrost mierzony w cm, to wariancja wzrostu będzie wyrażona w cm2, choć nie ma to nic wspólnego z powierzchnią. Odchylenie standardowe jest natomiast wyrażone w tych samych jednostkach, w których mierzona jest zmienna losowa.

Wszystkim czytelnikom ligi, którzy są z nami już drugi rok, należy się jeszcze pewne wyjaśnienie. Przed rokiem również poznaliśmy obiekt, który nazwaliśmy wariancją. Wykazywał on pewne podobieństwo do obiektu przedstawionego w tym miniwykładzie, ale był on jednak czymś innym. Związek tych obiektów zostanie przedstawiony w dalszych materiałach w ramach ligi.

Tym, którzy interesują się zagadnieniami matematyki finansowej, warto zwrócić uwagę, by nie mylić wariancji zmiennej losowej z wielkością, która z angielskiego nazywa się value at risk i bywa oznaczana jako VaR(p).

Zadania dla GIM

Zad. 1. W zadaniu sprzed miesiąca rozważaliśmy grę w wesołym miasteczku, która ma następujący przebieg: Zawodnik najpierw rzuca monetą. Jeśli wypadnie orzeł, zawodnik rzuca sześcienną kostką i wygrywa tyle złotych, ile oczek wyrzucił na kostce. Jeśli wypadła reszka, to zawodnik nic nie wygrywa. Ile wynosi wariancja wygranej w tej grze?

Zad. 2. Ponownie wracamy do testu, który będą rozwiązywali Adam i Bartosz. Przypomnijmy, że rozwiązywany przez chłopców test składa się z dziesięciu pytań zamkniętych z czterema odpowiedziami do wyboru, z których zawsze tylko jedna jest prawdziwa. Adam nie zna poprawnej odpowiedzi na żadne pytanie, ale z całą pewnością w każdym pytaniu może wykluczyć jedną odpowiedź jako błędną. Bartosz również nie zna odpowiedzi na żadne pytanie, ale w pięciu pytaniach potrafi wykluczyć dwie odpowiedzi jako błędne, a o odpowiedziach na pięć pozostałych pytań nie potrafi nic powiedzieć. Jeśli ryzyko przyjętych przez chłopców strategii mierzyć wariancją liczby poprawnych odpowiedzi udzielonych przez nich, to który z chłopców ponosi mniejsze ryzyko tzn. zmienna losowa będąca liczbą poprawnych odpowiedzi udzielonych przez niego będzie mniej rozrzucona wokół średniej?

Zad. 3. Udowodnij, że jeśli zmienna losowa przyjmuje tylko dwie wartości przy czym obie z tym samym prawdopodobieństwem, to jej odchylenie standardowe jest równe połowie odległości tych wartości na osi liczbowej.

Zadania dla LO

Zad. 1. Udowodnij własności (ii)-(iv) wariancji podane w ramach wykładu.

Zad. 2. Dane są dwie niezależne zmienne losowe X i Y o tej samej wariancji. Dla jakiego t zmienna losowa postaci tX+(1-t)Y ma najmniejszą możliwą wariancję?

Uwaga! Rozwiązanie tego zadania wymaga znajomości własności funkcji kwadratowej.

Zad. 3. Rozważamy zmienną losową przyjmującą tylko trzy wartości, przy czym środkowa wartość leży dokładnie w środku pomiędzy dwiema skrajnymi wartościami. Każda ze skrajnych wartości jest przyjmowana z prawdopodobieństwem 1/8, a środkowa wartość jest przyjmowana z prawdopodobieństwem 3/4. Udowodnij, że odchylenie standardowe rozważanej zmiennej losowej jest równe jednej czwartej odległości na osi liczbowej skrajnych wartości przyjmowanych przez nią.

 

Wyniki: 
Wyniki w kategorii GIM

W tym miesiącu zawodnicy osiągnęli następujące wyniki:

Imię i nazwisko Zad. 1 Zad. 2 Zad. 3 Suma
Joanna Lisiowska 1 1 1 3
Adam Stachelek 0 0,5 1 1,5

Klasyfikacja generalna:

Adam Stachelek (Szkoła Podstawowa nr 301 w Warszawie) - 15,5 punktów
Joanna Lisiowska (Katolicki Zespół Edukacyjny im. Piotr Skargi w Warszawie) - 15 punktów
Jakub Ptak (Szkoła Podstawowa nr 64 we Wrocławiu) - 5 punktów
Dawid Konieczko (Społeczne Gimnazjum z Oddziałami Dwujęzycznymi w Szprotawie) - 0 punktów

Wyniki w kategorii LO

W tym miesiącu zawodnicy osiągnęli następujące wyniki:

Imię i nazwisko Zad. 1 Zad. 2 Zad. 3 Suma
Daria Bumażnik 1 1 1 3
Tomasz Stempniak 1 1 1 3

Klasyfikacja generalna:

Tomasz Stempniak (I Liceum Ogólnokształcące w Ostrowie Wielkopolskim ) - 19,5 punktu
Daria Bumażnik (II Liceum Ogólnokształcące im. C. K. Norwida w Jeleniej Górze) - 16,5 punktu
Witold Barcz (Zespół Szkół Elektryczno-Mechanicznych w Nowym Sączu) - 1 punkt

 

Odpowiedzi: 
Odpowiedzi dla GIM

Zad. 1. Niech zmienna losowa Z oznacza wygraną gracza. Przed miesiącem (patrz: odpowiedź do zad. 1 dla GIM) ustaliliśmy, że P(Z=0) = 1/2, P(Z=1) = P(Z=2) = P(Z=3) = P(Z=4) = P(Z=5) = P(Z=6) = 1/12 i EZ = 1,75. W takim razie korzystając ze wzoru Var(Z) = E(Z-EZ)2, otrzymujemy:

Var(Z) = (0-EZ)2·P(Z=0)+(1-EZ)2·P(Z=1)+(2-EZ)2·P(Z=2)+(3-EZ)2·P(Z=3)+

           + (4-EZ)2·P(Z=4)+(5-EZ)2·P(Z=5)+(6-EZ)2·P(Z=6) =

           = (0-1,75)2 · 1/2 + (1-1,75)2 · 1/12 + (2-1,75)2 · 1/12 + (3-1,75)2 · 1/12 +

           + (4-1,75)2 · 1/12 + (5-1,75)2 · 1/12 + (6-1,75)2 · 1/12 =

           = (-1,75)2 · 1/2 + (-0,75)2 · 1/12 + (0,25)2 · 1/12 + (1,25)2 · 1/12 +

           + (2,25)2 · 1/12 + (3,25)2 · 1/12 + (4,25)2 · 1/12 =

           = (-1,75)2 · 1/2 + [(-0,75)2 + (0,25)2 + (1,25)2 + (2,25)2 + (3,25)2 + (4,25)2] · 1/12 =

           = 3,0625 · 1/2 + [0,5625 + 0,0625 + 1,5625 + 5,0625 + 10,5625 + 18,0625] · 1/12 =

           = 3,0625 · 1/2 + 35,875 · 1/12 = 3 1/16 · 1/2 + 35 7/8 · 1/12 = 49/16 · 1/2 + 287/8 · 1/12 =

           = 49/32 + 287/96 = 147/96 + 287/96 = 434/96 = 217/48 = 4 25/48 ≈ 4,52083.

Jeśli skorzystamy ze wzoru Var(Z) = EZ2-(EZ)2, to prowadzić on nas będzie do następującego rachunku:

Var(Z) = 02·P(Z=0)+12·P(Z=1)+22·P(Z=2)+32·P(Z=3)+42·P(Z=4)+52·P(Z=5)+62·P(Z=6)-(EZ)2 =

           = 02 · 1/2 + 12 · 1/12 + 22 · 1/12 + 32 · 1/12 + 42 · 1/12 + 52 · 1/12 + 62 · 1/12 - (1,75)2 =

           = 0 · 1/2 + 1 · 1/12 + 4 · 1/12 + 9 · 1/12 + 16 · 1/12 + 25 · 1/12 + 36 · 1/12 - (7/4)2 =

           = 0 + (1 + 4 + 9 + 16 + 25 + 36) · 1/12 - 49/64 = 91/12 - 49/16 = 364/48 - 147/48 = 217/48 =

           = 4 25/48 ≈ 4,52083.

Można też liczyć inaczej. Niech zmienna losowa X przyjmuje wartość 1, gdy w wyniku rzutu monetą zawodnik wyrzucił orła, i 0, gdy zawodnik wyrzucił reszkę. Nadto niech zmienna losowa Y oznacza liczbę oczek uzyskaną poprzez rzut sześcienną kostką. Jak ustaliliśmy przed miesiącem, wprawdzie w wesołym miasteczku jeśli na monecie wypadnie reszka, zawodnik nie rzuca już monetą, bo wiadomo, że nic nie wygrywa, ale na potrzeby rozwiązania zadania możemy sobie wyobrazić, że rzuca monetą, tylko rzut ten nie wpływa już na wygraną. W takim ujęciu zmienne losowe X i Y są niezależne i możliwych jest 12 przebiegów gry, każdy tak samo prawdopodobny. W tabeli poniżej przedstawiono wygraną zawodnika (w zł) w zależności o tego, jaki był wynik rzutu monetą i rzutu kostką:

X \ Y 1
2 3 4 5 6
1 1 2 3 4 5 6
0 0 0 0 0 0 0

Opierając się na powyższej obserwacji i korzystając ze wzoru Var(Z) = E(Z-EZ)2, możemy przeprowadzić następujący rachunek:

Var(Z) = (0-EZ)2·P(X=0 i Y=1) + (0-EZ)2·P(X=0 i Y=2) + (0-EZ)2·P(X=0 i Y=3) +

          + (0-EZ)2·P(X=0 i Y=4) + (0-EZ)2·P(X=0 i Y=5) + (0-EZ)2·P(X=0 i Y=6) +

          + (1-EZ)2·P(X=1 i Y=1) + (2-EZ)2·P(X=1 i Y=2) + (3-EZ)2·P(X=1 i Y=3) +

          + (4-EZ)2·P(X=1 i Y=4) + (5-EZ)2·P(X=1 i Y=5) + (6-EZ)2·P(X=1 i Y=6) =

          = (0-1,75)2 · 1/12 + (0-1,75)2 · 1/12 + (0-1,75)2 · 1/12 + (0-1,75)2 · 1/12 +

          + (0-1,75)2 · 1/12 + (0-1,75)2 · 1/12 + (1-1,75)2 · 1/12 + (2-1,75)2 · 1/12 +

          + (3-1,75)2 · 1/12 + (4-1,75)2 · 1/12 + (5-1,75)2 · 1/12 + (6-1,75)2·P(X=1 i Y=6) =

          = [6·(0-1,75)2+(1-1,75)2+(2-1,75)2+(3-1,75)2+(4-1,75)2+(5-1,75)2+(6-1,75)2] · 1/12 =

          = [6 · (-1,75)2 + (-0,75)2 + (0,25)2 + (1,25)2 + (3,25)2 + (4,25)2 + (5,25)2] · 1/12 =

          = [18,375 + 0,5625 + 0,0625 + 1,5625 + 5,0625 + 10,5625 + 18,0625] · 1/12 =

          = 54,25 · 1/12 = 217/4 · 1/12 = 217/48 = 4 25/48 ≈ 4,52083

Jeśli skorzystamy ze wzoru Var(Z) = EZ2-(EZ)2, to rozumując jak poprzednio, otrzymamy:

Var(Z) = 02·P(X=0 i Y=1) + 02·P(X=0 i Y=2) + 02·P(X=0 i Y=3) + 02·P(X=0 i Y=4) +

          + 02·P(X=0 i Y=5) + 02·P(X=0 i Y=6) + 12·P(X=1 i Y=1) + 22·P(X=1 i Y=2) +

          + 32·P(X=1 i Y=3) + 42·P(X=1 i Y=4) + 52·P(X=1 i Y=5) + 62·P(X=1 i Y=6) - (EZ)2 =

          = 02 · 1/12 + 02 · 1/12 + 02 · 1/12 + 02 · 1/12 + 02 · 1/12 + 02 · 1/12 +

          + 12 · 1/12 + 22 · 1/12 + 32 · 1/12 + 42 · 1/12 +  52 · 1/12 + 62 · 1/12 - (1,75)2 =

          = (6 · 02 + 12 + 22 + 32 + 42 + 52 + 62) · 1/12 = (0+1+4+9+16+25+36) · 1/12 - (1,75)2 =

          = 91 · 1/12 - (7/4)2 = 91/12 - 49/16 = 364/48 - 147/48 = 217/48 = 4 25/48 ≈ 4,52083.

Zad. 2. Niech A oznacza liczbę poprawnych odpowiedzi udzielonych przez Adama. Możemy przyjąć, że A~b(10,1/3). W takim razie

Var(A) = 10 · 1/3 · (1- 1/3) = 10 · 1/3 · 2/3 = 20/9 = 2 2/9 ≈ 2,2222.

Niech B oznacza liczbę poprawnych odpowiedzi udzielonych przez Bartosza. Wówczas B = B1+B2, gdzie B1 oznacza liczbę poprawnych odpowiedzi Bartosza na pytania, w których potrafi wyeliminować dwie odpowiedzi, a B2 oznacza liczbę poprawnych odpowiedzi na pytania, w których będzie wybierał losowo spośród wszystkich czterech odpowiedzi. Zakładamy, że zmienne losowe B1 i B2 są niezależne. Możemy przyjąć, że B1~b(5,½) i B2~b(5,¼). W takim razie

Var(B) = Var(B1+B2) = Var(B1) + Var(B2) = 5 · ½ · (1-½) + 5 · ¼ · (1-¼) =

          = 5 · ½ · ½ + 5 · ¼ · ¾ = 5/4 + 15/16 = 20/16 + 15/16 = 35/16 = 2 3/16 ≈ 2,1875.

Mniejsze ryzyko mierzone rozrzutem wyników wokół wartości oczekiwanej dale strategia Bartosza.

Zad. 3. Rozważmy zmienną losową X taką że P(X=a)=P(X=b)=1/2, a nie b. Wówczas

[tex]EX=a\cdot P(X=a)+b\cdot P(X=b)=a\cdot\frac{1}{2}+b\cdot\frac{1}{2}=\frac{a+b}{2},[/tex]

[tex]Var(X)=(a-EX)^2\cdot P(X=a)+(b-EX)^2\cdot P(X=b)=[/tex]

[tex]=\left(a-\frac{a+b}{2}\right)^2\cdot\frac{1}{2}+\left(b-\frac{a+b}{2}\right)^2\cdot\frac{1}{2}=\left(\frac{a-b}{2}\right)^2\cdot\frac{1}{2}+\left(\frac{b-a}{2}\right)^2\cdot\frac{1}{2}=\left(\frac{a-b}{2}\right)^2,[/tex]

[tex]\sqrt{Var(X)}=\sqrt{\left(\frac{a-b}{2}\right)^2}=\frac{|a-b|}{2}.[/tex]

Odpowiedzi dla LO

Zad. 1. W zależności od tego, czy wyjdziemy od wzoru Var(X) = E(X-EX)2, czy też od Var(X) = EX2-(EX)2, rachunki możemy przeprowadzić zasadniczo na dwa sposoby:

(ii) Var(X+a) = E((X+a)-E(X+a))2 = E(X+a-EX-Ea)2 = E(X+a-EX-a)2 = E(X-EX)2 = Var(X)

      lub

     Var(X+a) = E(X+a)2-(E(X+a))2 = E(X2+2aX+a2)-(EX+Ea)2 = EX2+E(2aX)+Ea2-(EX+a)2 =

                   = EX2+2a·EX+a2-(EX)2-2a·EX-a2 = EX2-(EX)2 = Var(X)

(iii) Var(cX) = E(cX-E(cX))2 = E(cX-c·EX)2 = E(c(X-EX))2 = c·E(X-EX)2 = c2·Var(X)

      lub

      Var(cX) = E(cX)2-(E(cX))2 = Ec2X2-(c·EX)2 = c2·EX2-c2·(EX)2 = c2·(EX2-(EX)2) = c2·Var(X)

(iv) Var(X+Y) = E((X+Y)-E(X+Y))2 = E(X+Y-EX-EY)2 = E((X-EX)+(Y-EY))2 =

                    = E((X-EX)2-2(X-EX)(Y-EY)+(Y-EY)2) = E(X-EX)2-2E(X-EX)(Y-EY)+E(Y-EY)2 =

                    = Var(X)-2E(XY-X·EY-Y·EX+EX·EY)+Var(Y) =

                    = Var(X)-2(EXY-E(X·EY)-E(Y·EX)+E(EX·EY))+Var(Y) =

                    = Var(X)-2(EXY-EX·EY-EY·EX+EX·EY)+Var(Y) =

                    = Var(X)-2(EX·EY-EX·EY-EY·EX+EX·EY)+Var(Y) = Var(X)-0+Var(Y) =

                    = Var(X)+Var(Y)
       lub

      Var(X+Y) = E(X+Y)2-(E(X+Y))2 = E(X2+2XY+Y2)-(EX+EY)2 =

                    = EX2+E(2XY)+EY2-((EX)2+2EX·EY+(EY)2) = EX2+2EXY+EY2-(EX)2-2EX·EY-(EY)2 =

                    = (EX2-(EX)2)+2(EXY-EX·EY)+(EY2-(EY)2) = Var(X)+2(EX·EY-EX·EY)+Var(Y) =

                    = Var(X)-0+Var(Y) = Var(X)+Var(Y)

W powyższych rachunkach wykorzystaliśmy ponane własności wartości oczekiwanej, w szczególności w dowodzie własności (iv) wykorzystaliśmy fakt, że jeśli X i Y są niezależnymi zmiennymi losowymi, to EXY = EX·EY.

Zad. 2. Skoro X i Y są niezależnymi zmiennymi losowymi, to tX i (1-t)Y są również niezależnymi zmiennymi losowymi, a zatem Var(tX+(1-t)Y) = Var(tX)+Var((1-t)Y) = t2·Var(X)+(1-t)2·Var(Y). Można też udowodnić to bezpośrednim rachunkiem (wychodząc od tego, że Var(X) = E(X-EX)2, czy też od Var(X) = EX2-(EX)2):

Var(tX+(1-t)Y) = E((tX+(1-t)Y)-E(tX+(1-t)Y))2 = E(tX+(1-t)Y-E(tX)-E((1-t)Y))2 =

                       = E(tX+(1-t)Y-t·EX-(1-t)EY)2 = E((tX-t·EX)+((1-t)Y-(1-t)EY))2 =

                       = E(t(X-EX)+(1-t)(Y-EY))2 = E(t2·(X-EX)2+2t(X-EX)(1-t)(Y-EY)+(1-t)2·(Y-EY)2) =

                       = E(t2·(X-EX)2)+E(2t(X-EX)(1-t)(Y-EY))+E((1-t)2(Y-EY)2) =

                       = t2·E(X-EX)2+2t(1-t)·E((X-EX)(Y-EY))+(1-t)2·E(Y-EY)2 =

                       = t2·Var(X)-2E(XY-X·EY-Y·EX+EX·EY)+(1-t)2·Var(Y) =

                       = t2·Var(X)-2(EXY-E(X·EY)-E(Y·EX)+E(EX·EY))+(1-t)2·Var(Y) =

                       = t2·Var(X)-2(EXY-EX·EY-EY·EX+EX·EY)+(1-t)2·Var(Y) =

                       = t2·Var(X)-2(EX·EY-EX·EY-EY·EX+EX·EY)+(1-t)2·Var(Y) =

                       = t2·Var(X)-0+(1-t)2·Var(Y) = t2·Var(X)+(1-t)2·Var(Y)
lub

Var(tX+(1-t)Y) = E(tX+(1-t)Y)2-(E(tX+(1-t)Y))2 =

                       = E(t2X2+2tX(1-t)Y+(1-t)2Y2)-(E(tX)+E((1-t)Y))2 =

                       = E(t2X2)+E(2t(1-t)XY)+E((1-t)2Y2)-(t·EX+(1-t)EY)2 =

                       = t2·EX2+2t(1-t)EXY+(1-t)2EY2-t2·(EX)2-2t(1-t)EX·EY-(1-t)2(EY)2 =

                       = (t2·EX2-t2·(EX)2)+2t(1-t)(EXY-EX·EY)+((1-t)2EY2-(1-t)2(EY)2) =

                       = t2·(EX2-(EX)2)+2t(1-t)(EX·EY-EX·EY)+(1-t)2(EY2-(EY)2) =

                       = t2·Var(X)-0+(1-t)2·Var(Y) = t2·Var(X)+(1-t)2·Var(Y)

Skoro Var(X) = Var(Y), to przyjmijmy oznaczenie: c = Var(X) = Var(Y). Niech f(t) = Var(tX+(1-t)Y). Zachodzi f(t) = t2·Var(X)+(1-t)2·Var(Y) = t2·c+(1-t)2·c = (t2+(1-t)2)c = (t2+1-2t+t2)c = (2t2-2t+1)c. Trójmian kwadratowy występujący we wzorze funkcji f osiąga najmniejszą wartość w t=½, a zatem wyrażenie Var(tX+(1-t)Y) osiąga najmniejszą wartość dla t=½.

Zad. 3. Rozważmy zmienną losową X taką, że P(X=a) = P(X=c) = 1/8, P(X=b) = 3/4, przy czym a<b<c lub c<b<a, jednak b = a+c/2. Wówczas

[tex]EX=a\cdot P(X=a)+b\cdot P(X=b)+c\cdot P(X=c)=[/tex]

[tex]=a\cdot\frac{1}{8}+b\cdot\frac{3}{4}+c\cdot\frac{1}{8}=a\cdot\frac{1}{8}+\frac{a+c}{2}\cdot\frac{3}{4}+c\cdot\frac{1}{8}=\frac{a}{8}+\frac{3a+3c}{8}+\frac{c}{8}=\frac{4a+4b}{8}=\frac{a+b}{2},[/tex]

[tex]Var(X)=(a-EX)^2\cdot P(X=a)+(b-EX)^2\cdot P(X=b)+[/tex]

[tex]+(c-EX)^2\cdot P(X=c)=\left(a-\frac{a+c}{2}\right)^2\cdot\frac{1}{8}+\left(b-\frac{a+c}{2}\right)^2\cdot\frac{3}{4}+\left(c-\frac{a+c}{2}\right)^2\cdot\frac{1}{8}=[/tex]

[tex]=\left(a-\frac{a+c}{2}\right)^2\cdot\frac{1}{8}+\left(\frac{a+c}{2}-\frac{a+c}{2}\right)^2\cdot\frac{3}{4}+\left(c-\frac{a+c}{2}\right)^2\cdot\frac{1}{8}=[/tex]

[tex]=\left(\frac{a-c}{2}\right)^2\cdot\frac{1}{2}+0+\left(\frac{c-a}{2}\right)^2\cdot\frac{1}{2}=\left(\frac{a-c}{2}\right)^2\cdot\frac{1}{4},[/tex]

[tex]\sqrt{Var(X)}=\sqrt{\left(\frac{a-c}{2}\right)^2\cdot\frac{1}{4}}=\frac{|a-c|}{2}\cdot\frac{1}{2}=\frac{|a-c|}{4}.[/tex]

 

Powrót na górę strony