W miniwykładzie z października mówiliśmy m.in. o medianie zestawu danych. Zdefiniowaliśmy ją jako wartość środkową (lub średnią dwóch wartości środkowych przy parzystej liczby danych) po uporządkowaniu zestawu w sposób niemalejący. Przypomnijmy sobie to pojęcie na przykładzie.
Przykład 1. W noworocznych zawodach sportowych w półfinale biegu na 100 metrów wzięło udział 16 uczniów klasy IV. Odbyły się dwa biegi po ośmiu zawodników. Uzyskali oni następujące czasy (w sekundach): 44; 48; 31; 30; 38; 65; 34; 55; 44; 31; 48; 55; 39; 44; 34; 29. Do finału miało przejść ośmiu najlepszych. Kto zatem dostał się do finału?
Rozwiązanie 1. Wystarczy uporządkować wyniki zawodników w porządku niemalejącym i sprawdzić, które osoby uzyskały najlepszych osiem rezultatów. Po uporządkowaniu czasy wyglądają następująco: 29; 30; 31; 31; 34; 34; 38; 39; 44; 44; 44; 48; 48; 55; 55; 65. Widzimy, że do finału zakwalifikowali się zawodnicy z czasami wynoszącymi co najwyżej 39 sekund.
Rozwiązanie 2. Ponieważ do finału kwalifikuje się połowa zawodników, będą to ci, którzy uzyskali czasy co najwyżej takie, jak mediana zestawu wyników. Ponieważ mamy 16 czasów, mediana jest średnią arytmetyczną ósmego i dziewiątego wyniku, a więc wynosi (39+44)/2 = 41,5 s. Czasy zawodników, których wyłoniliśmy jako finalistów w poprzednim sposobie rozwiązania, rzeczywiście nie przekraczają 41,5 s.
Zamiast mówić o medianie jako o wartości środkowej w zestawie obserwacji, można powiedzieć, że jest to taka liczbą, że połowa obserwacji jest od niej niewiększa (czyli mniejsza lub równa) i jednocześnie co najmniej połowa jest od niej niemniejsza (czyli większa lub równa). Musimy przy tym pamiętać, że ową "połowę obserwacji" bierzemy z dokładnością do części całkowitej. Zastosujmy to określenie w poniższym przykładzie.
Przykład 2. Mamy pięć obserwacji: 7, 2, 3, 8 i 9. Jaka jest mediana tego zestawu?
Rozwiązanie. Po uporządkowaniu danych dostajemy ciąg 2, 3, 7, 8, 9. Mediana wyznaczona wg "starej definicji" jest równa trzeciej obserwacji, czyli wynosi 7. Jednocześnie połowa z pięciu obserwacji to... dwie i pół obserwacji. Jeśli jednak zaokrąglimy tę liczbę, otrzymamy 3. I rzeczywiście możemy powiedzieć, że trzy obserwacje: 2, 3 i 7 są niewiększe od mediany i jednocześnie trzy obserwacje: 7, 8 i 9 są niemniejsze od mediany.
Oprócz mediany, czyli liczby, która dzieli zbiór uporządkowanych danych na pół, można także rozważać inne podziały, np. na 4 lub 100 części. Szczególnie ten pierwszy jest często stosowany w praktyce. Wyznacza się taką liczbę, że ¼ spośród obserwacji jest od niej niewiększa i równocześnie ¾ spośród obserwacji jest od niej niemniejszych. Liczbę tę nazywamy pierwszym kwartylem. Analogicznie trzeci kwartyl to taka liczba, że ¾ spośród obserwacji jest od niej niewiększych i równocześnie ¼ spośród obserwacji jest od niej niemniejsza.
Czym zatem byłby brakujący drugi kwartyl? Uważny czytelnik z pewnością już dostrzegł, że warunek, aby 2/4 (czyli połowa) obserwacji była niewiększa i równocześnie 2/4 (czyli połowa) niemniejsza od danej liczby, spełnia właśnie mediana.
Aby lepiej zrozumieć, czym są kwartyle, wróćmy do przykładu z biegaczami.
Przykład 3. Ile wynosi pierwszy, a ile trzeci kwartyl zestawu czasów zawodników w półfinale biegu noworocznego na 100 m?
Rozwiązanie. Ponieważ w półfinale startowało 16 zawodników, ¼ spośród nich stanowi czterech zawodników, a ¾ to 12 osób. Wobec tego pierwszy kwartyl zestawu wyników uzyskanych przez biegaczy to taki czas, że czterech biegaczy przybyło na metę do tego momentu (włącznie) a dwunastu od tego momentu (włącznie). Czwarty na mecie zawodnik dotarł tam po 31 s, a piąty - po 34 s, zatem pierwszy kwartyl to (zgodnie z podaną definicją) dowolna liczba z przedziału (31, 34), np. 32.
Trzeci kwartyl zestawu wyników uzyskanych przez biegaczy to taki czas,
że dwunastu biegaczy przybyło na metę do tego momentu (włącznie) a czterech od tego momentu (włącznie). Jednak, że dwunasty i trzynasty zawodnik osiągnęli ten sam czas: 48 s. Sprawdźmy więc, czy liczba 48 spełnia warunki definicji trzeciego kwartyla. Istotnie, dwunastu zawodników przybiegło na metę w czasie nieprzekraczającym 48 s (a nawet przybiegło ich trzynastu) a jednocześnie czterech zawodników przybiegło na metę w czasie równym co najmniej 48 s (a dokładniej przybiegło ich w tym czasie pięciu). Wobec tego trzecim kwartylem jest liczba 48.
Różnicę q3 - q1 nazywa się rozstępem międzykwartylowym. Podobnie jak wariancja i odchylenie standardowe wielkość ta może być traktowana jako miara rozrzutu danych (więcej o tym napiszemy w kolejnych odcinkach Ligi).
Wzory do obliczenia kwartyli
Jak widać przy obliczaniu kwartyli na podstawie przytoczonej definicji możemy się natknąć na różne problemy. Jednym z nich jest niejednoznaczność uzyskanego wyniku - w przykładzie 3 można zaproponować różne wartości pierwszego kwartyla. Aby uniknąć takiej niejednoznaczności, statystycy zaproponowali różne wzory służące do jednoznacznego wskazywania wartości kwartyli w podobnych wypadkach. Rozmaite programy komputerowe do obliczeń statystycznych używają różnych wzorów do obliczania kwartyli. Zawsze jednak wyliczona z nich liczba musi spełniać warunki definicji. Poniżej przedstawiamy takie wzory, które są najbardziej polecane do zastosowań praktycznych w wielu dziedzinach nauki. Cała procedura na pierwszy rzut oka może wydać się nieco skomplikowana, ale po chwili namysłu nie powinna sprawiać trudności.
Zaczynamy tradycyjnie od ustawienia danych w porządku niemalejącym. Oznaczmy obserwacje po takim uporządkowaniu przez x1, x2, ..., xn, a pierwszy i trzeci kwartyl przez q1 i q3.
W drugim kroku wyznaczamy liczby p1, p2, ..., pn, gdzie [tex]p_k=\frac{k-1}{n-1}.[/tex]
Następnie szukamy takiego k, żeby pk≤ ¼ < pk+1. Gdy je znajdziemy, obliczymy pierwszy kwartyl jako
[tex]q_1=\left(x_{k+1}-x_{k}\right)\cdot \left(\frac{n-1}{4}-k+1\right)+x_{k}.[/tex]
Zamiana liczby ¼ na ¾ prowadzi do obliczenia trzeciego kwartyla. Jeśli zatem pk ≤ ¾ < pk+1 dla pewnego k, to
[tex]q_3=\left(x_{k+1}-x_{k}\right)\cdot \left(\frac{3(n-1)}{4}-k+1 \right)+x_{k}.[/tex]
Przykład 4. Obliczmy powyższą metodą pierwszy i trzeci kwartyl dla czasów uzyskanych w półfinale biegu noworocznego na 100 m.
Rozwiązanie. Dla ułatwienia rachunków wszystkie dane umieszczono w poniższej tabeli. W pierwszym wierszu są kolejne liczby naturalne od 1 do 16. W drugim wierszu mamy liczby p1, p2, ..., p16.W trzecim wierszu podano obserwacje w porządku rosnącym. Warto zwrócić uwagę na to, jak potraktowano wartości występujące więcej niż jeden raz. Liczby p1, p2, ..., p16 zaokrąglono do trzech miejsc po przecinku, co jest zupełnie wystarczające do obliczenia kwartyli.
k | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 |
pk | 0 | 0,067 | 0,133 | 0,2 | 0,267 | 0,333 | 0,4 | 0,467 | 0,533 | 0,6 | 0,667 | 0,733 | 0,8 | 0,867 | 0,933 | 1 |
xk | 29 | 30 | 31 | 31 | 34 | 34 | 38 | 39 | 44 | 44 | 44 | 48 | 48 | 55 | 55 | 65 |
Łatwo widzimy, że p4 = 0,2 < 1/4 < 0,267 = p5. W takim razie obliczając pierwszy kwartyl, należy do wzoru na q1 wstawić k=4. Otrzymujemy:
[tex]q_1=\left(x_{5}-x_{4}\right)\cdot \left(\frac{16-1}{4}-4+1\right)+x_{4}=[/tex]
[tex]=(34-31)\cdot \left(\frac{16-1}{4}-4+1\right)+31=33,25.[/tex]
Ponadto widzimy, że p12 = 0,733 < 3/4 < 0,8 = p13. Zatem obliczając trzeci kwartyl, do wzoru na q3 wstawiamy k=12. Mamy:
[tex]q_3=\left(x_{13}-x_{12}\right)\cdot \left(\frac{3(16-1)}{4}-12+1\right)+x_{12}=[/tex]
[tex]=(48-48)\cdot\left(\frac{3(16-1)}{4}-12+1\right)+48=48.[/tex]
Zauważmy, że czasy czterech zawodników są mniejsze od q1 a czasy dwunastu większe od q1 (zatem liczba q1 spełnia definicję pierwszego kwartyla), natomiast q3 = 48, co pokrywa się z wartością trzeciego kwartyla obliczoną w przykładzie 3.
Pięć liczb charakteryzujących zestaw danych, tj. (w porządku rosnącym): minimum, pierwszy kwartyl, mediana, trzeci kwartyl i maksimum jest nazywanych piątką Tukeya - od nazwiska słynnego amerykańskiego matematyka Johna Tukeya (1915-2000). Piątka Tukeya okaże się przydatna przy procedurach statystycznych, które poznamy w kolejnych odsłonach Ligi.
[koniec wykładu dla gimnazjalistów]
Skąd się wzięły wzory na kwartyle? Metoda łamanej
Dociekliwy czytelnik na pewno zastanawia się, skąd wzięły się podane wczęśniej wzory na kwartyle. Ich uzasadnienie jest bardzo proste. Na wykresie należy zaznaczyć punkty (p1 , x1), (p2 , x2), ..., (pn , xn) i połączyć je łamaną. (Należy zwrócić uwagę na to, że drugie współrzędne punktów to x1, x2, ..., xn - choć na ogół literą x oznacza się pierwszą współrzędną punktu). Łamana tworzy wykres pewnej funkcji. Wartość tej funkcji w punkcie ¼ to pierwszy kwartyl a wartość tej funkcji w punkcie ¾ to trzeci kwartyl. Na poniższym wykresie zaznaczono właśnie taką łamaną dla danych o noworocznym biegu na 100 m.
Widzimy, że do obliczenia kwartyli nie musimy wyznaczać wzoru funkcji, której wykresem jest przedstawiona łamana. Wystarczy, że wyznaczymy równania tych dwóch prostych, które znajdują się nad punktami ¼ i ¾ na osi X. Na wykresie zaznaczono te dwie proste linią czerwoną i linią zieloną.
Aby wyznaczyć pierwszy kwartyl, sprawdzamy, między którymi kolejnymi współczynnikami pk i pk+1 znajduje się liczba ¼ (czyli z formalnego punktu widzenia poszukujemy liczby k, dla której pk ≤ ¼ < pk+1). Następnie wyznaczamy wzór funkcji liniowej, której wykres przechodzi przez punkty o współrzędnych (pk , xk) i (pk+1 , xk+1) i za pierwszy kwartyl przyjmujemy wartość tej funkcji w punkcie ¼.
Przy wyznaczaniu trzeciego kwartyla sprawdzamy, pomiędzy którymi współczynnikami pk i pk+1 znajduje się liczba ¾ (a więc formalnie szukamy takiego k, że pk ≤ ¾ < pk+1). Następnie wyznaczamy wzór funkcji liniowej, której wykres przechodzi przez punkty o współrzędnych (pk , xk) i (pk+1 , xk+1) i za pierwszy kwartyl przyjmujemy wartość tej funkcji w punkcie ¾.
Warto zauważyć, że jeśli dla pewnego k zachodzi pk = ¼, to mamy q1=xk, podobnie jeśli pk= ¾ dla pewnego k, to q3=xk. Wstawiając do nierówności w miejsce ¼ lub ¾ liczbę ½, w analogiczny sposób możemy wyznaczyć medianę.
Przykład 5. Dla danych dotyczących biegu na 100 m liczba ¼ znajduje się pomiędzy liczbami p4 i p5, a zatem prosta służąca do wyznaczenia pierwszego kwartyla (bordowa prosta na powyższym wykresie) to prosta przechodząca przez punkty (p4 , x4) i (p5 , x5) czyli przez punkty o współrzędnych (3/15 , 31) i (4/15 , 34). Prosta taka ma równanie: y = 45x + 22. Podstawiając x = ¼, otrzymujemy 45 · ¼ + 22= 33,25.
Liczba ¾ znajduje się pomiędzy liczbami p12 i p13, wobec czego prosta służąca do wyznaczenia trzeciego kwartyla (na wykresie na zielono) to prosta przechodząca przez punkty (p12 , x12) i (p13 , x13) czyli przez punkty o współrzędnych (11/15 , 48) i (12/15 , 48), jest to więc prosta o równaniu y = 48. Dla x = ¾ otrzymujemy y = 48.
Centyle
W podobny sposób jak medianę (wartość wypadającą w połowie), kwartyle (wartości wypadające w ¼ i ¾ obserwacji) możemy wyznaczać inne liczby (zwane ogólnie kwantylami) takie, że ustalona część obserwacji jest niewiększa od nich, a pozostała część obserwacji jest od nich niemniejsza. Jeśli wyrazimy te liczby w procentach liczby obserwacji, to nazywamy je centylami i (podobnie jak dla kwartyli) możemy wyznaczać wtedy np. pierwszy centyl, trzeci centyl, 37. centyl.
Najczęściej z centylami spotykamy się przy ocenianiu rozwoju fizycznego noworodków. Do oceny prawidłowości przyrostu masy ciała i wzrostu dziecka lekarze używają tzw. siatek centylowych. Poniżej przedstawiamy taką siatkę dla wagi chłopców w okresie od 1 do 12 miesiąca po urodzeniu. Zaznaczono na niej 3., 10., 25., 50., 75., 90. i 97. centyl. Pamiętajmy, że 25. centyl to pierwszy kwartyl, 50. centyl to mediana zaś 75. centyl to trzeci kwartyl.
Jeśli półroczny chłopiec waży 6,5 kg, to z siatki tej można odczytać, że jego masa jest mniejsza od 10. centyla. Oznacza to, że mniej niż 10% chłopców w jego wieku waży mniej niż on lub równoważnie: że ponad 90% chłopców w jego wieku waży więcej niż on.
Zad. 1. (2 punkty) Oblicz piątkę Tukeya dla następujących zestawów danych:
a) 15; 8; 13; 9; 16; 8; 7; 7; 11; 8; 11; 13; 8; 10; 10; 10; 15; 8; 13; 8; 6; 8; 11; 11; 11;
b) 0,5; 26,6; 23,3; 13,0; 7,8; 7,7; 0,7; 5,9; 32,3; 5,9; 48,1; 28,7; 13,1; 6,9; 2,4; 0,7; 53,7; 2,7; 61,7; 12,3; 5,2; 0,5; 3,1; 3,2; 2,2.
Zad. 2. (1 punkt) Jaka część wszystkich obserwacji spełnia warunek: q1 ≤ x ≤ q3? Jaka warunek q1 ≤ x ≤ q2? A jaka warunek q2 ≤ x ≤ q3, gdzie q2 oznacza medianę zbioru danych? W rozwiązaniu nie korzystaj ze wzorów na kwartyle, a jedynie z definicji kwartyli.
Zad. 1. (1 punkt) Wykonaj zadanie 1 dla gimnazjalistów.
Zad. 2. (1 punkt) Udowodnij, że metoda łamanej prowadzi do wzorów na pierwszy i trzeci kwartyl przedstawionych w wykładzie.
Zad. 3. (1 punkt) Pokaż, że wartość dla x = ½ funkcji, której dotyczy metoda łamanej, jest równa medianie zdefiniowanej tak jak w wykładzie z października.
Z przyjemnością informuję, że wszystkie osoby, które nadesłały rozwiązania zadań ze styczniowego etapu Ligi z Analizy danych, zdobyły 3 punkty. Czołówka klasyfikacji generalnej pozostała bez zmian: Aleksandra Domagała - I miejsce, Joanna Lisiowska - II miejsce, Mieszko Baszczak - III miejsce.
Wszystkie nadesłane rozwiązania zadań okazały się w całości poprawne, a zatem ich autorzy otrzymują 3 punkty. Tym samym czołówka klasyfikacji generalnej nie ulega zmianie: Tomasz Stępniak - I miejsce, Daria Bumażnik - II miejsce, Krzysztof Danielak - III miejsce.
Zad. 1. Obliczenia zilustrujemy tabelami analogicznymi do tych w miniwykładzie.
a)
k | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
pk | 0 | 0,042 | 0,083 | 0,125 | 0,167 | 0,208 | 0,25 | 0,292 | 0,333 | 0,375 | 0,417 | 0,458 | 0,5 |
xk | 6 | 7 | 7 | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 9 | 10 | 10 |
k | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | - |
pk | 0,542 | 0,583 | 0,625 | 0,667 | 0,708 | 0,75 | 0,792 | 0,833 | 0,875 | 0,917 | 0,958 | 1 | - |
xk | 10 | 11 | 11 | 11 | 11 | 11 | 13 | 13 | 13 | 15 | 15 | 16 | - |
Minimum: 6
Pierwszy kwartyl: p7 = 6/24 = ¼ < p8, a zatem
[tex]q_1=(x_8-x_7)\cdot\left(\frac{25-1}{4}-7+1\right)+x_7=(8-8)\cdot\left(\frac{25-1}{4}-7+1\right)+8=8[/tex]
Mediana: x13 = 10
Trzeci kwartyl: p19 = 18/24 = ¾ < p20, a zatem
[tex]q_3=(x_{20}-x_{19})\cdot\left(\frac{3(25-1)}{4}-19+1\right)+x_{19}=[/tex]
[tex]=(13-11)\cdot\left(\frac{3(25-1)}{4}-19+1\right)+11=11[/tex]
Maksimum: 16
Piątka Tukeya: (6; 8; 10; 11; 16)
b)
k | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
pk | 0 | 0,042 | 0,083 | 0,125 | 0,167 | 0,208 | 0,25 | 0,292 | 0,333 | 0,375 | 0,417 | 0,458 | 0,5 |
xk | 0,5 | 0,5 | 0,7 | 0,7 | 2,2 | 2,4 | 2,7 | 3,1 | 3,2 | 5,2 | 5,9 | 5,9 | 6,9 |
k | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | - |
pk | 0,542 | 0,583 | 0,625 | 0,667 | 0,708 | 0,75 | 0,792 | 0,833 | 0,875 | 0,917 | 0,958 | 1 | - |
xk | 7,7 | 7,8 | 12,3 | 13 | 13,1 | 23,3 | 26,6 | 28,7 | 32,3 | 48,1 | 53,7 | 61,7 | - |
Minimum: 0,5
Pierwszy kwartyl: p7 = 6/24 = ¼ < p8, a zatem
[tex]q_1=(x_8-x_7)\cdot\left(\frac{25-1}{4}-7+1\right)+x_7=[/tex]
[tex]=(3,1-2,7)\cdot\left(\frac{25-1}{4}-7+1\right)+2,7=2,7[/tex]
Mediana: x13 =6,9
Trzeci kwartyl: p19 = 18/24 = ¾ < p20, a zatem
[tex]q_3=(x_{20}-x_{19})\cdot\left(\frac{3(25-1)}{4}-19+1\right)+x_{19}=[/tex]
[tex]=(26,6-23,3)\cdot\left(\frac{3(25-1)}{4}-19+1\right)+23,3=23,3[/tex]
Maksimum: 61,7
Piątka Tukeya: (0,5; 2,7; 6,9; 23,3; 61,7)
Zad. 2. Zgodnie z definicją kwartyli warunek q1 ≤ x ≤ q2 jest spełniony przez ¼ wszystkich danych (zaokrąglając w razie konieczności w górę do liczby całkowitej). Warunek q2 ≤ x ≤ q3 jest również spełniony przez ¼ wszystkich danych (zaokrąglając w razie konieczności w górę do liczby całkowitej). Warunek q1 ≤ x ≤ q3 jest spełniony przez połowę wszystkich danych (zaokrąglając w razie konieczności w górę do liczby całkowitej).
Zad. 1. Odpowiedź jak w zadaniu 1 dla gimnazjalistów. Przy obliczaniu pierwszego i trzeciego kwartyla można także zauważyć, że p7 = 6/24 = ¼ a p19 = 18/24 = ¾. Wobec tego zbioru danych złożonego z 25 elementów mamy q1 = x7 i q3 = x19.
Zad. 2. Niech k będzie taką liczbą ze zbioru {1, 2, ..., n}, że xk ≤ ¼ < xk+1. Niech prosta przechodząca przez punkty (pk, xk) i (pk+1, xk+1) będzie zadana równaniem y = ax + b. Skorota prosta przechodzi przez dwa podane punkty, to ich współrzędne spełniają równanie funkcji. To prowadzi do układu dwóch równań z niewiadomymi a i b:
[tex]x_k=ap_k+b, \qquad x_{k+1}=ap_{k+1}+b.[/tex]
Rozwiązując ten układ równań, otrzymujemy:
[tex]a=\frac{x_{k+1}-x_k}{p_{k+1}-p_k}, \qquad b=-\frac{x_{k+1}-x_k}{p_{k+1}-p_k}\cdot p_k+x_k.[/tex]
Wobec tego równanie prostej przechodzącej przez punkty (pk, xk) i (pk+1, xk+1) ma postać:
[tex]y=\frac{x_{k+1}-x_k}{p_{k+1}-p_k}\cdot x-\frac{x_{k+1}-x_k}{p_{k+1}-p_k}\cdot p_k+x_k[/tex]
czyli
[tex]y=\frac{x_{k+1}-x_k}{p_{k+1}-p_k}\cdot (x-p_k)+x_k.[/tex]
Aby obliczyć pierwszy kwartyl, wstawiamy do powyższego równania x = ¼, pk = k-1/n-1 i pk+1 = (k-1)+1/(n-1)+1 = k/n.
Zmieniając w powyższym rachunku liczbę ¼ na liczbę ¾, otrzymujemy wzór na trzeci kwartyl.
Zad. 3. Należy rozważyć dwa przypadki:
a) n nieparzyste; n = 2j+1 dla pewnej liczby naturalnej j
Wówczas
[tex]p_{j+1}=\frac{(j+1)-1}{n}=\frac{(j+1)-1}{(2j+1)-1}=\frac{j}{2j}=\frac{1}{2}.[/tex]
W takim razie pj+1 ≤ ½ < pj+2. Prosta przechodząca przez punkty (pj+1, xj+1) i (pj+2, xk+2) jest zadana równaniem:
[tex]y=\frac{x_{j+2}-x_{j+1}}{p_{j+2}-p_{j+1}}\cdot (x-p_{j+1})+x_{j+1}.[/tex]
Wstawiając do tego równania x = ½ i pamiętając, że pj+1 = ½, otrzymujemy y = xj+1 czyli środkową wartość spośród x1, x2, ..., x2j+1.
b) n parzyste; n = 2j dla pewnej dodatniej liczby naturalnej j
Wówczas
[tex]p_{j}=\frac{j-1}{n}=\frac{j-1}{2j-1}<\frac{j-1}{2j-2}=\frac{j-1}{2(j-1)}=\frac{1}{2}[/tex]
i równocześnie
[tex]p_{j+1}=\frac{(j+1)-1}{n}=\frac{(j+1)-1}{2j-1}=\frac{j}{2j-1}>\frac{j}{2j}=\frac{1}{2}.[/tex]
Wobec tego pj < ½ < pj+1. Prosta przechodząca przez punkty (pj, xj) i (pj+1, xk+1) jest zadana równaniem:
[tex]y=\frac{x_{j+1}-x_j}{p_{j+1}-p_j}\cdot (x-p_j)+x_j.[/tex]
Wstawiając do tego równania x = ½ , pj = j/2j-1 i pj+1 = j+1/2j-1, otrzymujemy y = (xj+1+xj)/2 czyli średnią arytmetyczną dwóch środkowych wartość spośród x1, x2, ..., x2j+1.