UFN_OP.pdf
(
117 KB
)
Pobierz
EKO.13 A.Lenarcik, Z.Piasta
Ćwiczenie: statystyczna interpretacja poziomu ufności
U1
Dwadzieścia osób wykonało ten sam eksperyment polegający na ocenie średniej
m
pewnej cechy w
populacji na podstawie próbki pięciu pomiarów. Możemy tutaj sobie wyobrażać, że każda z osób losowała
ze zwracaniem pięć piłeczek z niebieskiego pudełka. W tabeli mamy wyniki uzyskane przez każdą osobę.
os1 os2 os3 os4 os5 os6 os7 os8 os9 os10 os11 os12 os13 os14 os15 os16 os17 os18 os19 os20
170 177 176 172 174 178 185 184 166 170 173 178 176 166 163 183 168 167 174 177
182 187 165 177 180 175 170 176 185 179 186 171 167 173 175 180 185 164 175 177
170 178 188 178 161 176 176 191 170 200 176 169 172 171 166 169 164 174 176 180
183 179 183 178 168 176 166 178 180 175 180 182 172 180 173 177 187 175 188 163
173 177 170 170 182 177 172 179 176 170 177 167 168 179 170 187 184 170 176 181
(a) Dla każdej z osób należy wyznaczyć przedział ufności dla średniej populacji
m
na poziomie ufności
0,90. Wszystkie dwadzieścia przedziałów rysujemy jeden nad drugim i porównujemy z rzeczywistą średnią,
która tutaj jest ujawniona w celach dydaktycznych. W praktyce badawczej nie mamy takiej informacji (bo
niepotrzebne byłoby badanie). Średnia populacji wynosi
m
= 175,5.
(b) Obliczenie przedziału ufności jest zdarzeniem losowym, gdyż przedział zależy od przypadkowych da-
nych. Również losowe jest zdarzenie polegające na tym, że przedział obejmie badaną średnią populacji
(możemy to traktować jak sukces w schemacie Bernoulli‘ego). Przedział jest tak skonstruowany, aby praw-
dopodobieństwo teoretyczne, obejmowania nieznanego parametru, było równe przyjętemu poziomowi uf-
ności. Prawdopodobieństwo to uzewnętrznia się, gdy eksperyment powtórzony jest bardzo dużo razy. W
dwudziestu powtórzeniach spodziewamy się dwóch ”nieudanych” przedziałów, ale może to być także inna
liczba. Korzystając ze schematu Bernoulli‘ego należy obliczyć prawdopodobieństwo uzyskania wyniku ta-
kiego jak w punkcie (a).
(c) W praktyce, gdy dysponujemy większą liczbą danych, możemy dokładniej oszacować nieznany para-
metr. Gdyby rzeczywiście dwadzieścia osób dokonało oceny tej samej średniej
m,
to najkorzystniej byłoby
połączyć te dane w celu uzyskania dokładniejszego oszacowania. W punkcie tym należy zbudować prze-
działy ufności dla średniej populacji
m
na podstawie wszystkich danych. Przyjmij poziomy ufności 90%,
95%, 98% i 99%. Co można zaobserwować?
Szkic rozwiązania
Celem ćwiczenia jest uzmysłowienie sobie, że przedział ufno-
ści czasami może nie obejmować wartości szacowanego para-
metru. Jest to zjawisko nieporządane, ale nie może być cał-
kowicie wyeliminowane. Częstość występowania poprawnych
oszacowań odpowiada przyjętemu poziomowi ufności i zgod-
ność ta ma miejsce przy dużej liczbie powtórzeń.
ad. (a) W punkcie tym wyznaczamy przedziały ufności dla
wszystkich dwudziestu osób stosując drugi wariant oszaco-
wania średniej. Następnie sporządzamy rysunek ilustrujący
położenie przedziałów względem rzeczywistej średniej. Np.
dla drugiej osoby otrzymujemy przedział 175,6
< m <
183,6,
który jest minimalnie nieudany. Wszystkich przedziałów nie-
obejmujących średniej jest tutaj 5; jest to zjawisko dość rzad-
kie – zajmiemy się tym w kolejnym punkcie.
ad. (b) Traktujemy teraz obliczanie dziesięciu przedziałów
ufności jak serię dziesięciu doświadczeń w schemacie Berno-
ulli’ego. Sukcesem jest uzyskanie poprawnego oszacowania.
Prawdopodobieństwo sukcesu jest zatem równe przyjętemu
poziomowi ufności 0,9. W naszym przypadku mamy
k
= 15
sukcesów w
n
= 20 powtórzeniach. Prawdopodobieństwo ta-
kiego rezultatu wynosi
20
0,9
15
0,1
5
≈
0, 032.
15
EKO.13 A.Lenarcik, Z.Piasta
U2
ad. (c) Średnia wszystkich wartości wynosi
x
= 175,59 z odchyleniem
s
≈
6,9153. Niestety, obliczenia tego
¯
nie udało się wykonać na moim kalkulatorze statystycznym, gdyż dopuszcza on tylko 80 danych. Można
to policzyć w EXCEL-u, ale mamy też możliwość posłużenia się wzorami, króre pozwala obliczyć wspólną
średnią i wariancję na podstawie wyników z
l
grup danych:
l
l
x
=
¯
j=1
x
j
w
j
,
¯
s
=
2
j=1
s
2
+ (¯
j
−
x
)
2
w
j
.
x
¯
j
Waga
w
j
=
n
j
/n
odzwierciedla wkład
j-tej
grupy w dane. Tutaj mamy
l
= 20 grup danych pochodzących
od poszczególnych osób, dla których mamy obliczoną indywidualną średnią
x
j
i odchylenie standardowe
¯
1
s
j
; wagi są takie same
w
j
=
20
(j = 1,
. . . ,
20). Obliczenia możemy przeprowadzić w tabeli
s
2
w
j
x
j
w
j
(¯
j
−
x
)
2
s
2
+ (¯
j
−
x
)
2
¯
x
¯
x
¯
j
j
33.04 0.05
8.78
0.0001
33.0401
14.24 0.05
8.98
16.0801
30.3201
69.84 0.05
8.82
0.6561
70.4961
11.20 0.05
8.75
0.3481
11.5481
60.00 0.05
8.65
6.7081
66.7081
1.04 0.05
8.82
0.6561
1.6961
41.76 0.05
8.69
3.2041
44.9641
29.04 0.05
9.08
36.1201
65.1601
46.24 0.05
8.77
0.0361
46.2761
123.76 0.05
8.94
10.3041
134.0641
19.44 0.05
8.92
7.8961
27.3361
32.24 0.05
8.67
4.7961
37.0361
10.40 0.05
8.55
21.0681
31.4681
26.96 0.05
8.69
3.2041
30.1641
19.44 0.05
8.47
38.3161
57.7561
36.96 0.05
8.96
13.0321
49.9921
92.24 0.05
8.88
4.0401
96.2801
17.20 0.05
8.50
31.2481
48.4481
26.56 0.05
8.89
4.8841
31.4441
42.24 0.05
8.78
0.0001
42.2401
— 1.00 175.59
—
—
√
Skąd
x
= 175,59 oraz
s
= 47,8219
≈
6,915.
¯
Dla kolejnych poziomów ufności otrzymujemy przedziały:
90%:
95%:
98%:
99%:
174,44
174,21
173,94
173,76
< m <
176,74,
< m <
176,97,
< m <
177,23,
< m <
177,42,
j
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Σ
x
j
¯
175.6
179.6
176.4
175.0
173.0
176.4
173.8
181.6
175.4
178.8
178.4
173.4
171.0
173.8
169.4
179.2
177.6
170.0
177.8
175.6
—
(s
2
+ (¯
j
−
x
)
2
)w
j
x
¯
j
1.6520
1.5160
3.5248
0.5774
3.3354
0.0848
2.2482
3.2580
2.3138
6.7032
1.3668
1.8518
1.5734
1.5082
2.8878
2.4996
4.8140
2.4224
1.5722
2.1120
47.8219
Obserwujemy, że na skutek zwiększenia liczebności (n = 100 zamiast 5), przedziały znacznie się zwęziły
(ile razy?); z drugiej strony widać, że przedziały poszerzają się ze wzrostem poziomu ufności.
Ciekawostka
Załóżmy, że 1000 osób wyznaczyło przedział ufności na poziomie 0,90. Ile spodziewamy się poprawnych
EKO.13 A.Lenarcik, Z.Piasta
oszacowań. Jaki jest zakres zmienności tej liczby?
U3
√
Spodziewamy się
np
= 900 poprawnych oszacowań z odchyleniem standardowym
npq
≈
9,48, czyli mamy
zakres 3σ od 871 do 929. Na powyższym rysunku jest 902 poprawnych oszacowań – zgodność z teorią jest
niemal idealna.
Spójrzmy jeszcze na kolejny rysunek. W każdej z czterech kolumn znajduje się dwieście przedziałów
EKO.13 A.Lenarcik, Z.Piasta
wyznaczonych dla podanych poziomów ufności. Możemy zaobserwować zmianę szerokości przedziałów.
90%
95%
98%
99%
U4
178 popr.
191 popr.
193 popr.
197 popr.
Na dole podana jest liczba poprawnych oszacowań. Proszę jako ćwiczenie wyznaczyć zakresy 3σ dla licz-
by poprawnych oszacowań w dwóch pierwszych kolumnach. W dwóch kolejnych kolumnach nie możemy
stosować techniki zakresu 3σ, gdyż nie jest spełniony wymóg
npq >
4 dla CTG.
Plik z chomika:
sara89o
Inne pliki z tego folderu:
PUD_OP.pdf
(521 KB)
PYTANIA.pdf
(51 KB)
STAT_E3.pdf
(754 KB)
STAT_E4.pdf
(186 KB)
T11.pdf
(50 KB)
Inne foldery tego chomika:
generatory34
kolok
pudelka
ufnosc
Zgłoś jeśli
naruszono regulamin