2014wnioskowaniestatystyczne.pdf

(1399 KB) Pobierz
i
i
i
“StatystykaR” — 2014/10/1 — 10:41 — page i — #1
i
P
RZEMYSŁAW
GRZEGORZEWSKI
M
AREK
GĄGOLEWSKI
K
ONSTANCJA
BOBECKA-WESOŁOWSKA
Wnioskowanie statystyczne
z wykorzystaniem środowiska
R
Warszawa 2014
i
i
i
i
i
i
i
“StatystykaR” — 2014/10/1 — 10:41 — page ii — #2
i
A
Opracowanie w systemie LTEX
Marek Gagolewski
˛
Copyright © 2014 P. Grzegorzewski, M. Gagolewski, K. Bobecka-Wesołowska
˛
Niniejsza ksiazka dystrybuowana jest na licencji
˛˙
Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International.
˙˛
˙
Wszystkie znaki i nazwy firmowe lub towarowe naleza do lub sa zastrzezone przez
˛
˙
ich wła´cicieli i zostały uzyte w niniejszej ksiazce wyłacznie w celach informacyjnych.
s
˛˙
˛
Wydawca: Biuro ds. Projektu „Program Rozwojowy Politechniki Warszawskiej”
ISBN 978-83-937260-1-1
i
i
i
i
i
i
i
“StatystykaR” — 2014/10/1 — 10:41 — page iii — #3
i
Spis treści
Przedmowa
1 Wprowadzenie do j˛ zyka
R
e
1.1. Wprowadzenie . . . . . . . . . . . . .
1.2. Zadania rozwiazane . . . . . . . . . . .
˛
1.3. Zadania do samodzielnego rozwiazania
˛
1.4. Wskazówki i odpowiedzi do zada´ . . .
n
2 Statystyka opisowa
2.1. Wprowadzenie . . . . . . . . . . . . .
2.2. Zadanie rozwiazane . . . . . . . . . . .
˛
2.3. Zadania do samodzielnego rozwiazania
˛
2.4. Wskazówki i odpowiedzi do zada´ . . .
n
v
1
1
20
26
27
29
29
30
51
55
57
57
61
71
74
75
75
76
89
91
93
93
95
110
112
115
115
118
132
134
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
´
3 Rozkłady prawdopodobienstwa i podstawy symulacji
3.1. Wprowadzenie . . . . . . . . . . . . . . . . . . .
3.2. Zadania rozwiazane . . . . . . . . . . . . . . . . .
˛
3.3. Zadania do samodzielnego rozwiazania . . . . . .
˛
3.4. Wskazówki i odpowiedzi do zada´ . . . . . . . . .
n
4 Estymacja punktowa i przedziałowa
4.1. Wprowadzenie . . . . . . . . . . . . .
4.2. Zadania rozwiazane . . . . . . . . . . .
˛
4.3. Zadania do samodzielnego rozwiazania
˛
4.4. Wskazówki i odpowiedzi do zada´ . . .
n
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5 Weryfikacja hipotez: Podstawowe testy parametryczne
5.1. Wprowadzenie . . . . . . . . . . . . . . . . . . . .
5.2. Zadania rozwiazane . . . . . . . . . . . . . . . . . .
˛
5.3. Zadania do samodzielnego rozwiazania . . . . . . .
˛
5.4. Wskazówki i odpowiedzi do zada´ . . . . . . . . . .
n
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6 Weryfikacja hipotez: Podstawowe testy nieparametryczne
6.1. Wprowadzenie . . . . . . . . . . . . . . . . . . . . .
6.2. Zadania rozwiazane . . . . . . . . . . . . . . . . . . .
˛
6.3. Zadania do samodzielnego rozwiazania . . . . . . . .
˛
6.4. Wskazówki i odpowiedzi do zada´ . . . . . . . . . . .
n
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
i
i
i
i
i
i
i
“StatystykaR” — 2014/10/1 — 10:41 — page iv — #4
i
iv
SPIS TREŚCI
7 Testowanie niezale˙ no´ci i analiza regresji
z s
7.1. Wprowadzenie . . . . . . . . . . . . .
7.2. Zadania rozwiazane . . . . . . . . . . .
˛
7.3. Zadania do samodzielnego rozwiazania
˛
7.4. Wskazówki i odpowiedzi do zada´ . . .
n
8 Analiza wariancji
8.1. Wprowadzenie . . . . . . . . . . . . .
8.2. Zadania rozwiazane . . . . . . . . . . .
˛
8.3. Zadania do samodzielnego rozwiazania
˛
8.4. Wskazówki i odpowiedzi do zada´ . . .
n
Bibliografia
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
137
137
139
158
161
163
163
164
173
174
177
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
i
i
i
i
i
i
i
“StatystykaR” — 2014/10/1 — 10:41 — page v — #5
i
Przedmowa
Niniejszy skrypt jest owocem naszych wieloletnich do´wiadcze´ w nauczaniu statystyki
s
n
matematycznej na Wydziale Matematyki i Nauk Informacyjnych Politechniki Warszaw-
˙
˙ c
skiej. Nie nalezy go jednak uwaza´ za kolejny podr˛ cznik statystyki, których niemało,
e
by wspomnie´ [7, 9–11, 16]. Brak w nim typowego dla takiego podr˛ cznika zestawu
c
e
˙
definicji wprowadzanych poj˛ c i analizy ich własno´ci, nie podano tez twierdze´ ani ich
s
n
dowodów. Skrypt ten przypomina bardziej poradnik dedykowany Czytelnikowi, któremu
˙
nieobce sa juz podstawy statystyki matematycznej, ale który równiez chciałby zastoso-
˛ ˙
˙
wa´ poznane metody w praktyce. Tak wi˛ c niniejsza pozycj˛ nalezy postrzega´ wy-
c
e
˛
e
c
łacznie jako uzupełnienie teorii wykładanej podczas tradycyjnego kursu wnioskowania
˛
statystycznego.
˙
Kazdy, kto zetknał si˛ z wnioskowaniem statystycznym w praktyce, wie, jak po-
˛ e
mocnym narz˛ dziem wspomagajacym owe wnioskowanie jest komputer, pozwalajacy
e
˛
˛
˙
przetwarza´ duze zbiory danych, wyr˛ czajacy nas w zmudnych rachunkach i ułatwiajacy
c ˙
e
˛
˛
wykonanie rozmaitych przydatnych wizualizacji. To wła´nie wspomagana komputerowo
s
analiza danych i statystyka odgrywaja istotna rol˛ w szeroko rozumianej matematyce
˛
˛ e
przemysłowej, obejmujacej nie tylko tematyk˛ techniczna, ale i zagadnienia z obszaru
˛
e
˛
˙
biologii, medycyny, nauk społecznych, inzynierii finansowej itd.
Aby móc w pełni skorzysta´ z dobrodziejstw, jakie oferuje komputer w zakresie
c
wsparcia wnioskowania statystycznego i analizy danych, konieczne jest odpowiednie
˙
oprogramowanie. Praktycy korzystaja z róznych pakietów statystycznych, poczawszy od
˛
˛
specjalistycznych programów, ukierunkowanych na waskie zastosowania, a sko´ czyw-
˛
n
˙
szy na pakietach oferujacych bogate zestawy róznorodnych narz˛ dzi i procedur, które
˛
e
maja potencjalnie zaspokoi´ potrzeby szerokiego grona analityków.
˛
c
W ostatnich latach coraz bardziej popularnym narz˛ dziem staje si˛ srodowisko
R.
e
˙
Mozna wskaza´ wiele zródeł sukcesu tego oprogramowania. Po pierwsze,
R
jest do-
c
´
´
st˛ pny na wszystkich platformach i systemach operacyjnych. Po wtóre, jest to srodo-
e
˙
wisko otwarte, które dostarczajac gotowe funkcje pozwala jednocze´nie uzytkownikowi
˛
s
˙
tworzy´ własne procedury. Dzi˛ ki temu rózne repozytoria (np. CRAN) sa nieustannie
c
e
˛
˙
wzbogacane o kolejne biblioteki funkcji pisane przez uzytkowników
R.
Nie bez znacze-
˙
˙
nia jest równiez fakt, ze jest to pakiet bezpłatny i wolnodost˛ pny. Dzi˛ ki tym walorom
e
e
˙
˙
R
jest juz od lat wykorzystywany takze w procesie dydaktycznym realizowanym na Wy-
´
dziale MiNI. Stad tez wział si˛ pomysł, aby praktyczne cwiczenia, którym po´wi˛ cony
˛ ˙
˛ e
s e
jest niniejszy skrypt, były realizowane wła´nie z wykorzystaniem programu
R.
s
Od strony merytorycznej nasz skrypt obejmuje wst˛ p do programowania w j˛ zyku
R,
e
e
statystyk˛ opisowa, estymacj˛ punktowa i przedziałowa, weryfikacj˛ hipotez (z uwzgl˛ d-
e
˛
e
˛
˛
e
e
nieniem testów parametrycznych i nieparametrycznych), badanie zwiazku mi˛ dzy ce-
˛
e
chami (w tym m.in. analiz˛ regresji i analiz˛ wariancji) oraz pewne zagadnienia z za-
e
e
˙
kresu rachunku prawdopodobie´ stwa i symulacji komputerowych. Kazdy z rozdziałów
n
i
i
i
i
Zgłoś jeśli naruszono regulamin