12_korelacja_regresja.pdf

(518 KB) Pobierz
KORELACJA
X – cecha niezależna (objaśniająca)
Y – cecha zależna (objaśniana)
Dwie cechy mogą byd ze sobą powiązane zależnością:
funkcyjną - każdej wartości cechy niezależnej odpowiada tylko jedna wartośd cechy zależnej
statystyczną (korelacyjną) - określonym wartościom jednej cechy (X) odpowiadają ściśle określone
średnie wartości drugiej cechy (Y)
Badanie powiązao korelacyjnych ma sens jedynie wtedy, gdy zachodzi podejrzenie istnienia związków
przyczynowo-skutkowych między cechami.
Badaniu podlega:
kształt (wykres rozrzutu)
kierunek (kowariancja)
siła (współczynnik korelacji liniowej Pearsona)
WYKRESY ROZRZUTU
1 - korelacja liniowa dodatnia, 2 - korelacja liniowa ujemna, 3 - brak korelacji, 4 - korelacja krzywoliniowa
Korelacja dodatnia występuje wtedy, gdy wzrostowi wartości jednej cechy odpowiada wzrost średnich
wartości drugiej cechy.
Korelacja ujemna występuje wtedy, gdy wzrostowi wartości jednej cechy odpowiada spadek średnich
wartości drugiej cechy.
KOWARIANCJA
Dla próby:
1
n
cov
x
,
y
�½
x
i
x

y
i
y
n
1
i
�½
1
Dla populacji:
1
n
cov
x
,
y
�½
x
i
x

y
i
y
n
i
�½
1
=KOWARIANCJA(zakres_x;zakres_y)*n/(n-1)
x
�½
1
n
x
i
n
i
�½
1
=KOWARIANCJA(zakres_x;zakres_y)
=ŚREDNIA(zakres_x)
=ŚREDNIA(zakres_y)
y
�½
1
n
y
i
n
i
�½
1
cov
x, y
�½
0
brak zależności korelacyjnej
dodatnia zależnośd korelacyjna
ujemna zależnośd korelacyjna
cov
x
,
y
0
cov
x
,
y
0
WSPÓŁCZYNNIK KORELACJI LINIOWEJ PEARSONA
cov
x, y
r
xy
�½
�½
s
x
s
y
x
i
x

y
i
y
i
�½
1
n
x
i
x
y
i
y
2
i
�½
1
i
�½
1
n
n
=WSP.KORELACJI(zakres_x;zakres_y)
2
Dla próby:
s
x
�½
1
n
2
x
i
x
n
1
i
�½
1
Dla populacji:
s
x
�½
1
n
2
x
i
x
n
i
�½
1
=ODCH.STANDARDOWE(zakres_x)
s
y
�½
1
n
2
y
i
y
n
1
i
�½
1
=ODCH.STANDARD.POPUL(zakres_x)
s
y
�½
1
n
2
y
i
y
n
i
�½
1
=ODCH.STANDARDOWE(zakres_Y)
=ODCH.STANDARD.POPUL(zakres_Y)
Znak współczynnika korelacji informuje o kierunku korelacji, natomiast jego bezwzględna wartośd o jej sile.
r
xy
�½
0
brak zależności korelacyjnej
korelacja słaba
korelacja średnia
korelacja silna
korelacja ścisła (zależnośd funkcyjna)
0
r
xy
0,3
0,3
r
xy
0,7
0,7
r
xy
1
r
xy
�½
1
Kwadrat współczynnika korelacji jest nazywany współczynnikiem determinacji i określa, jaka częśd zmian
cechy objaśnianej jest wyjaśniona przez zmiany cechy objaśniającej.
PROSTE REGRESJI
y
�½
a
1
x
b
1
- funkcja regresji Y względem X
x
�½
a
2
y
b
2
- funkcja regresji X względem Y
Y względem X
a
1
�½
r
xy
s
y
s
x
X względem Y
a
2
�½
r
xy
s
x
s
y
=NACHYLENIE(zakres_y;zakres_x)
=ODCIĘTA(zakres_y;zakres_x)
=NACHYLENIE(zakres_x;zakres_y)
=ODCIĘTA(zakres_x;zakres_y)
b
1
�½
y
a
1
x
Y
b
2
�½
x
a
2
y
y
�½
x b
2
a
2
a
2
y
�½
a
1
x
b
1
y
a
1
�½
tgα
a
2
�½
tg
r
xy
�½ a
1
a
2
x
X
1) Jeżeli
r
xy
�½
1
, obie proste pokrywają się.
2) Jeżeli
0
 r
xy
1
, proste regresji tworzą ze sobą kąt
0
90
. Im mniejszy kąt, tym zależnośd
korelacyjna jest silniejsza.
3) Jeżeli
r
xy
�½ 0
, proste regresji tworzą ze sobą kąt prosty.
ZADANIA
1. Z populacji dzieci i młodzieży wybrano losowo próbę 15-osobową i określono następujące dane:
x
i
- wiek w latach,
y
i
- wzrost w centymetrach. Otrzymano następujące pary liczb:
x
i
y
i
7
120
8
122
9
125
10
131
11
135
11,5
140
12
142
13
145
14
150
15
154
16
159
17
162
18
164
18,5
168
19
170
a) obliczyd kowariancję, współczynnik korelacji i współczynnik determinacji
b) narysowad wykres rozrzutu
c) wyznaczyd równanie prostej regresji Y względem X
2. Wyznaczyd zależności korelacyjne między cechami dla danych z pliku
dane12.xls.
Dla przypadków
silnej korelacji wykonad wykresy rozrzutu.
Zgłoś jeśli naruszono regulamin