wsadzadaniaegzamin12.pdf

(1644 KB) Pobierz
 
W każdym z pytań testowych prawidłowa jest tylko jedna odpowiedź! 
Jeśli w treści pytania wymagane jest uzasadnienie odpowiedzi bądź przedstawienie odpowiedniego 
wyliczenia, samo zaznaczenie odpowiedzi będzie traktowane jako nieważne! 
 
Ciekawe jakie jest prawdopodobieństwo, że da to samo… ​
Rocznik Doroty Wyganowskiej miał 
dokładnie to samo, to samo mieliśmy my, więc całkiem możliwe, że obecny drugi rok też to dostanie:) 
OSZALAŁAM <3 zadanie z euro tez mieli? w tym roku moze zmieni na mś hahah. 
 
 
1. Poniżej przedstawiono wykresy 3 
rozkładów normalnych. (2 pkt.) 
 
 
Wypisz wykresy w kolejności od najniższej 
do najwyższej średniej: 
Wprowadzenie do statystycznej analizy 
danych 
 
B, C, A 
 
Ponieważ im dalej na osi x tym większa 
średnia.  merci :* proszę bardzo :3 
Jeśli jest dużo wartości zebranych po lewej 
stronie to średnia jest mała, jeśli dużo wartości jest po prawej stronie to średnia jest duża. Jeśli 
wykres jest symetryczny (wykres C) lub prawie symetryczny to średnia nie jest ani duża, ani mała. :) 
 
Wypisz wykresy w kolejności od najniższej do najwyższej wariancji: 
A, B, C    ​
Czy mógłby ktoś wytłumaczyć? Chodzi o szerokość ramion? Im szersze ramiona, tym wyższa 
wariancja? ​
TAK 
 
 
 
2. Chcemy sprawdzić, czy kobiety (n=170) różnią się od mężczyzn (n=157) liczbą okresów przebywania 
na bezrobociu. Analizę zaczynamy od sporządzenia dwóch histogramów. Jakie płyną z nich wnioski? 
(1 pkt.) 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
a) rozkłady mają podobne kształty, toteż do porównania grup możemy użyć testu t Studenta 
     TAK      ​
NIE      ​
bo aby można było przeprowadzić test T Studenta muszą być jednakowe 
wariancje 
b) rozkłady są skrajnie skośne i w związku z tym nie możemy zastosować testu t Studenta 
    ​      NIE       ​
ógłby ktoś to wytłumaczyć? ​
TAK ​
m
bo rozklady muszą być normalne w obu grupach 
(slajd 3 wykład 9) 
c) w grupie kobiet jest nieco wyższa wariancja 
   ​ AK​
NIE ​
ariancja kobiet jest mniejsza od wariancji mężczyzn ­ ramiona rozkładu normalnego 
  ​  
T
     ​   ​
W
zmiennej są szersze J. 
d) w grupie kobiet jest wyraźnie wyższa modalna  ​
Za to modalna jest taka sama jak u facetów. 
(modalna = najczęściej powtarzająca się wartość) J.  
     TAK      ​
NIE 
e) w grupie kobiet jest wyraźnie wyższa średnia 
     TAK     ​
NIE 
 
 
3. Przy pomocy testu 
χ2
 
(chi kwadrat) badamy zależność między studiowaniem a balangowaniem w 
grupie dwudziestolatków. Jaka jest hipoteza zerowa tego testu? W populacji…. (1 pkt.) 
 
a) oczekiwane liczby studiujących i niestudiujących balangowiczów są sobie równe 
b) odsetek balangujących jest taki sam w grupie studiujących i niestudiujących 
c) liczba balangujących jest taka sama wśród studiujących i niestudiujących 
d) niezależnie od studiowania, połowa osób balanguje, a połowa nie 
 
 
4. W badaniach nad korzystaniem z internetu losowej próbie dorosłych Polaków zadano pytanie “Czy w 
minionych 7 dniach ściągnęli Państwo jakiś plik muzyczny? (0=nie, 1=tak)”. Wyliczono 
95­procentowy przedział ufności dla tej zmiennej i wyniósł on 75% 
+
5%. Oznacza to, że: (1 pkt.) 
 
a) z 95% pewnością odsetek ściągających muzę z sieci mieści się między 70 a 80%    
b) 95% osób ściąga między 70 a 80 plików muzycznych tygodniowo 
c) możemy odrzucić hipotezę zerową, że dokładnie 75% ludzi ściąga muzę z sieci  
d) mamy między 70 a 80% pewności, że 95% ludzi ściągało pliki muzyczne z internetu 
 
 
5. Zaznacz skrót najlepiej opisujący typ każdej zmiennej ze względu na poziom pomiaru.  
IL ​
ilorazowa     ​ interwałowa    ​porządkowa   ​nominalna   ​dychotomiczna 
IN ​
P
 
N ​
D ​
 
Natężenie ruchu (bardzo małe, małe, średnie, duże, bardzo duże) (obserwacjami są skrzyżowania) 
IL    IN    ​   N    D 
P
 
 
Aktywność obywatelska w kraju = % osób działających w organizacjach pozarządowych (obserwacjami 
są kraje) 
IL ​
   IN    P    N    D 
 
byłaby dychotomiczna, gdyby obserwacjami były jednostki (ludzie) ­ bo albo byliby 
członkami NGO albo nie (0­1), ale jak obserwacjami są kraje, to ilościowa (a 
konkretniej, moim zdaniem, interwałowa) 
Jest zero absolutne, więc ilorazowa. 
Smak przyprawy (łagodna, korzenna, słodka, pikantna) (obserwacjami są przyprawy) 
IL    IN    P    ​   D ​
N
­ czemu nominalna jak Szymon podawał, że smak jest porządkowy (można 
 
określić stopień słodkości)​
ydaje mi się, że porządkowa by była jakbyśmy stopniowali słodkość: 
 
w
mało słodka, słodka, bardzo słodka, najsłodsza, a tu są podane smaki, więc nominalna ​
NOMINALNA 
jest dobrze, bo tu nie ma stopniowania tylko zwykłe nazwy: łagodna, korzenna, pikantna, to 
nie są stopnie np. ostrości, nie motajcie 
 
Grupy decylowe ze względu na poziom zarobków (obserwacjami są osoby pracujące zarobkowo) 
IL    IN    ​   N    D ​
oim zdaniem może być IN, bo można dokładnie określić różnicę między poziomami 
P
 
M
zarobków. J. / ​
oim zdaniem bardziej pasuje porządkowa. ​
M
zarobki = sie porzadkowa było nie raz nie 
dwa :P ​
/ wg mnie chodzi o to że ludzie są pogrupowani na 10 grup od najmniej do najwięcej 
zarabiając ych więc będzie ilorazowa albo porządkowa ​
Porządkowa ma być! 
 
Rok rozpoczęcia działalności (obserwacjami są firmy) 
IL    ​    P    N    D  ­ ilorazowa bo nie ma 0 absolutnego ​
IN ​
(ale w ilorazowej jest właśnie 0 absolutne…)
 To 
jest na pewno zle , ma być ​
interwałowa​
! W. Interwałowa, bo istnieje arbitralne zero, czyli rok 
urodzenia chrystusa od ktorego liczymy lata. W chinach inna data by byla :)  
(przecież w interwałowej nie ma zera, a jest w ilorazowej) 
 zero arbitralne, czyli jesli jest zero to zjawisko 
nie zachodzi? 
Kurwa, ale motacie :) ​
Interwałowa. ​
Najpierw poczytajcie coś o skalach. 
 
6. Chcemy porównywać zróżnicowanie dochodów w kilku państwach używających różnych walut. 
Zaznacz TAK przy miarach, które moglibyśmy zastosować w tym celu, a NIE przy tych, które się 
niezbyt do tego nadają:  
 
a) współczynnik Giniego          ​  NIE 
TAK​
b) współczynnik zmienności    ​  NIE 
TAK​
c) wariancja                              TAK ​
NIE 
d) odchylenie standardowe      TAK ​
NIE 
 
Poniżej ​
jednym krótkim zdaniem​
 uzasadnij swój wybór: 
 
Przy przeliczaniu walut odchylenie standardowe i wariancja ulegają zmianie, a współczynnik Ginniego 
oraz współczynnik zmienności nie.  ​
Ale dlaczego? :x  ​
No bo tak po prostu jest. Poczytaj sobie o 
współ. Giniego i współ. zmienności :) Są one odporne po prostu, nie zmieniają nic i dlatego 
możemy liczyć dochody czy coś tam w różnych walutach. Mówił o tym na wykładzie. 
  
 
7. Do każdego z poniższych zagadnień badawczych dobierz odpowiednią technikę statystyczną 
zakładając, że spełnione są odpowiednie założenia. Wykorzystaj następujące oznaczenia: (10 pkt.) 
(czy dobrze zrozumiałam, że on dzisiaj mówił, że w tym roku może być jeszcze regresja….??) odp: 
CHYBA NIE, na powtórce mowił, że tylko te będą 
  
T1  ​
 test t Studenta dla jednej próby 
TN ​
 test t Studenta dla prób niezależnych 
TZ​
   test t Studenta dla prób zależnych 
AW ​
 analiza wariancji, anova 
2​
X​
    test chi kwadrat 
VCr​
 V Cramera 
T​
test –b Kendralla 
B​
    
ds​
   d Sommersa 
2​
     
n​
eta kwadrat 
  
∙​
zy chłopcy różnili się od dziewcząt średnią oceną z matury z matematyki w 2012 roku? 
        A)
C
2 ​
2 ​
2
          T1        ​
TN 
 TZ        ​
AW  X​
          VCr 
T​
       n​
       ds      n​
 
B ​
  
B) Czy polskie, włoskie, francuskie obiady różnią się przeciętną zawartością tłuszczu? 
2 ​
2 ​
          T1 
TN 
 TZ        ​
AW  X​
          VCr 
T​
       n​
       ds     ​ 
n
2
B ​
zaznaczyłam na poprzednim egz eta kwadrat i mam dobrze wiec???????????????? ​
Pardon. 
You are right. Ale to również badanie średniej, Anova też pasuje ​
Nie może być AW bo mamy 3 
grupy, a w AW mogą być tylko 2 więc bedzie to eta kwadrat :)  ​
ogą być w AW 3 grupy. ;) Obie 
M
odp. są poprawne. ​
ok, ale 4 już nie mogą być, prawda? ​
isie, tylko jedna odpowiedź może być 
M
poprawna w tym zadaniu i jest to eta kwadrat ​
NIE. W tych zadaniach może być poprawnych 
więcej odpowiedzi niż jedna. Chrzan z Kasparkiem tak mówili ostatnio na dodatkowych 
zajęciach. ​
Okej. ​
 wariancji jest napisane, że minimum 2 grupy porównujemy, więc 4 mogą być. :) 
/ ​
W
/ ​
Anova jest dla >= 2 grup i eta^2 robi się razem z ANOVA, wiec obie poprawne (moga byc 
dwie poprawne, ale jak sie zaznaczy jedna, to tez jest zaliczone) 
 
C) Czy Polacy, Niemcy i Francuzi różnią się ulubionym trunkiem (piwo, wino, wódka)? 
          T1 
TN 
 TZ         AW  
(to jest chyba, źle. Patrzcie na zmienne. I narodowość i alkohol sa nominalne) ​
Ale to są 3 
zmienne! inne testy nie robią 3 zmiennych.​
  Anova jest dla dwóch i więcej to raz. Ale jak 
popatrzymy na zajęcia dodatkowe od niego, tam też jest przykład ze studentami spędzającymi 
wakacje. Są trzy zmienne a nie dał anovy. 
W ANOVIE ZMIENNA ZALEŻNA JEST 
INTERWAŁOWA,... ​
CZYLI CO BEDZIE DOBRA ODP???????????? ​
Napisałam niżej wszystko 
co wiem i wyszukałam o chi ;) Jak dla mnie chi kwadrat ­ Beata. / ​
Tak, chi­kwadrat wydaje sie 
byc okej, bo 2 zmienne nominalne (a chi kwadrat moze brac pod uwage takze tabelki wieksze 
od 2x2​
) V cramera nie pasuje, bo pytanie nie dotyczy siły związku, tylko samego występowania 
(związku) 
2​
 
2 ​
2
X​
      VCr 
T​
       n​
       ds      n​
 
B ​
 
Co proponujecie ostatecznie? :) Bo oprócz AW ktoś podkreślił chi kwadrat i v cramera. ​
ak dla 
/ ​
J
mnie pasuje w sumie chi kwadrat, dlatego, że: ​
bada czy w ogóle zachodzi jakiś związek,​
 a o to 
jest pytanie, czy w ogóle się różnią, a nie w jakim stopniu (wtedy VCramera) i mam napisane, 
że chi jest do zm. nominalnych i przeważnie między dwoma nominalnymi, ale PRZEWAŻNIE. 
Co o tym myślicie? ­ Beata D.  + ​
niezależności chi-kwadrat stosoujemy w przypadku
Test
analizy dwóch zmiennych! Każda ze zmiennych może mieć kilka poziomów (wariantów
odpowiedzi, np: płeć - kobiety i mężczyźni; pora roku - lato, jesień, zima, wiosna itp.).
Generalnie test ten stosujemy w przypadku kilku poziomów zmiennych.
 
 
D) Czy przeciętny wiek inicjacji seksualnej mężczyzn w Polsce jest niższy niż 18 lat? 
2 ​
2 ​
2
          ​
T1  
TN 
 TZ        AW  X​
          VCr 
T​
       n​
       ds      n​
 
B ​
 
E) Czy częstsze oglądanie sportu w TV prowadzi do rzadszego uprawiania sportu w rzeczywistości? 
2 ​
2 ​
          T1 
TN 
 TZ ​    AW  X​
   ​
          VCr 
T​
       n​
  ds ​
  n​
     ​
  ​
 
B ​
 
Badamy zależność, więc albo x^2, albo VCr. ​
Nope! czesto i rzadko to przykłady porządku. tylko d 
sommersa ​
Czyli d Sommersa na 100%? :) ​
eż bym dała DS, ponieważ “prognozujemy x na 
/
T
podstawie y, i na odwrót” / warte rozwazania jest jeszcze Tau­b Kendalla. I tau­b i d sommersa 
stosuje sie do takich przypadkow 
 
F) Jak silny jest związek pomiędzy ukończonym kierunkiem studiów a wykonywanym  zawodem? 
2 ​
2 ​
2
          T1 
TN 
 TZ        AW  X​
         ​
 VCr 
T​
       n​
       ds      n​
 
B ​
 
G) Czy liczba ksiązek czytanych rocznie przez obecne dwudziestolatki jest taka sama, jak liczba 
ksiązek czytana przez ich matki w wieku 20 lat? 
2 ​
2 ​
2
          T1 
TN 
 TZ​
        AW  X​
          VCr 
T​
       n​
       ds      n​
 
B ​
 
H)W jakim stopniu zróżnicowanie zarobków można sprowadzić do rodzaju wykonywanego zawodu? 
2 ​
2 ​
          T1 
TN 
 TZ        AW  X​
          VCr 
T​
       n​
       ds   ​
  n​
B ​
Bo eta kwadrat wyjaśnia jaki % zmienności w zmiennej niezależnej możemy wytłumaczyć 
zmienną zależną. 
 
I) Czy liczba ściaganych z sieci albumów muzycznych wpływa negatywnie na liczbę kupowanych 
płyt? 
2 ​
2 ​
          T1 
TN 
 TZ        AW  X​
          VCr 
T​
       n​
 ds ​
2
 
      ​     n​
B ​
 
Obie poprawne? :) / ​
Ja bym była bardziej za DS. / Chi­kwadrat? Przeciez liczba sciaganych 
albumow nie jest zm. nominalna, a chi^2 jest dla dwóch nominalnych. /To też napisałam że 
bym była bardziej za DS :) Ale nikt nic nie zmienia jak widać. 
 
J)Czy kobiety prowadzą dłuższe rozmowy telefoniczne od mężczyzn? 
2 ​
2 ​
2
          T1 
TN 
   TZ        AW  X​
          VCr 
T​
       n​
       ds     n​
 
B ​
 
W drugiej grupie jest dokładnie to samo, ale zmieniona kolejność. 
 
 
8. W czasie odbywających się Mistrzostw Europy w piłce nożnej przeprowadzone zostały wywiady na 
losowych próbach turystów z trzech różnych krajów, nocujących w krakowskich hotelach. Każdej 
osobie zadano pytanie o to, czy ogląda mecze EURO i jakie ma samopoczucie. Wyniki dla każdego z 
trzech krajów przedstawiono w poniższych tabelach krzyżowych (zawierających liczebności). (8 pkt.) 
 
czy ktos moze napisac jak to liczyc? :) Prosimy!!!!!!!!!!!!!! 
Prosimy. A. 
Zgłoś jeśli naruszono regulamin