11.3: Mtihani wa Nzuri-ya-Fit
- Page ID
- 179438
Katika aina hii ya mtihani wa hypothesis, unaamua kama data “inafaa” usambazaji fulani au la. Kwa mfano, unaweza kushutumu data yako haijulikani inafaa usambazaji wa binomial. Unatumia mtihani wa mraba wa chi (maana ya usambazaji kwa mtihani wa hypothesis ni chi-mraba) kuamua kama kuna fit au la. Null na nadharia mbadala kwa mtihani huu inaweza kuandikwa katika hukumu au inaweza kuwa alisema kama equations au usawa.
Takwimu za mtihani kwa mtihani wa nzuri-ya-fit ni:
\[\sum_{k} \frac{(O-E)^{2}}{E}\nonumber\]
ambapo:
- \(O\)= maadili yaliyozingatiwa (data)
- \(E\)= maadili yaliyotarajiwa (kutoka nadharia)
- \(k\)= idadi ya seli tofauti za data au makundi
Maadili yaliyozingatiwa ni maadili ya data na maadili yaliyotarajiwa ni maadili ambayo unatarajia kupata kama hypothesis ya null yalikuwa ya kweli. Hakuna suala la fomu\(\frac{(O-E)^{2}}{E}\).
Idadi ya digrii za uhuru ni\(df\) = (idadi ya makundi — 1).
Mtihani wa nzuri-ya-fit ni karibu daima haki-tailed. Ikiwa maadili yaliyozingatiwa na maadili yanayotarajiwa hayana karibu na kila mmoja, basi takwimu za mtihani zinaweza kupata kubwa sana na zitakuwa njia ya nje kwenye mkia wa kulia wa curve ya mraba.
KUMBUKA
Idadi ya maadili yaliyotarajiwa ndani ya kila kiini inahitaji kuwa angalau tano ili kutumia mtihani huu.
Mfano\(\PageIndex{4}\)
Kukosekana kwa wanafunzi wa chuo kutoka madarasa math ni wasiwasi mkubwa kwa wakufunzi math kwa sababu kukosa darasa inaonekana kuongeza kiwango cha kushuka. Tuseme kwamba utafiti ulifanyika ili kuamua kama kiwango cha ukosefu wa mwanafunzi halisi kinachofuata mtazamo wa kitivo. Kitivo hicho kilitarajia kuwa kundi la wanafunzi 100 watakosa darasa kulingana na Jedwali\(\PageIndex{1}\).
\ (\ UkurasaIndex {1}\) “>Idadi ya kutokuwepo kwa muda | Idadi inayotarajiwa ya wanafunzi |
---|---|
0—2 | 50 |
3—5 | 30 |
6—8 | 12 |
9—11 | 6 |
12+ | 2 |
Utafiti wa random katika kozi zote za hisabati ulifanyika ili kuamua idadi halisi (aliona) ya kutokuwepo katika kozi. Chati katika Jedwali\(\PageIndex{2}\) inaonyesha matokeo ya utafiti huo.
\ (\ UkurasaIndex {2}\) “>Idadi ya kutokuwepo kwa muda | Idadi halisi ya wanafunzi |
---|---|
0—2 | 35 |
3—5 | 40 |
6—8 | 20 |
9—11 | 1 |
12+ | 4 |
Kuamua nadharia null na mbadala zinahitajika kufanya nzuri-ya-fit mtihani.
\(\bf{H_a}\): Mwanafunzi absenteism inafaa kitivo mtazamo.
hypothesis mbadala ni kinyume cha hypothesis null.
\(\bf{H_a}\): Uhaba wa mwanafunzi haufanani na mtazamo wa kitivo.
Je, unaweza kutumia maelezo kama inavyoonekana kwenye chati ili kufanya mtihani wa wema?
- Jibu
-
Suluhisho 11.4
a. Angalia kwamba idadi inayotarajiwa ya kutokuwepo kwa kuingia “12+” ni chini ya tano (ni mbili). Jumuisha kikundi hicho na kikundi cha “9—11" ili kuunda meza mpya ambapo idadi ya wanafunzi kwa kila kuingia ni angalau tano. Matokeo mapya ni katika Jedwali\(\PageIndex{3}\) na Jedwali\(\PageIndex{4}\).
\ (\ UkurasaIndex {3}\) “>Idadi ya kutokuwepo kwa muda Idadi inayotarajiwa ya wanafunzi 0—2 50 3—5 30 6—8 12 9+ 8 Jedwali 11.3
\ (\ UkurasaIndex {4}\) “>Idadi ya kutokuwepo kwa muda Idadi halisi ya wanafunzi 0—2 35 3—5 40 6—8 20 9+ 5 Jedwali\(\PageIndex{4}\)
b Ni idadi gani ya digrii za uhuru (\(df\))?
- Jibu
-
Suluhisho 11.4
b Kuna “seli” nne au makundi katika kila meza mpya.
\(d f=\text { number of cells }-1=4-1=3\)
Zoezi\(\PageIndex{4}\)
Meneja wa kiwanda anahitaji kuelewa ni bidhaa ngapi ambazo hazina kasoro dhidi ya ngapi zinazalishwa. Idadi ya kasoro inayotarajiwa imeorodheshwa katika Jedwali\(\PageIndex{5}\).
\ (\ UkurasaIndex {5}\) “>Idadi zinazozalishwa | Idadi defective |
---|---|
0—100 | 5 |
101—200 | 6 |
201—300 | 7 |
301—400 | 8 |
401—500 | 10 |
Sampuli ya random ilichukuliwa ili kuamua idadi halisi ya kasoro. Jedwali\(\PageIndex{6}\) linaonyesha matokeo ya utafiti.
\ (\ UkurasaIndex {6}\) “>Idadi zinazozalishwa | Idadi defective |
---|---|
0—100 | 5 |
101—200 | 7 |
201—300 | 8 |
301—400 | 9 |
401—500 | 11 |
Hali nadharia null na mbadala zinahitajika kufanya nzuri-ya-fit mtihani, na hali digrii ya uhuru.
Mfano\(\PageIndex{5}\)
Waajiri wanataka kujua ni siku gani za wafanyakazi wa wiki hawako katika wiki ya kazi ya siku tano. Waajiri wengi wangependa kuamini kwamba wafanyakazi hawako sawa wakati wa wiki. Tuseme sampuli ya random ya mameneja wa 60 waliulizwa siku gani ya wiki walikuwa na idadi kubwa zaidi ya ukosefu wa wafanyakazi. Matokeo yaligawanywa kama katika Jedwali\(\PageIndex{7}\). Kwa idadi ya wafanyakazi, je, siku za idadi kubwa ya kutokuwepo hutokea kwa mzunguko sawa wakati wa wiki ya kazi ya siku tano? Mtihani kwa kiwango cha umuhimu wa 5%.
\ (\ PageIndex {7}\) Siku ya Wiki Wafanyakazi walikuwa Wengi hayupo “>Jumatatu | Jumanne | Jumatano | Alhamisi | Ijumaa | |
---|---|---|---|---|---|
Idadi ya kutokuwepo | 15 | 12 | 9 | 9 | 15 |
- Jibu
-
Suluhisho 11.5
Nadharia null na mbadala ni:
- \(H_0\): Siku zisizo mbali hutokea kwa frequency sawa, yaani, zinafaa usambazaji sare.
- \(H_a\): Siku zisizo mbali hutokea kwa frequency zisizo sawa, yaani, hazifanani usambazaji sare.
Ikiwa siku zisizo mbali hutokea kwa mzunguko sawa, basi, kati ya siku 60 zisizopo (jumla katika sampuli:\(15 + 12 + 9 + 9 + 15 = 60\)), kutakuwa na ukosefu wa 12 Jumatatu, 12 Jumanne, 12 Jumatano, 12 Alhamisi, na 12 Ijumaa. Nambari hizi ni inatarajiwa (\(E\)) maadili. Maadili katika meza ni maadili yaliyozingatiwa (\(O\)) au data.
Wakati huu, mahesabu ya takwimu za mtihani wa\ chi2 kwa mkono. Fanya chati na vichwa vifuatavyo na ujaze nguzo:
- Inatarajiwa (\(E\)) maadili\((12, 12, 12, 12, 12)\)
- Alizingatiwa (\(O\)) maadili\((15, 12, 9, 9, 15)\)
- \((O – E)\)
- \((O – E)^2\)
- \(\frac{(O-E)^{2}}{E}\)
Sasa ongeza (jumla) safu ya mwisho. Jumla ni tatu. Hii ni takwimu za\(\chi^2\) mtihani.
Takwimu za mtihani zilizohesabiwa ni 3 na thamani muhimu ya\(\chi^2\) usambazaji kwa digrii 4 za uhuru kiwango cha 0.05 cha kujiamini ni 9.48. Thamani hii inapatikana katika\(\chi^2\) meza kwenye safu ya 0.05 kwenye digrii za mstari wa uhuru 4.
\(\text{The degrees of freedom are the number of cells }– 1 = 5 – 1 = 4\)
Kisha, jaza grafu kama ifuatayo na uwekaji sahihi na shading. (Unapaswa kuvua mkia wa kulia.)
-
\[\bf{\chi}_{c}^{2}=\sum_{k} \frac{(O-E)^{2}}{E}=3\nonumber\]
Uamuzi si kukataa hypothesis null kwa sababu thamani mahesabu ya takwimu mtihani si katika mkia wa usambazaji.
Hitimisho: Katika kiwango cha 5% cha umuhimu, kutoka kwa data ya sampuli, hakuna ushahidi wa kutosha wa kuhitimisha kuwa siku zisizo mbali hazifanyike kwa frequency sawa.
Zoezi\(\PageIndex{5}\)
Walimu wanataka kujua ni usiku gani kila wiki wanafunzi wao wanafanya kazi zao nyingi za nyumbani. Walimu wengi wanafikiri kwamba wanafunzi hufanya kazi za nyumbani kwa usawa kila wiki. Tuseme sampuli ya random ya wanafunzi 56 waliulizwa usiku wa wiki walifanya kazi za nyumbani zaidi. Matokeo yaligawanywa kama katika Jedwali\(\PageIndex{8}\).
\ (\ UkurasaIndex {8}\) “>Jumapili | Jumatatu | Jumanne | Jumatano | Alhamisi | Ijumaa | Jumamosi | |
---|---|---|---|---|---|---|---|
Idadi ya wanafunzi | 11 | 8 | 10 | 7 | 10 | 5 | 5 |
Kutoka kwa idadi ya wanafunzi, je, usiku kwa idadi kubwa ya wanafunzi wanaofanya kazi zao za nyumbani hutokea kwa frequency sawa wakati wa wiki? Ni aina gani ya mtihani wa hypothesis unapaswa kutumia?
Mfano\(\PageIndex{6}\)
Utafiti mmoja unaonyesha kwamba idadi ya televisheni ambazo familia za Marekani zina kusambazwa (hii ni usambazaji uliopewa kwa idadi ya watu wa Marekani) kama ilivyo katika Jedwali\(\PageIndex{9}\).
\ (\ UkurasaIndex {9}\) “>Idadi ya Televisheni | Asilimia |
---|---|
0 | 10 |
1 | 16 |
2 | 55 |
3 | 11 |
4+ | 8 |
Jedwali lina asilimia (\(E\)) inatarajiwa.
sampuli random ya 600 familia katika magharibi ya mbali Marekani ilisababisha data katika Jedwali\(\PageIndex{10}\).
\ (\ UkurasaIndex {10}\) “>Idadi ya Televisheni | Marudio |
---|---|
Jumla = 600 | |
0 | 66 |
1 | 119 |
2 | 340 |
3 | 60 |
4+ | 15 |
Jedwali lina maadili ya mzunguko (\(O\)).
Katika kiwango cha umuhimu wa 1%, je, inaonekana kwamba usambazaji “idadi ya televisheni” ya familia za magharibi ya Marekani ni tofauti na usambazaji kwa idadi ya watu wa Marekani kwa ujumla?
- Jibu
-
Suluhisho 11.6
Tatizo hili anauliza wewe mtihani kama mbali magharibi Marekani familia usambazaji inafaa usambazaji wa familia American. Jaribio hili daima ni sahihi.
Jedwali la kwanza lina asilimia inayotarajiwa. Ili kupata frequency (E) inatarajiwa, kuzidisha asilimia kwa 600. Frequency inatarajiwa ni inavyoonekana katika Jedwali\(\PageIndex{11}\).
\ (\ UkurasaIndex {11}\) “>Idadi ya televisheni Asilimia Marudio yanayotarajiwa 0 10 (0.10) (600) = 60 1 16 (0.16) (600) = 96 2 55 (0.55) (600) = 330 3 11 (0.11) (600) = 66 zaidi ya 3 8 (0.08) (600) = 48 Jedwali\(\PageIndex{11}\) Kwa hiyo, frequency inatarajiwa ni 60, 96, 330, 66, na 48.
\(H_0\): Usambazaji wa “idadi ya televisheni” wa familia za mbali magharibi mwa Marekani ni sawa na usambazaji wa “idadi ya televisheni” wa idadi ya watu wa Marekani.
\(H_a\): Usambazaji wa “idadi ya televisheni” wa familia za mbali za magharibi mwa Marekani ni tofauti na usambazaji wa “idadi ya televisheni” wa idadi ya watu wa Marekani.
Usambazaji kwa mtihani:\(\chi_{4}^{2} \text { where } d f=(\text { the number of cells })-1=5-1=4\).
Tumia takwimu za mtihani:\(\chi^2 = 29.65\)
Grafu:
Grafu ya mraba wa CHI inaonyesha usambazaji na alama thamani muhimu na digrii nne za uhuru kwa kiwango cha 99% ya kujiamini, α = .01, 13.277. Grafu pia inaashiria takwimu za mtihani wa mraba wa chi ya 29.65. Kulinganisha takwimu za mtihani na thamani muhimu, kama tulivyofanya na vipimo vingine vya hypothesis, tunafikia hitimisho.
Kufanya uamuzi: Kwa sababu takwimu mtihani ni katika mkia wa usambazaji hatuwezi kukubali nadharia null.
Hii inamaanisha unakataa imani ya kwamba usambazaji kwa majimbo ya magharibi ya mbali ni sawa na ule wa wakazi wa Marekani kwa ujumla.
Hitimisho: Katika kiwango cha umuhimu wa 1%, kutoka kwa data, kuna ushahidi wa kutosha wa kuhitimisha kuwa usambazaji wa “idadi ya televisheni” kwa ajili ya usambazaji wa mbali magharibi mwa Marekani ni tofauti na usambazaji wa “idadi ya televisheni” kwa idadi ya watu wa Marekani kwa ujumla.
Zoezi\(\PageIndex{6}\)
Asilimia inayotarajiwa ya idadi ya wanafunzi wa kipenzi wanao katika nyumba zao inasambazwa (hii ni usambazaji uliotolewa kwa idadi ya wanafunzi wa Marekani) kama ilivyo katika Jedwali\(\PageIndex{12}\).
\ (\ UkurasaIndex {12}\) “>Idadi ya wanyama wa kipenzi | Asilimia |
---|---|
0 | 18 |
1 | 25 |
2 | 30 |
3 | 18 |
4+ | 9 |
Sampuli ya random ya wanafunzi 1,000 kutoka Mashariki ya Marekani ilisababisha data katika Jedwali\(\PageIndex{13}\).
\ (\ UkurasaIndex {13}\) “>Idadi ya wanyama wa kipenzi | Marudio |
---|---|
0 | 210 |
1 | 240 |
2 | 320 |
3 | 140 |
4+ | 90 |
Katika kiwango cha umuhimu wa 1%, je, inaonekana kwamba usambazaji “idadi ya wanyama wa kipenzi” wa wanafunzi huko Mashariki mwa Marekani ni tofauti na usambazaji kwa idadi ya wanafunzi wa Marekani kwa ujumla?
Mfano\(\PageIndex{7}\)
Tuseme wewe flip sarafu mbili 100 mara. Matokeo ni\(20 HH, 27 HT, 30 TH\), na\(23 TT\). Je, sarafu ni haki? Mtihani kwa kiwango cha umuhimu wa 5%.
- Jibu
-
Suluhisho 11.7
Tatizo hili linaweza kuanzishwa kama tatizo nzuri-ya-fit. nafasi ya sampuli kwa flipping sarafu mbili haki ni\(\{HH, HT, TH, TT\}\). nje ya 100 flips, ungependa kutarajia 25\(HH, 25 HT, 25 TH\), na\(25 TT\). Hii ni usambazaji inatarajiwa kutoka usambazaji wa uwezekano wa binomial. Swali, “Je, sarafu ni haki?” ni sawa na kusema, “Je, usambazaji wa sarafu\((20 HH, 27 HT, 30 TH, 23 TT)\) unafaa usambazaji unaotarajiwa?”
Random kutofautiana: Hebu\(X\) = idadi ya vichwa katika flip moja ya sarafu mbili. X inachukua maadili 0, 1, 2. (Kuna 0, 1, au 2 vichwa katika flip ya sarafu mbili.) Kwa hiyo, idadi ya seli ni tatu. Tangu\(X\) = idadi ya vichwa, masafa yaliyozingatiwa ni 20 (kwa vichwa viwili), 57 (kwa kichwa kimoja), na 23 (kwa vichwa vya sifuri au mikia miwili). Mifumo inayotarajiwa ni 25 (kwa vichwa viwili), 50 (kwa kichwa kimoja), na 25 (kwa vichwa vya sifuri au mikia miwili). Mtihani huu ni haki-tailed.
\(\bf{H_0}\): sarafu ni haki.
\(\bf{H_a}\): sarafu si haki.
Usambazaji kwa mtihani:\(\chi_2^2\) wapi\(df = 3 – 1 = 2\).
Tumia takwimu za mtihani:\(\chi^2 = 2.14\).
Grafu:
Grafu ya mraba wa CHI inaonyesha usambazaji na alama thamani muhimu na digrii mbili za uhuru katika kiwango cha 95% ya kujiamini\(\alpha = 0.05\), 5.991. Grafu pia inaashiria takwimu za\(\chi^2\) mtihani wa mahesabu ya 2.14. Kulinganisha takwimu za mtihani na thamani muhimu, kama tulivyofanya na vipimo vingine vya hypothesis, tunafikia hitimisho.
Hitimisho: Kuna ushahidi haitoshi kuhitimisha kwamba sarafu si haki: hatuwezi kukataa nadharia null kwamba sarafu ni haki.