Skip to main content
Global

10.1: Kulinganisha Njia mbili za Idadi ya Watu wa kujitegemea

  • Page ID
    179541
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Ulinganisho wa njia mbili za kujitegemea za idadi ya watu ni kawaida sana na hutoa njia ya kupima nadharia kwamba vikundi viwili vinatofautiana. Je, mabadiliko ya usiku hayatoshi kuliko mabadiliko ya siku, ni viwango vya kurudi kutoka kwa uwekezaji wa mali isiyohamishika tofauti na yale kutoka kwa uwekezaji wa kawaida wa hisa, na kadhalika? Tofauti iliyoonekana kati ya njia mbili za sampuli inategemea njia zote mbili na upungufu wa kiwango cha sampuli. Njia tofauti sana zinaweza kutokea kwa bahati ikiwa kuna tofauti kubwa kati ya sampuli za mtu binafsi. Takwimu ya mtihani itabidi akaunti kwa ukweli huu. Mtihani kulinganisha idadi mbili ya kujitegemea ina maana na kutofautiana na uwezekano kutofautiana idadi ya watu kupotoka kiwango inaitwa Aspin-Welch\(t\) -mtihani. Daraja la formula ya uhuru tutaona baadaye ilianzishwa na Aspin-Welch.

    Tulipotengeneza mtihani wa hypothesis kwa maana na uwiano tulianza na Theorem ya Kati ya Limit. Tuligundua kwamba sampuli maana alikuja kutoka usambazaji wa njia sampuli, na sampuli idadi alikuja kutoka usambazaji sampuli ya idadi sampuli. Hii ilifanya sampuli yetu vigezo, njia sampuli na idadi ya sampuli, katika vigezo random. Ilikuwa muhimu kwa sisi kujua usambazaji kwamba vigezo hivi random walitoka. Theorem ya Kati ya Limit ilitupa jibu: usambazaji wa kawaida. Yetu\(Z\) na\(t\) takwimu zilikuja kutoka kwa theorem hii. Hii ilitupa suluhisho la swali letu la jinsi ya kupima uwezekano kwamba sampuli maana ilitoka kwa usambazaji na thamani fulani ya nadharia ya maana au uwiano. Katika hali zote mbili hiyo ilikuwa swali: ni nini uwezekano kwamba maana (au uwiano) kutoka data yetu sampuli alikuja kutoka usambazaji idadi ya watu na thamani nadharia sisi ni nia ya?

    Sasa tuna nia ya kama sampuli mbili zina maana sawa. Swali letu halijabadilika: Je, sampuli hizi mbili zinatokana na usambazaji huo wa idadi ya watu? Ili kukabiliana na tatizo hili sisi kujenga mpya random variable. Tunatambua kwamba tuna njia mbili sampuli, moja kutoka kila seti ya data, na hivyo tuna vigezo mbili random kuja kutoka mgawanyo mbili haijulikani. Ili kutatua tatizo tunaunda variable mpya ya random, tofauti kati ya sampuli ina maana. Hii mpya random variable pia ina usambazaji na, tena, Central Limit Theorem inatuambia kwamba usambazaji huu mpya ni kawaida kusambazwa, bila kujali mgawanyo msingi wa data ya awali. Grafu inaweza kusaidia kuelewa dhana hii.

    Kielelezo\(\PageIndex{2}\)

    Picha ni mgawanyo wawili wa data,\(X_1\) na\(X_2\), kwa njia zisizojulikana na upungufu wa kawaida. Jopo la pili linaonyesha usambazaji wa sampuli wa kutofautiana kwa random (\(\overline{X}_{1}-\overline{X}_{2}\)). Usambazaji huu ni usambazaji wa kinadharia wa njia nyingi za sampuli kutoka kwa idadi ya watu 1 bala sampuli ina maana kutoka idadi ya watu 2. Theorem ya Kati ya Limit inatuambia kwamba usambazaji huu wa sampuli ya kinadharia ya tofauti katika njia za sampuli ni kawaida kusambazwa, bila kujali usambazaji wa data halisi ya idadi ya watu inavyoonekana kwenye jopo la juu. Kwa sababu usambazaji sampuli ni kawaida kusambazwa, tunaweza kuendeleza formula kusanifisha na mahesabu probabilities kutoka usambazaji kiwango kawaida katika jopo chini,\(Z\) usambazaji. Tumeona uchambuzi huo kabla katika Sura ya 7 Kielelezo\(\PageIndex{2}\).

    Theorem ya Kati ya Limit, kama hapo awali, inatupa kupotoka kwa kiwango cha usambazaji wa sampuli, na zaidi, kwamba thamani inayotarajiwa ya maana ya usambazaji wa tofauti katika njia za sampuli ni sawa na tofauti katika njia za idadi ya watu. Hisabati hii inaweza kuwa alisema:

    \[E\left(\mu_{\overline{x}_{1}}-\mu_{\overline{x}_{2}}\right)=\mu_{1}-\mu_{2}\nonumber\]

    Kwa sababu hatujui upungufu wa kiwango cha idadi ya watu, tunawahesabu kwa kutumia sampuli mbili za kiwango cha sampuli kutoka kwa sampuli zetu za kujitegemea. Kwa mtihani wa hypothesis, tunahesabu kiwango cha kupotoka kwa kiwango, au kosa la kawaida, la tofauti katika njia za sampuli,\(\overline{X}_{1}-\overline{X}_{2}\).

    \[\textbf{The standard error is:}\nonumber\]

    \[\sqrt{\frac{\left(s_{1}\right)^{2}}{n_{1}}+\frac{\left(s_{2}\right)^{2}}{n_{2}}}\nonumber\]

    Tunakumbuka kuwa badala ya sampuli ugomvi kwa ugomvi wa idadi ya watu wakati hatukuwa na ugomvi wa idadi ya watu ilikuwa mbinu tuliyotumia wakati wa kujenga muda wa kujiamini na takwimu za mtihani kwa mtihani wa hypothesis kwa maana moja nyuma katika vipindi vya kujiamini na Upimaji wa hypothesis na Mfano mmoja. Takwimu za mtihani (t- alama) zinahesabiwa kama ifuatavyo:

    \[t_{c}=\frac{\left(\overline{x}_{1}-\overline{x}_{2}\right)-\delta_{0}}{\sqrt{\frac{\left(s_{1}\right)^{2}}{n_{1}}+\frac{\left(s_{2}\right)^{2}}{n_{2}}}}\nonumber\]

    ambapo:

    • \(s_1\)na\(s_2\), kiwango sampuli deviations, ni makadirio ya\(\sigma_1\) na\(\sigma_2\), kwa mtiririko huo na
    • \(\sigma_1\)na\(\sigma_2\) haijulikani idadi ya watu kiwango deviations.
    • \(\overline{x}_{1}\)na\(\overline{x}_{2}\) ni njia ya sampuli. \(\mu_1\)na\(\mu_2\) haijulikani idadi ya watu ina maana.

    Idadi ya digrii za uhuru (df) inahitaji hesabu ngumu. Ya\(df\) si mara zote idadi nzima. Takwimu za mtihani hapo juu ni takriban na\(t\) usambazaji wa Mwanafunzi na\(df\) kama ifuatavyo:

    Degrees ya uhuru

    \[df=\frac{\left(\frac{\left(s_{1}\right)^{2}}{n_{1}}+\frac{\left(s_{2}\right)^{2}}{n_{2}}\right)^{2}}{\left(\frac{1}{n_{1}-1}\right)\left(\frac{\left(s_{1}\right)^{2}}{n_{1}}\right)^{2}+\left(\frac{1}{n_{2}-1}\right)\left(\frac{\left(s_{2}\right)^{2}}{n_{2}}\right)^{2}}\nonumber\]

    Wakati wote ukubwa sampuli\(n_1\) na\(n_2\) ni 30 au kubwa, Mwanafunzi t makadirio ni nzuri sana. Ikiwa kila sampuli ina uchunguzi zaidi ya 30 basi digrii za uhuru zinaweza kuhesabiwa kama\(n_1 + n_2 - 2\).

    Fomu ya usambazaji wa sampuli, tofauti katika njia za sampuli, inasema kuwa muundo wa hypothesis ya null na mbadala ni:

    \[H_{0} : \mu_{1}-\mu_{2}=\delta_{0}\nonumber\]

    \[H_{\mathrm{a}} : \mu_{1}-\mu_{2} \neq \delta_{0}\nonumber\]

    ambapo\(\delta_{0}\) ni tofauti hypothesized kati ya njia mbili. Ikiwa swali ni tu “kuna tofauti yoyote kati ya njia?” basi\(\delta_{0} = 0\) na nadharia null na mbadala inakuwa:

    \[H_{0} : \mu_{1}=\mu_{2}\nonumber\]

    \[H_{\mathrm{a}} : \mu_{1} \neq \mu_{2}\nonumber\]

    Mfano wa wakati hauwezi\(\delta_{0}\) kuwa sifuri ni wakati kulinganisha kwa vikundi viwili kunahitaji tofauti maalum kwa uamuzi kuwa na maana. Fikiria kwamba unafanya uwekezaji mkuu. Unazingatia kubadilisha kutoka kwa mashine yako ya sasa ya mfano hadi nyingine. Unapima uzalishaji wa mashine yako kwa kasi wanayozalisha bidhaa. Inawezekana kuwa mgombea kuchukua nafasi ya mtindo wa zamani ni kasi zaidi kwa suala la kupitisha bidhaa, lakini pia ni ghali zaidi. mashine ya pili inaweza pia kuwa na gharama zaidi ya matengenezo, gharama za kuanzisha, nk hypothesis null itakuwa kuanzisha ili mashine mpya ingekuwa bora kuliko ya zamani na kutosha ili kufidia gharama hizi za ziada katika suala la kasi na gharama za uzalishaji. Aina hii ya hypothesis null na mbadala inaonyesha jinsi thamani hii hasa hypothesis mtihani inaweza kuwa. Kwa kazi nyingi tutakuwa tukijaribu nadharia rahisi kuuliza kama kuna tofauti yoyote kati ya njia mbili za usambazaji.

    Mfano\(\PageIndex{1}\) INDEPENDENT GROUPS

    Kona Iki Corporation inazalisha maziwa ya nazi. Wanachukua nazi na kuchimba maziwa ndani kwa kuchimba shimo na kumwaga maziwa ndani ya VAT kwa ajili ya usindikaji. Wana mabadiliko ya siku (inayoitwa mabadiliko ya B) na mabadiliko ya usiku (inayoitwa mabadiliko ya G) kufanya sehemu hii ya mchakato. Wangependa kujua kama mabadiliko ya siku na mabadiliko ya usiku ni sawa katika usindikaji nazi. Utafiti umefanywa sampuli 9 mabadiliko ya mabadiliko ya G na mabadiliko 16 ya mabadiliko ya B. Matokeo ya idadi ya masaa inahitajika kutengeneza paundi 100 za nazi zinawasilishwa katika Jedwali\(\PageIndex{1}\). Utafiti umefanywa na data zinakusanywa, na kusababisha data katika Jedwali\(\PageIndex{1}\).

    \ (\ UkurasaIndex {1}\) “>
    Ukubwa wa Mfano Wastani wa Idadi ya Masaa ya Mchakato Pounds 100 ya Nazi Mfano wa kiwango cha kupotoka
    G Shift 9 2 0.8660.866
    B Shift 16 3.2 1.00
    Jedwali\(\PageIndex{1}\)

    Je, kuna tofauti katika kiwango cha wastani cha muda kwa kila mabadiliko ya mchakato wa paundi 100 za nazi? Mtihani katika kiwango cha 5% cha umuhimu.

    Jibu

    Suluhisho 10.1

    Ukosefu wa kiwango cha idadi ya watu haujulikani na hauwezi kudhaniwa kuwa sawa. Hebu\(g\) kuwa subscript kwa G Shift na\(b\) kuwa subscript kwa B Shift. Kisha,\(\mu_g\) ni idadi ya watu maana kwa G Shift na\(\mu_b\) ni idadi ya watu maana kwa B Shift. Hii ni mtihani wa makundi mawili ya kujitegemea, njia mbili za idadi ya watu.

    Random variable:\(\overline{X}_{g}-\overline{X}_{b}\) = tofauti katika sampuli maana kiasi cha muda kati ya G Shift na B Shift inachukua mchakato nazi.
    \(\H_{0}: \mu_g = \mu_b\)\(\H_{0}: \mu_g – \mu_b = 0\)
    \(H_a: \mu_g \neq \mu_b\)\(H_a: \mu_g – \mu_b \neq 0\)
    Maneno “sawa” yanakuambia\(\H_{0}\) ina “=”. Kwa kuwa hakuna maneno mengine kuonyesha\(H_a\), ni ama kasi au polepole. Hii ni mtihani wa tailed mbili.

    Usambazaji kwa mtihani: Tumia\(t_{df}\) ambapo\(df\) ni mahesabu kwa kutumia\(df\) formula kwa makundi ya kujitegemea, idadi ya watu wawili ina maana hapo juu. Kutumia calculator,\(df\) ni takriban 18.8462.

    Grafu:

    Hii ni kawaida usambazaji Curve anayewakilisha tofauti katika kiasi wastani wa muda wasichana na wavulana kucheza michezo siku nzima. Maana ni sawa na sifuri, na maadili -1.2, 0, na 1.2 yanaandikwa kwenye mhimili usio na usawa. Mistari miwili ya wima hupanua kutoka -1.2 na 1.2 hadi kwenye pembe. Eneo upande wa kushoto wa x = -1.2 na kanda kwa haki ya x = 1.2 ni kivuli ili kuwakilisha thamani ya p. Eneo la kila mkoa ni 0.0028.

    Kielelezo\(\PageIndex{3}\)

    \[\mathrm{t}_{\mathrm{c}}=\frac{\left(\overline{X}_{1}-\overline{X}_{2}\right)-\delta_{0}}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}=-3.01\nonumber\]

    Sisi ijayo kupata thamani muhimu juu ya\(t\) -meza kutumia digrii ya uhuru kutoka juu. Thamani muhimu, 2.093, inapatikana kwenye safu ya .025, hii ni\(\alpha/2\), kwa digrii 19 za uhuru. (Mkataba ni kuzunguka digrii za uhuru wa kufanya hitimisho zaidi kihafidhina.) Halafu tunahesabu takwimu za mtihani na alama hii kwenye grafu ya\(t\) usambazaji.

    Fanya uamuzi: Tangu\(t\) thamani ya mahesabu iko kwenye mkia hatuwezi kukubali nadharia mbaya kwamba hakuna tofauti kati ya makundi mawili. Njia ni tofauti.

    Grafu imejumuisha usambazaji wa sampuli wa tofauti katika njia za sampuli kuonyesha jinsi usambazaji wa t unavyofanana na data ya usambazaji wa sampuli. Tunaona kwenye jopo la juu kwamba tofauti iliyohesabiwa katika njia mbili ni -1.2 na jopo la chini linaonyesha kwamba hii ni 3.01 upungufu wa kawaida kutoka kwa maana. Kwa kawaida hatuna haja ya kuonyesha grafu ya usambazaji wa sampuli na tunaweza kutegemea grafu ya takwimu za mtihani, usambazaji wa t katika kesi hii, kufikia hitimisho letu.

    Hitimisho: Katika kiwango cha 5% cha umuhimu, data ya sampuli inaonyesha kuna ushahidi wa kutosha ili kuhitimisha kuwa idadi ya masaa ambayo G Shift inachukua mchakato paundi 100 za nazi ni tofauti na B Shift (wastani wa idadi ya masaa kwa B Shift ni kubwa kuliko idadi ya wastani ya masaa kwa G Shift).

    KUMBUKA

    Wakati jumla ya ukubwa wa sampuli ni kubwa kuliko\(30\left(n_{1}+n_{2}>30\right)\) unaweza kutumia usambazaji wa kawaida kwa takriban Mwanafunzi\(t\).

    Mfano\(\PageIndex{2}\)

    Utafiti unafanywa ili kuamua kama Kampuni A anakuwa na wafanyakazi wake kwa muda mrefu kuliko Kampuni B. Inaaminika kuwa Kampuni A ina retention ya juu kuliko Kampuni B. utafiti unaona kuwa katika sampuli ya wafanyakazi 11 katika Kampuni A muda wao wastani na kampuni ni miaka minne na kupotoka kiwango cha miaka 1.5. Sampuli ya wafanyakazi 9 katika Kampuni B inaona kwamba muda wa wastani na kampuni ilikuwa miaka 3.5 na kupotoka kwa kiwango cha mwaka 1. Jaribu pendekezo hili kwa kiwango cha 1% cha umuhimu.

    Je, hii ni mtihani wa njia mbili au idadi mbili?

    Jibu

    Suluhisho 10.2

    a. njia mbili kwa sababu wakati ni kuendelea random variable.

    b Je, idadi ya watu kiwango kupotoka inayojulikana au haijulikani?

    Jibu

    Suluhisho 10.2

    b. haijulikani

    c Ni usambazaji gani unayotumia kufanya mtihani?

    Jibu

    Suluhisho 10.2

    c. mwanafunzi\(t\)

    d. ni variable random nini?

    Jibu

    Suluhisho 10.2

    d.\(\overline{X}_{A}-\overline{X}_{B}\)

    e. ni null na mbadala hypotheses nini?

    Jibu

    Suluhisho 10.2

    e.

    • \(H_{0} : \mu_{A} \leq \mu_{B}\)
    • \(H_{a} : \mu_{A}>\mu_{B}\)

    f Je, mtihani huu ni haki-, kushoto, au mbili-tailed?

    Jibu

    Suluhisho 10.2

    f. haki moja-tailed mtihani

    Hii ni kawaida usambazaji Curve na maana sawa na 0. Mstari wa wima karibu na mkia wa curve kwa haki ya sifuri unatoka kwenye mhimili hadi kwenye pembe. Kanda chini ya pembe ya kulia ya mstari ni kivuli.

    Kielelezo\(\PageIndex{4}\)

    g. thamani ya takwimu za mtihani ni nini?

    Jibu

    Suluhisho 10.2

    g.

    \(t_{c}=\frac{\left(\overline{X}_{1}-\overline{X}_{2}\right)-\delta_{0}}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}=0.89\)

    h. unaweza kukubali/kukataa hypothesis null?

    Jibu

    Suluhisho 10.2

    h. hawezi kukataa hypothesis null kwamba hakuna tofauti kati ya makundi mawili. Takwimu za mtihani sio mkia. Thamani muhimu ya usambazaji wa t ni 2.764 na digrii 10 za uhuru. Mfano huu unaonyesha jinsi ilivyo vigumu kukataa nadharia mbaya na sampuli ndogo sana. Maadili muhimu yanahitaji takwimu kubwa za mtihani kufikia mkia.

    i Hitimisho:

    Jibu

    Suluhisho 10.2

    i Katika kiwango cha 1% cha umuhimu, kutoka kwa data ya sampuli, hakuna ushahidi wa kutosha wa kuhitimisha kuwa uhifadhi wa wafanyakazi katika Kampuni A ni mrefu kuliko Kampuni B, kwa wastani.

    Mfano\(\PageIndex{3}\)

    Swali la utafiti la kuvutia ni athari, kama ipo, kwamba aina tofauti za muundo wa kufundisha zina matokeo ya daraja la wanafunzi. Kuchunguza suala hili sampuli moja ya darasa la wanafunzi ilichukuliwa kutoka darasa la mseto na sampuli nyingine iliyochukuliwa kutoka darasa la kawaida la hotuba. Madarasa yote yalikuwa kwa somo moja. Maana shaka daraja katika asilimia kwa 35 wanafunzi mseto ni 74 na kupotoka kiwango cha 16. darasa maana ya 40 wanafunzi kuunda darasa kiwango hotuba ilikuwa 76 asilimia na kupotoka kiwango cha 9. Mtihani saa 5% ili kuona kama kuna tofauti yoyote kubwa katika idadi ya watu maana ya darasa kati ya kozi ya kawaida ya hotuba na darasa mseto.

    Jibu

    Suluhisho 10.3

    Tunaanza kwa kutambua kwamba tuna makundi mawili, wanafunzi kutoka darasa la mseto na wanafunzi kutoka darasa la kawaida la hotuba. Pia tunaona kwamba variable random, nini sisi ni nia ya, ni darasa la wanafunzi, kuendelea random variable. Tunaweza kuwa aliuliza swali utafiti kwa njia tofauti na alikuwa binary random variable. Kwa mfano, tunaweza kuwa alisoma asilimia ya wanafunzi wenye daraja la kushindwa, au kwa daraja A. Wote wa haya itakuwa binary na hivyo mtihani wa idadi na si mtihani wa njia kama ilivyo hapa. Hatimaye, hakuna dhana kama ambayo format inaweza kusababisha darasa juu hivyo hypothesis ni alisema kama mtihani mbili-tailed.

    \(H_{0}: \mu_1 = \mu_2 \)
    \(H_a: \mu_1 \neq \mu_2\)

    Kama ingekuwa karibu daima kuwa kesi, hatujui tofauti ya idadi ya watu wa mgawanyo mbili na hivyo mtihani wetu takwimu ni:

    \[t_{c}=\frac{\left(\overline{x}_{1}-\overline{x}_{2}\right)-\delta_{0}}{\sqrt{\frac{s^{2}}{n_{1}}+\frac{s^{2}}{n_{2}}}}=\frac{(74-76)-0}{\sqrt{\frac{16^{2}}{35}+\frac{9^{2}}{40}}}=-0.65\nonumber\]

    Kuamua thamani muhimu ya t Mwanafunzi tunahitaji digrii za uhuru. Kwa kesi hii tunatumia:\(df = n_1 + n_2 - 2 = 35 + 40 -2 = 73\). Hii ni kubwa ya kutosha kuzingatia ni usambazaji wa kawaida hivyo\(t_{\alpha /2} = 1.96\). Tena, kama daima tunaamua ikiwa thamani ya mahesabu iko katika mkia uliowekwa na thamani muhimu. Katika kesi hii hatuhitaji hata kuangalia thamani muhimu: thamani ya mahesabu ya tofauti katika darasa hizi mbili za wastani sio hata kupotoka kwa kiwango kimoja mbali. Hakika si katika mkia.

    Hitimisho: Haiwezi kukataa null saa\(\bf{\alpha = 5\%}\). Kwa hiyo, ushahidi haupo ili kuthibitisha kwamba darasa katika madarasa ya mseto na ya kawaida hutofautiana.