Skip to main content
Global

12.7: Nje

  • Page ID
    181040
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Katika seti fulani za data, kuna maadili (aliona pointi za data) zinazoitwa nje. Outliers ni aliona pointi data kwamba ni mbali na angalau mraba line. Wana “makosa” makubwa, ambapo “kosa” au mabaki ni umbali wa wima kutoka mstari hadi hatua. Outliers haja ya kuchunguzwa kwa karibu. Wakati mwingine, kwa sababu fulani au nyingine, haipaswi kuingizwa katika uchambuzi wa data. Inawezekana kwamba nje ni matokeo ya data isiyo sahihi. Wakati mwingine, outlier inaweza kushikilia taarifa muhimu kuhusu idadi ya watu chini ya utafiti na inapaswa kubaki ni pamoja na katika data. Kitu muhimu ni kuchunguza kwa makini nini kinachosababisha hatua ya data kuwa ya nje.

    Mbali na hilo nje, sampuli inaweza kuwa na pointi moja au chache ambazo huitwa pointi za ushawishi mkubwa. Pointi za ushawishi zinazingatiwa pointi za data ambazo ziko mbali na pointi nyingine za data zilizoonekana katika mwelekeo usio na usawa. Vipengele hivi vinaweza kuwa na athari kubwa kwenye mteremko wa mstari wa kurudi nyuma. Kuanza kutambua hatua yenye ushawishi mkubwa, unaweza kuiondoa kwenye kuweka data na kuona kama mteremko wa mstari wa kurudi nyuma umebadilishwa kwa kiasi kikubwa.

    Kompyuta na mahesabu mengi yanaweza kutumika kutambua nje kutoka data. Kompyuta pato kwa ajili ya uchambuzi regression mara nyingi kutambua nje wote na pointi ushawishi ili uweze kuchunguza yao.

    Kutambua Outliers

    Tunaweza nadhani katika outliers kwa kuangalia grafu ya njama kuwatawanya na bora fit line. Hata hivyo, tungependa mwongozo fulani kuhusu jinsi mbali hatua inahitaji kuwa ili kuchukuliwa kuwa ya nje. Kama utawala mbaya wa thumb, tunaweza bendera hatua yoyote ambayo iko zaidi ya mbili kupotoka kiwango juu au chini ya mstari bora fit kama outlier. Kupotoka kwa kawaida hutumiwa ni kupotoka kwa kiwango cha mabaki au makosa.

    Tunaweza kufanya hivyo kuibua katika njama kuwatawanya kwa kuchora jozi ya ziada ya mistari ambayo ni mbili deviations kiwango juu na chini ya mstari bora fit. Pointi yoyote ya data iliyo nje ya jozi hii ya ziada ya mistari ni alama kama nje ya uwezo. Au tunaweza kufanya hivyo numerically kwa kuhesabu kila mabaki na kulinganisha kwa mara mbili kupotoka kiwango. Kwenye TI-83, 83+, au 84+, mbinu ya graphical ni rahisi. Utaratibu wa graphical unaonyeshwa kwanza, ikifuatiwa na mahesabu ya namba. Ungependa kwa ujumla haja ya kutumia moja tu ya njia hizi.

    Mfano\(\PageIndex{1}\)

    Katika mtihani wa tatu/mfano wa mwisho wa mtihani, unaweza kuamua ikiwa kuna nje au la. Ikiwa kuna nje, kama zoezi, futa na ufanye data iliyobaki kwenye mstari mpya. Kwa mfano huu, mstari mpya unapaswa kufaa data iliyobaki bora. Hii inamaanisha SSE inapaswa kuwa ndogo na mgawo wa uwiano unapaswa kuwa karibu na 1 au -1.

    Jibu

    Utambulisho wa picha ya Outliers

    Pamoja na mahesabu ya TI-83, 83+, 84+, ni rahisi kutambua nje ya graphically na kuibua. Ikiwa tulikuwa tukipima umbali wa wima kutoka kwa uhakika wowote wa data hadi hatua inayofanana kwenye mstari wa kufaa bora na umbali huo ulikuwa sawa na 2 s au zaidi, basi tutafikiria hatua ya data kuwa “mbali sana” kutoka kwenye mstari wa kufaa bora. Tunahitaji kupata na kuchora mistari ambayo ni upungufu wa kawaida chini na juu ya mstari wa kurudi nyuma. Pointi yoyote ambayo ni nje ya mistari hii miwili ni outliers. Tutaita mistari hii Y2 na Y3:

    Kama tulivyofanya na usawa wa mstari wa kurudi nyuma na mgawo wa uwiano, tutatumia teknolojia kuhesabu kupotoka kwa kiwango hiki kwetu. Kutumia LinRettest na data hii, tembea chini kupitia skrini za pato ili upate\(s = 16.412\).

    Mstari\(Y2 = -173.5 + 4.83x - 2(16.4)\) na mstari\(Y3 = -173.5 + 4.83x + 2(16.4)\)

    \(\hat{y} = -173.5 + 4.83x\)wapi mstari wa fit bora. \(Y2\)na\(Y3\) kuwa na mteremko sawa na mstari wa fit bora.

    Grafu scatterplot na mstari bora zaidi katika equation\(Y1\), kisha ingiza mistari miwili ya ziada kama\(Y2\) na\(Y3\) katika mhariri wa "\(Y=\)" equation na waandishi wa habari ZOOM 9. Utapata kwamba tu data uhakika kwamba si kati ya mistari\(Y2\) na\(Y3\) ni uhakika\(x = 65\),\(y = 175\). Kwenye skrini ya calculator ni vigumu tu nje ya mistari hii. Outlier ni mwanafunzi ambaye alikuwa na daraja la 65 juu ya mtihani wa tatu na 175 juu ya mtihani wa mwisho; hatua hii ni zaidi ya mbili kupotoka kiwango mbali na mstari bora fit.

    Wakati mwingine hatua ni karibu sana na mistari inayotumiwa kupiga alama za nje kwenye grafu kwamba ni vigumu kujua kama uhakika ni kati au nje ya mistari. Kwenye kompyuta, kupanua grafu inaweza kusaidia; kwenye skrini ndogo ya calculator, kuingia ndani inaweza kufanya grafu wazi. Kumbuka kwamba wakati grafu haitoi picha ya kutosha ya kutosha, unaweza kutumia kulinganisha namba ili kutambua nje.

    Mpango wa kuwatawanya wa alama za mtihani na mstari wa kufaa bora.Mistari miwili iliyopigwa njano inakwenda sambamba na mstari wa fit bora. Mistari iliyopigwa inaendesha juu na chini ya mstari bora zaidi kwa umbali sawa. Sehemu moja ya data iko nje ya mipaka iliyoundwa na mistari iliyopandwa-ni ya nje.
    Kielelezo 12.7.1.

    Zoezi\(\PageIndex{1}\)

    Kutambua outlier uwezo katika njama kuwatawanya. Kupotoka kwa kiwango cha mabaki au makosa ni takriban 8.6.

    Kielelezo 12.7.2.
    Jibu

    Outlier inaonekana kuwa katika (6, 58). \(y\)Thamani inayotarajiwa kwenye mstari kwa uhakika (6, 58) ni takriban 82. Hamsini na nane ni vitengo 24 kutoka 82. Ishirini na nne ni zaidi ya mbili kupotoka kiwango (\(2s = (2)(8.6) = 17.2\)). Hivyo 82 ni zaidi ya mbili kupotoka kiwango kutoka 58, ambayo inafanya\((6, 58)\) outlier uwezo.

    Utambulisho wa namba ya Outliers

    Katika jedwali hapa chini, nguzo mbili za kwanza ni data ya mtihani wa tatu na mtihani wa mwisho. Safu ya tatu inaonyesha\(\hat{y}\) maadili yaliyotabiriwa yaliyohesabiwa kutoka kwenye mstari wa kufaa bora:\(\hat{y} = -173.5 + 4.83x\). Mabaki, au makosa, yamehesabiwa katika safu ya nne ya meza:\(y\) thamani iliyozingatiwa -\(y\) thamani iliyotabiriwa\(= y − \hat{y}\).

    s ni kupotoka kiwango cha\(y - \hat{y} = \varepsilon\) maadili yote ambapo\(n = \text{the total number of data points}\). Kama kila mabaki ni mahesabu na mraba, na matokeo ni aliongeza, sisi kupata\(SSE\). Kupotoka kwa kiwango cha mabaki ni mahesabu kutoka\(SSE\) kama:

    \[s = \sqrt{\dfrac{SSE}{n-2}}\nonumber \]

    KUMBUKA

    Tunagawanya na (\(n – 2\)) kwa sababu mfano wa kurudi nyuma unahusisha makadirio mawili.

    Badala ya kuhesabu thamani ya s wenyewe, tunaweza kupata s kutumia kompyuta au calculator. Kwa mfano huu, kazi ya calculator LineRettest hupatikana\(s = 16.4\) kama kupotoka kwa kiwango cha mabaki 35; —17; 16; -6; —19; 9; 3; —1; —10; —9; -1.

    \(x\) \(y\) \(\hat{y}\) \(y – \hat{y}\)
    \ (x\) ">65 \ (y\) ">175 \ (\ kofia {y}\) ">140 \ (y —\ kofia {y}\) ">175 - 140 = 35
    \ (x\) ">67 \ (y\) ">133 \ (\ kofia {y}\) ">150 \ (y —\ kofia {y}\) ">133 — 150= —17
    \ (x\) ">71 \ (y\) ">185 \ (\ kofia {y}\) ">169 \ (y —\ kofia {y}\) ">185 - 169 = 16
    \ (x\) ">71 \ (y\) ">163 \ (\ kofia {y}\) ">169 \ (y —\ kofia {y}\) ">163 - 169 = —6
    \ (x\) ">66 \ (y\) ">126 \ (\ kofia {y}\) ">145 \ (y —\ kofia {y}\) ">126 — 145 = —19
    \ (x\) ">75 \ (y\) ">198 \ (\ kofia {y}\) ">189 \ (y —\ kofia {y}\) ">198 - 189 = 9
    \ (x\) ">67 \ (y\) ">153 \ (\ kofia {y}\) ">150 \ (y —\ kofia {y}\) ">153 - 150 = 3
    \ (x\) ">70 \ (y\) ">163 \ (\ kofia {y}\) ">164 \ (y —\ kofia {y}\) ">163 - 164 = -1
    \ (x\) ">71 \ (y\) ">159 \ (\ kofia {y}\) ">169 \ (y —\ kofia {y}\) "> 159 - 169 = —10
    \ (x\) ">69 \ (y\) ">151 \ (\ kofia {y}\) ">160 \ (y —\ kofia {y}\) ">151 - 160 = —9
    \ (x\) ">69 \ (y\) ">159 \ (\ kofia {y}\) ">160 \ (y —\ kofia {y}\) "> 159 - 160 = -1

    Tunatafuta pointi zote za data ambazo mabaki ni makubwa kuliko\(2s = 2(16.4) = 32.8\) au chini ya\(-32.8\). Linganisha maadili haya kwa mabaki katika safu ya nne ya meza. Njia pekee ya data ni mwanafunzi ambaye alikuwa na daraja la 65 kwenye mtihani wa tatu na 175 kwenye mtihani wa mwisho; mabaki ya mwanafunzi huyu ni 35.

    Je, nje huathiri mstari bora zaidi?

    Numerically na graphically, sisi kutambuliwa uhakika (65, 175) kama outlier. Tunapaswa kuchunguza tena data kwa hatua hii ili kuona kama kuna matatizo yoyote na data. Ikiwa kuna hitilafu, tunapaswa kurekebisha kosa ikiwa inawezekana, au kufuta data. Ikiwa data ni sahihi, tutaiacha katika kuweka data. Kwa tatizo hili, sisi kudhani kwamba sisi kuchunguza data na kugundua kwamba data hii outlier ilikuwa kosa. Kwa hiyo tutaendelea na kufuta nje, ili tuweze kuchunguza jinsi inavyoathiri matokeo, kama uzoefu wa kujifunza.

    Piga mstari mpya bora zaidi na mgawo wa uwiano kwa kutumia pointi kumi zilizobaki

    Kwenye mahesabu ya TI-83, TI-83+, TI-84+, futa nje kutoka L1 na L2. Kutumia LineRettest, mstari mpya wa kufaa bora na mgawo wa uwiano ni:

    \[\hat{y} = -355.19 + 7.39x\nonumber \]na\[r = 0.9121\nonumber \]

    Mstari mpya na\(r = 0.9121\) ni uwiano mkubwa kuliko asili (\(r = 0.6631\)) kwa sababu\(r = 0.9121\) ni karibu na moja. Hii ina maana kwamba mstari mpya unafaa zaidi kwa maadili kumi ya data iliyobaki. Mstari unaweza kutabiri bora alama ya mtihani wa mwisho kutokana na alama ya tatu ya mtihani.

    Utambulisho wa Nambari ya Outliers: Kuhesabu s na Kutafuta Outliers Manually

    Ikiwa huna kazi LinRegtTest, basi unaweza kuhesabu nje katika mfano wa kwanza kwa kufanya zifuatazo.

    Kwanza, mraba kila\(|y – \hat{y}|\)

    Mraba ni 35, 2; 17, 2; 16, 2; 6, 2; 19; 2; 9, 2; 3; 2; 1, 2; 10, 2; 9, 2; 1; 2.

    Kisha, ongeza (jumla) maneno yote ya\(|y – \hat{y}|\) mraba kwa kutumia formula

    \[ \sum^{11}_{i = 11} (|y_{i} - \hat{y}_{i}|)^{2} = \sum^{11}_{i - 1} \varepsilon^{2}_{i}\nonumber \]

    Kumbuka kwamba

    \[\begin{align*} y_{i} - \hat{y}_{i} &= \varepsilon_{i} \nonumber \\ &= 35^{2} + 17^{2} + 16^{2} + 6^{2} + 19^{2} + 9^{2} + 3^{2} + 1^{2} + 10^{2} + 9^{2} + 1^{2} \nonumber \\ &= 2440 = SSE. \nonumber \end{align*} \]

    Matokeo yake,\(SSE\) ni Jumla ya Makosa ya Squared.

    Kisha, hesabu s, kupotoka kwa kiwango cha\(y - \hat{y} = \varepsilon\) maadili yote ambapo\(n = \text{the total number of data points}\).

    Mahesabu ni

    \[s = \sqrt{\dfrac{SSE}{n-2}}.\nonumber \]

    Kwa mtihani wa tatu/tatizo la mwisho mtihani:

    \[s = \sqrt{\dfrac{2440}{11 - 2}} = 16.47.\nonumber \]

    Ifuatayo,\(s\) ongezea na\(2\):

    \[(2)(16.47) = 32.94\nonumber \]

    \(32.94\)ni\(2\) kiwango deviations mbali na maana ya\(y - \hat{y}\) maadili.

    Ikiwa tungepima umbali wa wima kutoka kwa uhakika wowote wa data hadi hatua inayofanana kwenye mstari wa kufaa bora na umbali huo ni angalau\(2s\), basi tutaona hatua ya data kuwa “mbali sana” kutoka kwenye mstari wa kufaa bora. Sisi wito kwamba uhakika outlier uwezo.

    Kwa mfano, kama yoyote ya\(|y – \hat{y}|\) maadili ni angalau 32.94, sambamba (\(x, y\)) data uhakika ni outlier uwezo.

    Kwa mtihani wa tatu/tatizo la mwisho la mtihani, wote ni chini ya 31.29 isipokuwa kwa kwanza ambayo ni 35.\(|y – \hat{y}|\)

    \(35 > 31.29\)Hiyo ni,\(|y – \hat{y}| \geq (2)(s)\)

    Hatua ambayo inalingana na\(|y – \hat{y}| = 35\) ni\((65, 175)\). Kwa hiyo, hatua ya data\((65,175)\) ni nje ya uwezo. Kwa mfano huu, tutaifuta. (Kumbuka, sisi si mara zote kufuta outlier.)

    KUMBUKA

    Wakati outliers ni ilifutwa, mtafiti lazima aidha rekodi kwamba data ilifutwa, na kwa nini, au mtafiti anatakiwa kutoa matokeo wote na bila data ilifutwa. Kama data ni makosa na maadili sahihi yanajulikana (kwa mfano, mwanafunzi mmoja kweli alifunga 70 badala ya 65), basi marekebisho haya yanaweza kufanywa na data.

    Hatua inayofuata ni kukokotoa mstari mpya unaofaa kwa kutumia pointi kumi zilizobaki. Mstari mpya wa kufaa bora na mgawo wa uwiano ni:

    \[\hat{y} = -355.19 + 7.39x\nonumber \]na\[r = 0.9121\nonumber \]

    Mfano\(\PageIndex{2}\)

    Kwa kutumia mstari huu mpya wa fit bora (kulingana na iliyobaki pointi kumi data katika mtihani wa tatu/mfano wa mwisho mtihani), nini mwanafunzi ambaye anapata 73 juu ya mtihani wa tatu kutarajia kupokea juu ya mtihani wa mwisho? Je, hii ni sawa na utabiri uliofanywa kwa kutumia mstari wa awali?

    Jibu

    Kutumia mstari mpya wa fit bora,\(\hat{y} = -355.19 + 7.39(73) = 184.28\). Mwanafunzi ambaye alifunga pointi 73 kwenye mtihani wa tatu angetarajia kupata pointi 184 kwenye mtihani wa mwisho.

    Mstari wa awali ulitabiri\(\hat{y} = -173.51 + 4.83(73) = 179.08\) hivyo utabiri kwa kutumia mstari mpya na nje ya kuondolewa hutofautiana na utabiri wa awali.

    Zoezi\(\PageIndex{2}\)

    Vipengele vya data kwa ajili ya utafiti uliofanywa ni kama ifuatavyo: (1, 5), (2, 7), (2, 6), (3, 9), (4, 12), (4, 13), (5, 18), (6, 19), (7, 12), na (7, 21). Ondoa nje na urekebishe mstari wa kufaa bora. Pata thamani ya wakati x = 10.

    Jibu

    \(\hat{y} = 1.04 + 2.96x; 30.64\)

    Mfano\(\PageIndex{3}\): The Consumer Price Index

    Nambari ya Bei ya Watumiaji (CPI) inapima mabadiliko ya wastani kwa muda katika bei zinazolipwa na watumiaji wa miji kwa bidhaa na huduma za walaji. CPI huathiri karibu Wamarekani wote kwa sababu ya njia nyingi zinazotumiwa. Moja ya matumizi yake makubwa ni kama kipimo cha mfumuko wa bei. Kwa kutoa taarifa kuhusu mabadiliko ya bei katika uchumi wa Taifa kwa serikali, biashara, na kazi, CPI huwasaidia kufanya maamuzi ya kiuchumi. Rais, Congress, na Bodi ya Hifadhi ya Shirikisho hutumia mwenendo wa CPI kuunda sera za fedha na fedha. Katika jedwali lifuatalo,\(x\)\(y\) ni mwaka na ni CPI.

    Data
    \(x\) \(y\) \(x\) \(y\)
    \ (x\) ">1915 \ (y\) ">10.1 \ (x\) ">1969 \ (y\) ">36.7
    \ (x\) ">1926 \ (y\) ">17.7 \ (x\) "> 1975 \ (y\) "> 49.3
    \ (x\) ">1935 \ (y\) ">13.7 \ (x\) ">1979 \ (y\) ">72.6
    \ (x\) ">1940 \ (y\) ">14.7 \ (x\) ">1980 \ (y\) ">82.4
    \ (x\) ">1947 \ (y\) ">24.1 \ (x\) ">1986 \ (y\) "> 109.6
    \ (x\) ">1952 \ (y\) ">26.5 \ (x\) ">1991 \ (y\) ">130.7
    \ (x\) ">1964 \ (y\) ">31.0 \ (x\) ">1999 \ (y\) "> 166.6
    1. Chora scatterplot ya data.
    2. Tumia mstari mdogo wa mraba. Andika equation katika fomu = a + bx.
    3. Chora mstari kwenye njama ya kuwatawanya.
    4. Pata mgawo wa uwiano. Je, ni muhimu?
    5. Ni nini wastani wa CPI kwa mwaka 1990?

    Jibu

    1. Angalia Kielelezo.
    2. \(\hat{y} = -3204 + 1.662x\)ni equation ya mstari wa fit bora.
    3. \(r = 0.8694\)
    4. Idadi ya pointi za data ni\(n = 14\). Tumia 95% Maadili muhimu ya meza ya Mfano wa uwiano wa Mfano mwishoni mwa Sura ya 12. \(n - 2 = 12\). Thamani muhimu ya sambamba ni 0.532. Tangu 0.8694> 0.532, r ni muhimu.

      \[\hat{y} = -3204 + 1.662(1990) = 103.4 \text{CPI}\nonumber \]

    5. Kutumia linRegtest calculator, tunaona kwamba\(s = 25.4\); graphing mistari\(Y2 = -3204 + 1.662X – 2(25.4)\) na\(Y3 = -3204 + 1.662X + 2(25.4)\) inaonyesha kwamba hakuna maadili data ni nje ya mistari wale, kutambua hakuna outliers. (Kumbuka kuwa mwaka 1999 ulikuwa karibu sana na mstari wa juu, lakini bado ndani yake.)
    Kusambaza njama na mstari wa fit bora ya data ya bei ya walaji, kwenye mhimili wa y, na data ya mwaka, kwenye x-axis.
    Kielelezo 12.7.3.

    KUMBUKA

    Katika mfano, angalia mfano wa pointi ikilinganishwa na mstari. Ingawa mgawo wa uwiano ni muhimu, mfano katika scatterplot unaonyesha kwamba Curve itakuwa mfano sahihi zaidi kutumia kuliko mstari. Katika mfano huu, mwanatakwimu anapaswa kupendelea kutumia mbinu zingine ili kufaa safu kwa data hii, badala ya mfano wa data na mstari tuliyopata. Mbali na kufanya mahesabu, daima ni muhimu kuangalia scatterplot wakati wa kuamua kama mfano wa mstari unafaa.

    Ikiwa una nia ya kuona data zaidi ya miaka, tembelea tovuti ya Takwimu za Kazi ya CPI ftp://ftp.bls.gov/pub/special.requests/cpi/cpiai.txt; data yetu inachukuliwa kutoka kwenye safu inayoitwa “Avg ya Mwaka.” (safu ya tatu kutoka kulia). Kwa mfano unaweza kuongeza zaidi ya miaka ya sasa ya data. Jaribu kuongeza miaka ya hivi karibuni: 2004:\(\text{CPI} = 188.9\); 2008:\(\text{CPI} = 215.3\); 2011:\(\text{CPI} = 224.9\). Angalia jinsi unaathiri mfano. (Angalia:\(\hat{y} = -4436 + 2.295x\);\(r = 0.9018\). Ni\(r\) muhimu? Je, inafaa zaidi na kuongeza ya pointi mpya?)

    Zoezi\(\PageIndex{3}\)

    Jedwali lifuatalo linaonyesha maendeleo ya kiuchumi yaliyopimwa kwa kila kipato cha PCINC.

    Mwaka PCINC Mwaka PCINC
    1870 340 1920 1050
    1880 499 1930 1170
    1890 592 1940 1364
    1900 757 1950 1836
    1910 927 1960 2132
    1. Je, ni vigezo vya kujitegemea na tegemezi gani?
    2. Chora njama ya kutawanya.
    3. Tumia regression ili kupata mstari wa kufaa bora na mgawo wa uwiano.
    4. Tafsiri umuhimu wa mgawo wa uwiano.
    5. Je, kuna uhusiano linear kati ya vigezo?
    6. Pata mgawo wa uamuzi na uifasiri.
    7. Je, ni mteremko wa equation ya kurudi nyuma? Ina maana gani?
    8. Tumia mstari wa fit bora kukadiria PCINC kwa 1900, kwa 2000.
    9. Kuamua kama kuna nje yoyote.
    Jibu

    Variable huru (x) ni mwaka na variable tegemezi (y) ni mapato ya kila mtu.

    Jibu b

    Kielelezo 12.7.4.

    Jibu c

    \(\hat{y} = 18.61x – 34574\);\(r = 0.9732\)

    Jibu d

    Katika\(df = 8\), thamani muhimu ni\(0.632\). \(r\)Thamani ni muhimu kwa sababu ni kubwa kuliko thamani muhimu.

    Jibu e

    Kuna inaonekana kuwa uhusiano linear kati ya vigezo.

    Jibu la

    Mgawo wa uamuzi ni\(0.947\), ambayo ina maana kwamba 94.7% ya tofauti katika PCINC inaelezewa na tofauti katika miaka.

    Jibu g na h

    Mteremko wa equation ya kurudi nyuma ni 18.61, na inamaanisha kwamba mapato ya kila mtu huongezeka kwa $18.61 kwa kila mwaka unaopita. \(\hat{y} = 785\)wakati mwaka ni 1900, na\(\hat{y} = 2,646\) wakati wa mwaka ni 2000.

    Jibu i

    Hatuonekani kuwa na nje yoyote.

    Maadili muhimu ya 95% ya Jedwali la Mgawo wa Mfano

    Degrees ya Uhuru:\(n – 2\) Maadili muhimu: (+ na -)
    \ (n - 2\) ">1 0.997
    \ (n - 2\) "> 2 0.950
    \ (n - 2\) ">3 0.878
    \ (n - 2\) ">4 0.811
    \ (n - 2\) "> 5 0.754
    \ (n - 2\) ">6 0.707
    \ (n - 2\) ">7 0.666
    \ (n - 2\) ">8 0.632
    \ (n - 2\) ">9 0.602
    \ (n - 2\) ">10 0.576
    \ (n - 2\) ">11 0.555
    \ (n - 2\) ">12 0.532
    \ (n - 2\) ">13 0.514
    \ (n - 2\) ">14 0.497
    \ (n - 2\) ">15 0.482
    \ (n - 2\) ">16 0.468
    \ (n - 2\) ">17 0.456
    \ (n - 2\) ">18 0.444
    \ (n - 2\) ">19 0.433
    \ (n - 2\) ">20 0.423
    \ (n - 2\) ">21 0.413
    \ (n - 2\) ">22 0.404
    \ (n - 2\) ">23 0.396
    \ (n - 2\) ">24 0.388
    \ (n - 2\) ">25 0.381
    \ (n - 2\) ">26 0.374
    \ (n - 2\) ">27 0.367
    \ (n - 2\) ">28 0.361
    \ (n - 2\) ">29 0.355
    \ (n - 2\) ">30 0.349
    \ (n - 2\) ">40 0.304
    \ (n - 2\) ">50 0.273
    \ (n - 2\) ">60 0.250
    \ (n - 2\) ">70 0.232
    \ (n - 2\) ">80 0.217
    \ (n - 2\) ">90 0.205
    \ (n - 2\) ">100 0.195

    Muhtasari

    Kuamua kama hatua ni ya nje, fanya moja ya yafuatayo:

    1. Ingiza equations zifuatazo katika TI 83, 83+,84, 84+:
      \[y_{1} = a + bx\nonumber \]
      \[y_{2} = a + bx +2s\nonumber \]
      \[y_{3} = a + bx - 2s\nonumber \]
      wapi\(s\) kiwango kupotoka ya mabaki

      Kama hatua yoyote ni juu\(y_{2}\) au chini\(y_{3}\) basi uhakika ni kuchukuliwa kuwa outlier.
    2. Tumia mabaki na ulinganishe maadili yao kamili kwa\(2s\)\(s\) wapi kupotoka kwa kiwango cha mabaki. Ikiwa thamani kamili ya mabaki yoyote ni kubwa kuliko au sawa\(2s\), basi hatua inayofanana ni ya nje.

    Kumbuka: Kazi ya calculator LinRettest (STATS VIPIMO LineRettest) huhesabu\(s\).

    Marejeo

    1. Takwimu kutoka Kamati ya Njia na Njia za Nyumba, Idara ya Afya na Huduma za Binadamu.
    2. Data kutoka Microsoft Bookshelf.
    3. Takwimu kutoka Idara ya Kazi ya Marekani, Ofisi ya Takwimu za Kazi.
    4. Takwimu kutoka Handbook Daktari, 1990.
    5. Takwimu kutoka Idara ya Kazi ya Marekani, Ofisi ya Takwimu za Kazi.

    faharasa

    Nje
    uchunguzi ambao haufanani na data zote