Skip to main content
Global

13.1: Mgawo wa uwiano r

  • Page ID
    179842
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Tunapoanza sehemu hii tunaona kwamba aina ya data tutakayofanya kazi na imebadilika. Labda haijulikani, data zote tumekuwa tukitumia ni kwa variable moja. Inaweza kuwa kutoka sampuli mbili, lakini bado ni variable univariate. Aina ya data ilivyoelezwa katika mifano hapo juu na kwa mfano wowote wa sababu na athari ni data ya bivariate — “bi” kwa vigezo viwili. Kwa kweli, wanatakwimu hutumia data ya multivariate, maana ya vigezo vingi.

    Kwa kazi yetu tunaweza kuainisha data katika makundi matatu pana, data ya mfululizo wa wakati, data ya sehemu ya msalaba, na data ya jopo. Tulikutana na mbili za kwanza mapema sana. Takwimu za mfululizo wa muda hupima kitengo kimoja cha uchunguzi; sema mtu, au kampuni au nchi, wakati unapopita. Ni kipimo gani kitakuwa angalau sifa mbili, sema mapato ya mtu, kiasi cha mema fulani wanayoinunua na bei waliyoyolipa. Hii itakuwa vipande vitatu vya habari katika kipindi cha wakati mmoja, sema 1985. Kama sisi ikifuatiwa kwamba mtu katika muda tutakuwa na vipande wale huo wa habari kwa 1985,1986, 1987, nk Hii itakuwa kuanzisha mara mfululizo data kuweka. Ikiwa tulifanya hivyo kwa miaka 10 tungekuwa na vipande 30 vya habari kuhusu tabia za matumizi ya mtu huyu kwa manufaa haya kwa miaka kumi iliyopita na tungependa kujua mapato yao na bei waliyoyolipa.

    Aina ya pili ya kuweka data ni kwa data ya sehemu ya msalaba. Hapa tofauti sio wakati kwa kitengo kimoja cha uchunguzi, lakini katika vitengo vya uchunguzi wakati wa hatua moja kwa wakati. Kwa kipindi fulani cha muda tungekusanya bei iliyolipwa, kiasi cha kununuliwa, na mapato ya watu wengi binafsi.

    Aina ya tatu ya kuweka data ni data ya jopo. Hapa jopo la vitengo vya uchunguzi hufuatiwa wakati wote. Kama sisi kuchukua mfano wetu kutoka juu tunaweza kufuata 500 watu, kitengo cha uchunguzi, kupitia muda, miaka kumi, na kuchunguza mapato yao, bei kulipwa na wingi wa nzuri kununuliwa. Kama tulikuwa na watu 500 na data kwa miaka kumi kwa bei, mapato na wingi kununuliwa tungekuwa na vipande 15,000 vya habari. Aina hizi za seti za data ni ghali sana kujenga na kudumisha. Wao, hata hivyo, hutoa kiasi kikubwa cha habari ambacho kinaweza kutumika kujibu maswali muhimu sana. Kwa mfano, ni nini athari juu ya kiwango cha ushiriki wa nguvu za kazi ya wanawake kama familia yao ya asili, mama na baba, umri? Au kuna madhara tofauti juu ya matokeo ya afya kulingana na umri ambapo mtu alianza kuvuta sigara? Takwimu za jopo pekee zinaweza kutoa majibu ya maswali haya na yanayohusiana kwa sababu tunapaswa kufuata watu wengi kwa wakati. Kazi tunayofanya hapa hata hivyo haitakuwa sahihi kabisa kwa seti za data kama hizi.

    Kuanzia na seti ya data na vigezo viwili vya kujitegemea tunauliza swali: Je, hizi zinahusiana? Njia moja ya kuibua jibu swali hili ni kuunda njama ya kutawanya ya data. Hatukuweza kufanya hivyo kabla ya wakati sisi walikuwa kufanya takwimu maelezo kwa sababu data hizo walikuwa univariate. Sasa tuna data ya bivariate ili tuweze kupanga njama kwa vipimo viwili. Vipimo vitatu vinawezekana kwenye kipande cha gorofa, lakini kuwa vigumu sana kufikiria kikamilifu. Bila shaka, zaidi ya vipimo vitatu haviwezi kuchapishwa ingawa mahusiano yanaweza kupimwa kihisabati.

    Ili kutoa usahihi wa hisabati kwa kipimo cha kile tunachokiona tunatumia mgawo wa uwiano. Uwiano hutuambia kitu kuhusu ushirikiano wa harakati za vigezo viwili, lakini hakuna kitu kuhusu kwa nini harakati hii ilitokea. Rasmi, uchambuzi wa uwiano unafikiri kwamba vigezo vyote vinavyochambuliwa ni vigezo vya kujitegemea. Hii inamaanisha kwamba hakuna mtu anayesababisha harakati kwa upande mwingine. Zaidi ya hayo, ina maana kwamba wala variable ni tegemezi kwa wengine, au kwa jambo hilo, juu ya variable nyingine yoyote. Hata kwa mapungufu haya, uchambuzi wa uwiano unaweza kutoa matokeo ya kuvutia.

    Mgawo wa uwiano, ρ (hutamkwa rho), ni takwimu za hisabati kwa idadi ya watu ambayo inatupa kipimo cha nguvu ya uhusiano wa mstari kati ya vigezo viwili. Kwa sampuli ya data, takwimu, r, zilizotengenezwa na Karl Pearson katika miaka ya 1900 mapema, ni makadirio ya uwiano wa idadi ya watu na hufafanuliwa hesabu kama:

    \[r=\frac{\frac{1}{n-1} \Sigma\left(X_{1 i}-\overline{X}_{1}\right)\left(X_{2 i}-\overline{X}_{2}\right)}{s_{x_{1}} s_{x_{2}}}\nonumber\]

    AU

    \[r=\frac{\sum X_{1 i} X_{2 i}-n \overline{X}_{1}-\overline{X}_{2}}{\sqrt{\left(\Sigma X_{1 i}^{2}-n \overline{X}_{1}^{2}\right)\left(\Sigma X_{2 i}^{2}-n \overline{X}_{2}^{2}\right)}}\nonumber\]

    wapi\(sx_1\) na\(sx_2\) ni kupotoka kiwango cha vigezo mbili huru\(X_1\) na\(X_2\),\(\overline{X}_{1}\) na\(\overline{X}_{2}\) ni sampuli njia ya vigezo mbili, na\(X_{1i}\) na\(X_{2i}\) ni uchunguzi wa mtu binafsi wa\(X_1\) na\(X_2\). Mgawo wa uwiano\(r\) ni kati ya thamani kutoka -1 hadi 1. Fomu ya pili sawa hutumiwa mara nyingi kwa sababu inaweza kuwa rahisi kwa hesabu. Kama inatisha kama fomula hizi kuangalia wao ni kweli tu uwiano wa covariance kati ya vigezo mbili na bidhaa ya deviations yao mbili kiwango. Hiyo ni kusema, ni kipimo cha tofauti za jamaa.

    Katika mazoezi yote uwiano na regression uchambuzi zitatolewa kupitia programu ya kompyuta iliyoundwa kwa madhumuni haya. Kitu chochote zaidi ya uchunguzi wa nusu moja ya nusu hujenga matatizo makubwa ya computational. Ilikuwa kwa sababu ya ukweli huu kwamba uwiano, na hata zaidi, kurudi nyuma, haukutumiwa sana zana za utafiti mpaka baada ya kuja kwa “mashine za kompyuta”. Sasa nguvu za kompyuta zinazohitajika kuchambua data kwa kutumia vifurushi vya kurudi nyuma huonekana karibu kidogo kwa kulinganisha na muongo mmoja uliopita.

    Kwa taswira uhusiano wowote linear ambayo inaweza kuwepo kupitia njama ya michoro kutawanya ya data sanifu. Kielelezo\(\PageIndex{2}\) inatoa michoro kadhaa kutawanya na thamani mahesabu ya r. katika paneli (a) na (b) taarifa kwamba data kwa ujumla mwenendo pamoja, (a) zaidi na (b) kushuka. Jopo (a) ni mfano wa uwiano mzuri na jopo (b) ni mfano wa uwiano hasi, au uhusiano. Ishara ya mgawo wa uwiano inatuambia ikiwa uhusiano ni chanya au hasi (inverse) moja. Ikiwa maadili yote ya\(X_1\) na\(X_2\) ni kwenye mstari wa moja kwa moja, mgawo wa uwiano utakuwa ama\(1\) au\(-1\) kutegemea kama mstari una mteremko mzuri au hasi na karibu na moja au hasi, nguvu uhusiano kati ya vigezo viwili. LAKINI DAIMA KUMBUKA KWAMBA MGAWO UWIANO HAINA KUTUAMBIA MTEREMKO.

    Kielelezo\(\PageIndex{2}\)

    Kumbuka, mgawo wote uwiano inatuambia ni kama au data ni linearly kuhusiana. Katika jopo (d) vigezo ni wazi kuwa na aina fulani ya uhusiano maalum sana kwa kila mmoja, lakini uwiano mgawo ni sifuri, kuonyesha hakuna uhusiano linear ipo.

    Ikiwa unashutumu uhusiano wa mstari kati\(X_1\) na\(X_2\) kisha\(r\) unaweza kupima jinsi uhusiano wa mstari ulivyo na nguvu.

    Nini VALUE ya\(r\) inatuambia:

    • Nini ishara ya\(r\) inatuambia
      • “uwiano haimaanishi causation.”