Skip to main content
Global

1.2: Data, Sampuli, na Tofauti katika Data na Sampuli

  • Page ID
    179337
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Takwimu zinaweza kuja kutoka kwa idadi ya watu au kutoka sampuli. Barua za chini kama\(x\) au\(y\) kwa ujumla hutumiwa kuwakilisha maadili ya data. Data nyingi zinaweza kuwekwa katika makundi yafuatayo:

    • Ustahili
    • Kiasi

    Takwimu zinazofaa ni matokeo ya kuainisha au kuelezea sifa za idadi ya watu. Takwimu zinazofaa pia huitwa data ya categorical. Rangi ya nywele, aina ya damu, kikundi cha kikabila, gari ambalo mtu anaendesha, na barabara ambayo mtu anaishi ni mifano ya data ya ubora (categorical). Takwimu zinazofaa (categorical) zinaelezewa kwa maneno au barua. Kwa mfano, rangi ya nywele inaweza kuwa nyeusi, hudhurungi, hudhurungi, blonde, kijivu, au nyekundu. Aina ya damu inaweza kuwa AB+, O-, au B+. Watafiti mara nyingi wanapendelea kutumia data kiasi juu ya data ya ubora (categorical) kwa sababu inajitokeza kwa urahisi zaidi kwa uchambuzi wa hisabati. Kwa mfano, haina maana ya kupata rangi ya nywele wastani au aina ya damu.

    Takwimu za kiasi daima ni namba. Takwimu za kiasi ni matokeo ya kuhesabu au kupima sifa za idadi ya watu. Kiasi cha fedha, kiwango cha vurugu, uzito, idadi ya watu wanaoishi katika mji wako, na idadi ya wanafunzi ambao huchukua takwimu ni mifano ya data ya kiasi. Data ya kiasi inaweza kuwa ama discrete au kuendelea.

    Data zote ambazo ni matokeo ya kuhesabu zinaitwa data ya kiasi kikubwa. Takwimu hizi zinachukua maadili fulani ya namba. Ikiwa utahesabu idadi ya simu unayopokea kwa kila siku ya juma, unaweza kupata maadili kama vile sifuri, moja, mbili, au tatu.

    Takwimu ambazo sio tu zinazoundwa na namba za kuhesabu, lakini ambazo zinaweza kujumuisha sehemu ndogo, decimals, au namba zisizo na maana, zinaitwa data inayoendelea ya kiasi. Data inayoendelea mara nyingi ni matokeo ya vipimo kama urefu, uzito, au nyakati. Orodha ya urefu kwa dakika kwa simu zote unazofanya kwa wiki, na namba kama 2.4, 7.5, au 11.0, itakuwa data inayoendelea.

    Mfano\(\PageIndex{1}\): DATA SAMPLE OF QUANTITATIVE DISCRETE DATA

    Takwimu ni idadi ya vitabu wanafunzi wanaobeba katika mifuko yao ya nyuma. Wewe sampuli wanafunzi watano. Wanafunzi wawili hubeba vitabu vitatu, mwanafunzi mmoja hubeba vitabu vinne, mwanafunzi mmoja hubeba vitabu viwili, na mwanafunzi mmoja hubeba kitabu kimoja Idadi ya vitabu (tatu, nne, mbili, na moja) ni data ya kiasi kikubwa.

    Zoezi\(\PageIndex{1}\)

    Takwimu ni idadi ya mashine katika mazoezi. Wewe sampuli gyms tano. Gym moja ina mashine 12, mazoezi moja ina mashine 15, mazoezi moja ina mashine kumi, mazoezi moja ina mashine 22, na mazoezi mengine ina mashine 20. Ni aina gani ya data hii?

    Mfano\(\PageIndex{2}\): DATA SAMPLE OF QUANTITATIVE CONTINUOUS DATA

    Takwimu ni uzito wa mifuko ya nyuma na vitabu ndani yao. Wewe sampuli huo wanafunzi watano. Uzito (kwa paundi) ya magunia yao ni 6.2, 7, 6.8, 9.1, 4.3. Angalia kwamba magunia ya kubeba vitabu vitatu yanaweza kuwa na uzito tofauti. Uzito ni kiasi data kuendelea.

    Zoezi\(\PageIndex{2}\)

    Takwimu ni maeneo ya lawns katika miguu ya mraba. Wewe sampuli nyumba tano. Maeneo ya lawn ni 144 sq. miguu, 160 sq. miguu, 190 sq. miguu, 180 sq. miguu, na 210 sq. miguu. Ni aina gani ya data hii?

    Mfano\(\PageIndex{3}\)

    Unakwenda maduka makubwa na kununua makopo matatu ya supu (19 ounces) nyanya bisque, 14.1 ounces lenti, na ounces 19 (harusi ya Italia), vifurushi viwili vya karanga (walnuts na karanga), aina nne za mboga (broccoli, cauliflower, mchicha, na karoti), na desserts mbili (16 ounces pistachio ice cream na 32 ounces chocolate Chip cookies

    Jina seti data kwamba ni kiasi discrete, upimaji kuendelea, na ubora (categorical).

    Jibu

    Suluhisho moja linalowezekana:

    • Makopo matatu ya supu, vifurushi viwili vya karanga, aina nne za mboga mboga na desserts mbili ni data ya kiasi kikubwa kwa sababu unawahesabu.
    • Uzito wa supu (19 ounces, 14.1 ounces, 19 ounces) ni data ya kuendelea kwa sababu unapima uzito iwezekanavyo.
    • Aina ya supu, karanga, mboga mboga na desserts ni data ya ubora (categorical) kwa sababu ni categorical.

    Jaribu kutambua seti za ziada za data katika mfano huu.

    Mfano\(\PageIndex{4}\)

    Takwimu ni rangi ya mifuko ya nyuma. Tena, wewe sampuli huo wanafunzi watano. Mwanafunzi mmoja ana backpack nyekundu, wanafunzi wawili wana magunia nyeusi, mwanafunzi mmoja ana mkoba wa kijani, na mwanafunzi mmoja ana mkoba wa kijivu. Rangi nyekundu, nyeusi, nyeusi, kijani, na kijivu ni data ya ubora (categorical).

    Zoezi\(\PageIndex{4}\)

    Takwimu ni rangi ya nyumba. Wewe sampuli nyumba tano. Rangi ya nyumba ni nyeupe, njano, nyeupe, nyekundu, na nyeupe. Ni aina gani ya data hii?

    Unaweza kukusanya data kama namba na ripoti hiyo kwa makundi. Kwa mfano, alama za jaribio kwa kila mwanafunzi zimeandikwa wakati wote. Mwishoni mwa muda, alama za jaribio zinaripotiwa kama A, B, C, D, au F

    Mfano\(\PageIndex{5}\)

    Kazi kwa kushirikiana kuamua aina sahihi ya data (kiasi au ubora). Onyesha kama data ya kiasi ni ya kuendelea au ya kipekee. Kidokezo: Data ambayo ni ya kipekee mara nyingi huanza na maneno “idadi ya.”

    1. idadi ya jozi ya viatu unayo nayo
    2. aina ya gari unayoendesha
    3. umbali kutoka nyumbani kwako hadi duka la vyakula karibu
    4. idadi ya madarasa unayochukua kwa mwaka wa shule
    5. aina ya calculator unayotumia
    6. uzito wa wrestlers Sumo
    7. idadi ya majibu sahihi juu ya jaribio
    8. IQ alama (Hii inaweza kusababisha baadhi ya majadiliano.)
    Jibu

    Vitu a, d, na g ni kiasi kikubwa; vitu c, f, na h ni kiasi kinachoendelea; vitu b na e ni ubora, au categorical.

    Zoezi\(\PageIndex{5}\)

    Kuamua aina sahihi ya data (kiasi au ubora) kwa idadi ya magari katika kura ya maegesho. Onyesha kama data ya kiasi ni ya kuendelea au ya kipekee.

    Mfano\(\PageIndex{6}\)

    Profesa wa takwimu hukusanya taarifa kuhusu uainishaji wa wanafunzi wake kama freshmen, sophomores, juniors, au wazee. Data anayokusanya ni muhtasari katika chati ya pie Kielelezo 1.2. Ni aina gani ya data ambayo grafu hii inaonyesha?

    Hii ni chati ya pie inayoonyesha uainishaji wa darasa la wanafunzi wa takwimu. chati ina 4 sehemu kinachoitwa Freshman, Sophomore, Junior, Senior. Swali linaulizwa chini ya chati ya pie: ni aina gani ya data inayoonyesha grafu hii?

    Kielelezo 1.2

    Jibu

    Chati hii ya pie inaonyesha wanafunzi kila mwaka, ambayo ni data ya ubora (au categorical).

    Zoezi\(\PageIndex{6}\)

    Msajili katika Chuo Kikuu cha Jimbo anaweka rekodi ya idadi ya masaa ya mikopo wanafunzi kukamilisha kila muhula. Data anayokusanya ni muhtasari katika histogram. Mipaka ya darasa ni 10 hadi chini ya 13, 13 hadi chini ya 16, 16 hadi chini ya 19, 19 hadi chini ya 22, na 22 hadi chini ya 25.

    Histogram hii ina baa 5 na x-axis alama katika vipindi vya 3 kutoka 10 - 25, na y-axis katika nyongeza ya 100 kutoka 0 - 800. Urefu wa baa unaonyesha idadi ya wanafunzi katika kila kipindi.
    Kielelezo 1.3

    Ni aina gani ya data ambayo grafu hii inaonyesha?

    Majadiliano ya Data yenye ubora

    Chini ni meza kulinganisha idadi ya muda na muda wanafunzi katika De Anza College na Foothill College waliojiunga kwa spring 2010 robo. Majedwali yanaonyesha makosa (frequency) na asilimia au uwiano (masafa ya jamaa). Nguzo za asilimia hufanya kulinganisha makundi sawa katika vyuo viwe rahisi. Kuonyesha asilimia pamoja na namba mara nyingi husaidia, lakini ni muhimu hasa wakati kulinganisha seti za data ambazo hazina jumla sawa, kama vile uandikishaji wa jumla kwa vyuo viwili katika mfano huu. Angalia ni kiasi gani kikubwa cha asilimia kwa wanafunzi wa sehemu ya muda katika Chuo cha Foothill kinalinganishwa na Chuo cha De Anza.

    Jedwali\(\PageIndex{1}\): Muda wa Kuanguka 2007 (Siku ya Sensa)
    Chuo cha De Anza Chuo cha Foothill
    Idadi Asilimia Idadi Asilimia
    Muda 9,200 40.9% Muda 4,059 28.6%
    Sehemu ya muda 13,296 59.1% Sehemu ya muda 10,124 71.4%
    Jumla 22,496 100% Jumla 14,183 100%

    Majedwali ni njia nzuri ya kuandaa na kuonyesha data. Lakini grafu inaweza kuwa na manufaa zaidi katika kuelewa data. Hakuna sheria kali kuhusu grafu zinazotumia. Grafu mbili ambazo hutumiwa kuonyesha data ya ubora (categorical) ni chati za pie na grafu za bar.

    • Katika chati ya pie, makundi ya data yanawakilishwa na wedges katika mduara na ni sawa na ukubwa na asilimia ya watu binafsi katika kila jamii.
    • Katika grafu ya bar, urefu wa bar kwa kila jamii ni sawa na idadi au asilimia ya watu binafsi katika kila jamii. Baa inaweza kuwa wima au usawa.
    • Chati ya Pareto ina baa zinazopangwa kwa utaratibu kwa ukubwa wa jamii (kubwa hadi ndogo).

    Angalia Kielelezo 1.5 na ueleze ambayo grafu (pie au bar) unafikiri inaonyesha kulinganisha bora.

    Ni wazo nzuri kuangalia grafu mbalimbali ili kuona ambayo ni muhimu zaidi katika kuonyesha data. Tunaweza kufanya uchaguzi tofauti wa kile tunachofikiri ni graph “bora” kulingana na data na muktadha. Uchaguzi wetu pia unategemea kile tunachotumia data.

    Kielelezo 1.4a
    Kielelezo 1.4B

    Kielelezo 1.5

    Asilimia Hiyo Kuongeza Zaidi (au Chini) ya 100%

    Wakati mwingine asilimia huongeza kuwa zaidi ya 100% (au chini ya 100%). Katika grafu, asilimia huongeza zaidi ya 100% kwa sababu wanafunzi wanaweza kuwa katika jamii zaidi ya moja. Grafu ya bar inafaa kulinganisha ukubwa wa jamaa wa makundi. Chati ya pai haiwezi kutumika. Pia haikuweza kutumika kama asilimia aliongeza kwa chini ya 100%.

    Jedwali\(\PageIndex{2}\): De Anza Chuo Spring 2010
    Tabia/jamii Asilimia
    Wanafunzi wa wakati wote 40.9%
    Wanafunzi ambao wana nia ya kuhamisha taasisi ya elimu ya miaka 4 48.6%
    Wanafunzi chini ya umri wa miaka 25 61.0%
    JUMLA 150.5%
    Kielelezo\(\PageIndex{2}\)

    Kusitisha Makundi/Data ya kukosa

    Jedwali linaonyesha Ukabila wa Wanafunzi lakini haupo jamii ya “Nyingine/Haijulikani”. Jamii hii ina watu ambao hawakujisikia wanafaa katika makundi yoyote ya ukabila au walikataa kujibu. Angalia kwamba masafa hayaongeze hadi idadi ya wanafunzi. Katika hali hii, tengeneza grafu ya bar na si chati ya pie.

    Jedwali\(\PageIndex{3}\): Ukabila wa Wanafunzi katika De Anza College Fall Term 2007 (Siku ya sensa)
    Marudio Asilimia
    Kiasia 8,794 36.1%
    Nyeusi 1,412 5.8%
    Kifilipino 1,298 5.3%
    Kihispania 4,180 17.1%
    Wenyeji wa Marekani 146 0.6%
    Kisiwa cha Pasifiki 236 1.0%
    Nyeupe 5,978 24.5%
    JUMLA 22,044 kati ya 24,382 90.4% kati ya 100%
    Kielelezo\(\PageIndex{3}\)

    Grafu ifuatayo ni sawa na grafu ya awali lakini asilimia “Nyingine/haijulikani” (9.6%) imejumuishwa. Jamii ya “Nyingine/Haijulikani” ni kubwa ikilinganishwa na baadhi ya makundi mengine (Wenyeji wa Marekani, 0.6%, Kisiwa cha Pasifiki 1.0%). Hii ni muhimu kujua wakati tunafikiri juu ya nini data inatuambia.

    Grafu hii ya bar katika Kielelezo 1.9 ni chati ya Pareto. Chati ya Pareto ina baa zilizopangwa kutoka kubwa hadi ndogo na ni rahisi kusoma na kutafsiri.

    Kielelezo\(\PageIndex{4}\): Grafu ya Bar na Jamii Nyingine/isiyojulikana

    Kielelezo\(\PageIndex{4}\): Chati ya Pareto Na Baa Iliyopangwa kwa Ukubwa

    Chati za Pie: Hakuna Data Missing

    Chati za pai zifuatazo zina jamii ya “Other/Unknown” ikiwa ni pamoja na (kwa kuwa asilimia lazima ziongeze hadi 100%). Chati katika Kielelezo 1.10.

    Kielelezo\(\PageIndex{5}\): Weka Maelezo Hapa

    Sampuli

    Kukusanya taarifa kuhusu idadi ya watu wote mara nyingi gharama nyingi sana au haiwezekani. Badala yake, tunatumia sampuli ya idadi ya watu. Sampuli inapaswa kuwa na sifa sawa na idadi ya watu wanaowakilisha. Wanatakwimu wengi hutumia mbinu mbalimbali za sampuli ya random katika jaribio la kufikia lengo hili. Sehemu hii itaelezea njia kadhaa za kawaida. Kuna mbinu mbalimbali za sampuli ya random. Katika kila aina ya sampuli ya random, kila mwanachama wa idadi ya watu awali ana nafasi sawa ya kuchaguliwa kwa sampuli. Kila njia ina faida na hasara. Njia rahisi ya kuelezea inaitwa sampuli rahisi ya random. Kundi lolote la watu binafsi n ni sawa uwezekano wa kuchaguliwa kama kundi lolote la\(n\) watu binafsi kama rahisi random sampuli mbinu hutumiwa. Kwa maneno mengine, kila sampuli ya ukubwa sawa ina nafasi sawa ya kuchaguliwa.

    Mbali na sampuli rahisi ya random, kuna aina nyingine za sampuli zinazohusisha mchakato wa nafasi ya kupata sampuli. Nyingine maalumu mbinu random sampuli ni stratified sampuli, nguzo sampuli, na sampuli utaratibu.

    Kuchagua sampuli stratified, kugawanya idadi ya watu katika makundi kuitwa strata na kisha kuchukua idadi proportion kutoka kila stratum. Kwa mfano, unaweza stratify (kundi) idadi yako ya chuo na idara na kisha kuchagua proportionate rahisi random sampuli kutoka kila stratum (kila idara) kupata stratified random sampuli. Kuchagua sampuli rahisi ya random kutoka kila idara, nambari kila mwanachama wa idara ya kwanza, nambari kila mwanachama wa idara ya pili, na ufanye hivyo kwa idara zilizobaki. Kisha kutumia sampuli rahisi random kuchagua idadi proportion kutoka idara ya kwanza na kufanya hivyo kwa kila idara iliyobaki. Nambari hizo zilichukua kutoka idara ya kwanza, zilichukua kutoka idara ya pili, na kadhalika zinawakilisha wanachama ambao hufanya sampuli iliyokatwa.

    Ili kuchagua sampuli ya nguzo, ugawanye idadi ya watu katika makundi (makundi) na kisha nasibu kuchagua baadhi ya makundi. Wanachama wote kutoka makundi haya ni katika sampuli ya nguzo. Kwa mfano, kama nasibu sampuli idara nne kutoka idadi ya watu chuo yako, idara nne kufanya juu ya nguzo sampuli. Gawanya kitivo chako cha chuo na idara. Idara ni makundi. Idadi ya kila idara, na kisha kuchagua namba nne tofauti kwa kutumia rahisi random sampuli. Wanachama wote wa idara nne na idadi hizo ni nguzo sampuli.

    Ili kuchagua sampuli ya utaratibu, nasibu kuchagua hatua ya mwanzo na kuchukua kila\(n^{th}\) kipande cha data kutoka kwenye orodha ya idadi ya watu. Kwa mfano, tuseme unapaswa kufanya utafiti wa simu. Kitabu cha simu yako ina orodha 20,000 makazi. Lazima uchague majina 400 kwa sampuli. Idadi ya watu 1—20,000 na kisha kutumia sampuli rahisi random kuchukua idadi ambayo inawakilisha jina la kwanza katika sampuli. Kisha chagua kila jina la hamsini baada ya hapo mpaka uwe na jumla ya majina ya 400 (unaweza kurudi kwenye mwanzo wa orodha yako ya simu). Sampuli ya utaratibu mara nyingi huchaguliwa kwa sababu ni njia rahisi.

    Aina ya sampuli ambayo sio random ni sampuli ya urahisi. Urahisi sampuli inahusisha kutumia matokeo ambayo inapatikana kwa urahisi. Kwa mfano, duka la programu ya kompyuta hufanya utafiti wa masoko kwa kuhoji wateja wanaoweza kutokea kuwa katika duka kuvinjari kupitia programu inapatikana. Matokeo ya sampuli ya urahisi inaweza kuwa nzuri sana katika baadhi ya matukio na yenye upendeleo (neema matokeo fulani) kwa wengine.

    Data ya sampuli inapaswa kufanyika kwa makini sana. Kukusanya data bila kujali inaweza kuwa na matokeo mabaya. Utafiti wa barua pepe kwa kaya na kisha kurudi inaweza kuwa upendeleo sana (wanaweza neema kundi fulani). Ni bora kwa mtu anayefanya utafiti ili kuchagua washiriki wa sampuli.

    Sampuli ya kweli ya random imefanywa na uingizwaji. Hiyo ni, mara moja mwanachama ni ilichukua, mwanachama kwamba huenda nyuma katika idadi ya watu na hivyo inaweza kuchaguliwa zaidi ya mara moja. Hata hivyo kwa sababu za vitendo, kwa watu wengi, sampuli rahisi ya random inafanywa bila uingizwaji. Utafiti ni kawaida kufanyika bila uingizwaji. Hiyo ni, mwanachama wa idadi ya watu anaweza kuchaguliwa mara moja tu. Sampuli nyingi zinachukuliwa kutoka kwa idadi kubwa na sampuli huelekea kuwa ndogo kwa kulinganisha na idadi ya watu. Kwa kuwa hii ndio kesi, sampuli bila uingizwaji ni takriban sawa na sampuli na uingizwaji kwa sababu nafasi ya kuokota mtu huyo mmoja zaidi ya mara moja na uingizwaji ni mdogo sana.

    Katika idadi ya watu wa chuo cha watu 10,000, tuseme unataka kuchukua sampuli ya 1,000 nasibu kwa ajili ya utafiti. Kwa sampuli yoyote ya 1,000, ikiwa ni sampuli na uingizwaji,

    • nafasi ya kumchukua mtu wa kwanza ni 1,000 kati ya 10,000 (0.1000);
    • nafasi ya kuokota mtu tofauti wa pili kwa sampuli hii ni 999 kati ya 10,000 (0.0999);
    • nafasi ya kumchukua mtu huyo huyo tena ni 1 kati ya 10,000 (chini sana).

    Kama wewe ni sampuli bila uingizwaji,

    • nafasi ya kuokota mtu wa kwanza kwa sampuli yoyote ni 1000 kati ya 10,000 (0.1000);
    • nafasi ya kuokota mtu tofauti wa pili ni 999 kati ya 9,999 (0.0999);
    • huna nafasi ya mtu wa kwanza kabla ya kuokota mtu mwingine.

    Linganisha sehemu ndogo 99/10,000 na 999/9,999. Kwa usahihi, kubeba majibu ya decimal kwenye maeneo manne ya decimal. Kwa sehemu nne za decimal, namba hizi ni sawa (0.0999).

    Sampuli bila uingizwaji badala ya sampuli na uingizwaji inakuwa suala la hisabati tu wakati idadi ya watu ni ndogo. Kwa mfano, ikiwa idadi ya watu ni watu 25, sampuli ni kumi, na wewe ni sampuli na uingizwaji wa sampuli yoyote, basi nafasi ya kuokota mtu wa kwanza ni kumi kati ya 25, na nafasi ya kuokota mtu mwingine wa pili ni tisa kati ya 25 (unachukua nafasi ya mtu wa kwanza).

    Ikiwa unapiga sampuli bila uingizwaji, basi nafasi ya kuokota mtu wa kwanza ni kumi kati ya 25, na kisha nafasi ya kuokota mtu wa pili (ambaye ni tofauti) ni tisa kati ya 24 (huna nafasi ya mtu wa kwanza).

    Linganisha sehemu ndogo 9/25 na 9/24. Kwa sehemu nne za decimal, 9/25 = 0.3600 na 9/24 = 0.3750. Kwa sehemu nne za decimal, namba hizi si sawa.

    Unapochambua data, ni muhimu kuwa na ufahamu wa makosa ya sampuli na makosa yasiyo ya sampuli. Mchakato halisi wa sampuli husababisha makosa ya sampuli. Kwa mfano, sampuli inaweza kuwa kubwa ya kutosha. Mambo yasiyohusiana na mchakato wa sampuli husababisha makosa yasiyo ya sampuli. Kifaa cha kuhesabu kasoro kinaweza kusababisha kosa la nonsampuli.

    Katika hali halisi, sampuli kamwe kuwa hasa mwakilishi wa idadi ya watu hivyo daima kutakuwa na baadhi ya makosa sampuli. Kama kanuni, sampuli kubwa, ndogo kosa la sampuli.

    Katika takwimu, upendeleo wa sampuli huundwa wakati sampuli inakusanywa kutoka kwa idadi ya watu na baadhi ya wanachama wa idadi ya watu hawana uwezekano wa kuchaguliwa kama wengine (kumbuka, kila mwanachama wa idadi ya watu anapaswa kuwa na nafasi sawa ya kuchaguliwa). Wakati upendeleo wa sampuli unatokea, kunaweza kuwa na hitimisho sahihi zilizotolewa kuhusu idadi ya watu inayojifunza.

    Tathmini muhimu

    Tunahitaji kutathmini masomo ya takwimu tunayosoma kuhusu kina na kuchambua kabla ya kukubali matokeo ya masomo. Matatizo ya kawaida ya kuwa na ufahamu wa ni pamoja na

    • Matatizo na sampuli: Sampuli lazima iwe mwakilishi wa idadi ya watu. Sampuli ambayo si mwakilishi wa idadi ya watu ni upendeleo. Ubaguzi sampuli ambazo si mwakilishi wa idadi ya watu kutoa matokeo ambayo ni sahihi na si halali.
    • Sampuli za kuchaguliwa: Majibu tu na watu wanaochagua kujibu, kama vile tafiti za kupiga simu, mara nyingi haziaminiki.
    • Masuala ya ukubwa wa sampuli: Sampuli ambazo ni ndogo sana zinaweza kuwa zisizoaminika. Sampuli kubwa ni bora, ikiwa inawezekana. Katika hali fulani, kuwa na sampuli ndogo ni kuepukika na bado inaweza kutumika kutekeleza hitimisho. Mifano: magari ya kupima ajali au kupima matibabu kwa hali ya kawaida
    • Ushawishi usiofaa: kukusanya data au kuuliza maswali kwa njia inayoathiri majibu
    • Mashirika yasiyo ya majibu au kukataa somo kushiriki: Majibu yaliyokusanywa inaweza tena kuwa mwakilishi wa idadi ya watu. Mara nyingi, watu wenye maoni mazuri au hasi wanaweza kujibu tafiti, ambazo zinaweza kuathiri matokeo.
    • Causality: Uhusiano kati ya vigezo viwili haimaanishi kwamba moja husababisha nyingine kutokea. Wanaweza kuwa na uhusiano (unaohusiana) kwa sababu ya uhusiano wao kwa njia ya kutofautiana tofauti.
    • Self-unafadhiliwa au maslahi binafsi masomo: Utafiti uliofanywa na mtu au shirika ili kusaidia madai yao. Je, utafiti usio na upendeleo? Soma utafiti kwa makini ili kutathmini kazi. Je, si moja kwa moja kudhani kuwa utafiti ni nzuri, lakini si moja kwa moja kudhani utafiti ni mbaya aidha. Tathmini juu ya sifa zake na kazi iliyofanyika.
    • Matumizi mabaya ya data: grafu zisizoonyeshwa vibaya, data isiyo kamili, au ukosefu wa muktadha
    • Confounding: Wakati madhara ya mambo mbalimbali juu ya majibu haiwezi kutengwa. Kuchanganyikiwa hufanya iwe vigumu au haiwezekani kutekeleza hitimisho halali kuhusu athari za kila sababu.

    Mfano\(\PageIndex{7}\)

    Utafiti unafanywa ili kuamua masomo ya wastani ambayo San Jose State wanafunzi wa shahada ya kwanza kulipa kwa muhula. Kila mwanafunzi katika sampuli zifuatazo anaulizwa ni kiasi gani masomo yeye kulipwa kwa muhula Fall. Aina ya sampuli katika kila kesi ni nini?

    1. Sampuli ya wanafunzi 100 wa shahada ya kwanza ya San Jose State inachukuliwa kwa kuandaa majina ya wanafunzi kwa uainishaji (Freshman, sophomore, junior, au mwandamizi), na kisha kuchagua wanafunzi 25 kutoka kila mmoja.
    2. Jenereta ya nambari ya random hutumiwa kuchagua mwanafunzi kutoka kwenye orodha ya alfabeti ya wanafunzi wote wa shahada ya kwanza katika muhula wa Fall. Kuanzia na mwanafunzi huyo, kila mwanafunzi wa 50 anachaguliwa mpaka wanafunzi wa 75 watajumuishwa katika sampuli.
    3. Njia ya random kabisa hutumiwa kuchagua wanafunzi 75. Kila mwanafunzi wa shahada ya kwanza katika muhula wa kuanguka ana uwezekano huo wa kuchaguliwa katika hatua yoyote ya mchakato wa sampuli.
    4. Mwanafunzi mpya, sophomore, junior, na miaka mwandamizi huhesabiwa moja, mbili, tatu, na nne, kwa mtiririko huo. Jenereta ya nambari ya random hutumiwa kuchukua miaka miwili. Wanafunzi wote katika miaka hiyo miwili ni katika sampuli.
    5. Msaidizi wa utawala anaombwa kusimama mbele ya maktaba Jumatano moja na kuuliza kwanza 100 wanafunzi wa shahada ya kwanza yeye kukutana nini kulipwa kwa ajili ya masomo ya muhula Fall. Wale wanafunzi 100 ni sampuli.
    Jibu

    a. stratified; b. utaratibu; c. rahisi random; d. nguzo; e. urahisi

    Mfano\(\PageIndex{8}\)

    Kuamua aina ya sampuli kutumika (rahisi random, stratified, utaratibu, nguzo, au urahisi).

    1. Kocha wa soka anachagua wachezaji sita kutoka kundi la wavulana wenye umri wa miaka nane hadi kumi, wachezaji saba kutoka kundi la wavulana wenye umri wa miaka 11 hadi 12, na wachezaji watatu kutoka kundi la wavulana wenye umri wa miaka 13 hadi 14 kuunda timu ya soka ya burudani.
    2. pollster mahojiano wafanyakazi wote wa rasilimali katika tano makampuni mbalimbali high tech.
    3. Mtafiti wa elimu ya sekondari anahojiana na walimu 50 wa kike wa shule ya sekondari na walimu wa kiume wa shule
    4. Mtafiti wa matibabu anahoji kila mgonjwa wa saratani ya tatu kutoka kwenye orodha ya wagonjwa wa saratani katika hospitali ya ndani.
    5. Mshauri wa shule ya sekondari anatumia kompyuta kuzalisha namba 50 za random halafu huchagua wanafunzi ambao majina yao yanahusiana na namba.
    6. Mwanafunzi anahojiana na wanafunzi wa darasa lake la algebra ili kuamua ngapi jozi za jeans mwanafunzi anamiliki, kwa wastani.
    Jibu

    a. stratified; b. nguzo; c. stratified; d. utaratibu; e. rahisi random; f.urahisi

    Kama tulikuwa kuchunguza sampuli mbili anayewakilisha idadi sawa, hata kama sisi kutumika mbinu random sampuli kwa sampuli, wangeweza kuwa sawa. Kama kuna tofauti katika data, kuna tofauti katika sampuli. Unapokuwa umezoea sampuli, tofauti itaanza kuonekana asili.

    Mfano\(\PageIndex{8}\)

    Tuseme ABC College ina 10,000 sehemu ya muda wanafunzi (idadi ya watu). Tunavutiwa na kiasi cha wastani cha fedha mwanafunzi wa wakati mmoja anatumia vitabu katika kipindi cha kuanguka. Kuuliza wanafunzi wote 10,000 ni kazi isiyowezekana.

    Tuseme sisi kuchukua sampuli mbili tofauti.

    Kwanza, tunatumia sampuli ya urahisi na kuchunguza wanafunzi kumi kutoka darasa la kwanza la kemia ya kikaboni. Wengi wa wanafunzi hawa wanachukua mahesabu ya muda wa kwanza pamoja na darasa la kemia ya kikaboni. Kiasi cha fedha wanachotumia kwenye vitabu ni kama ifuatavyo:

    $128; $87; $173; $116; $130; $204; $147; $189; $93; $153

    Sampuli ya pili inachukuliwa kwa kutumia orodha ya wananchi waandamizi ambao huchukua madarasa ya P.E. na kuchukua kila raia mwandamizi wa tano kwenye orodha, kwa jumla ya wananchi kumi waandamizi. Wanatumia:

    $50; $40; $36; $15; $50; $100; $40; $53; $22; $22

    Haiwezekani kwamba mwanafunzi yeyote yuko katika sampuli zote mbili.

    Je, unafikiri kwamba mojawapo ya sampuli hizi ni mwakilishi wa (au ni tabia ya) nzima 10,000 ya muda wanafunzi idadi ya watu?

    Jibu

    a. Sampuli ya kwanza labda ina wanafunzi wa sayansi-oriented. Mbali na kozi ya kemia, baadhi yao pia huchukua calculus ya muda wa kwanza. Vitabu vya madarasa haya huwa na gharama kubwa. Wengi wa wanafunzi hawa ni, zaidi ya uwezekano, kulipa zaidi ya wastani wa muda mwanafunzi kwa ajili ya vitabu vyao. Sampuli ya pili ni kundi la wananchi waandamizi ambao, zaidi ya uwezekano, kuchukua kozi za afya na maslahi. Kiasi cha fedha wanachotumia kwenye vitabu pengine ni kidogo sana kuliko mwanafunzi wa kawaida wa wakati mmoja. Sampuli zote mbili zinapendekezwa. Pia, katika hali zote mbili, si wanafunzi wote wana nafasi ya kuwa katika sampuli yoyote.

    b Kwa kuwa sampuli hizi si mwakilishi wa idadi ya watu wote, ni busara kutumia matokeo kuelezea idadi ya watu wote?

    Jibu

    Suluhisho 1.13

    b Hapana. Kwa sampuli hizi, kila mwanachama wa idadi ya watu hakuwa na nafasi sawa ya kuchaguliwa.

    Sasa, tuseme sisi kuchukua sampuli ya tatu. Tunachagua wanafunzi kumi tofauti wa muda kutoka kwa taaluma za kemia, hisabati, Kiingereza, saikolojia, sosholojia, historia, uuguzi, elimu ya kimwili, sanaa, na maendeleo ya utotoni. (Tunadhani kwamba hizi ni taaluma pekee ambazo wanafunzi wa sehemu ya muda katika Chuo cha ABC wamejiandikisha na kwamba idadi sawa ya wanafunzi wa sehemu ya muda wamejiandikisha katika kila taaluma.) Kila mwanafunzi anachaguliwa kwa kutumia sampuli rahisi ya random. Kutumia calculator, namba za random zinazalishwa na mwanafunzi kutoka nidhamu fulani huchaguliwa ikiwa ana namba inayofanana. Wanafunzi hutumia kiasi kifuatacho:

    $180; $50; $150; $85; $260; $75; $180; $200; $200; $150

    c Je, sampuli ni upendeleo?

    Jibu

    Suluhisho 1.13

    c. sampuli ni unbiased, lakini sampuli kubwa itakuwa ilipendekeza kuongeza uwezekano kwamba sampuli itakuwa karibu na mwakilishi wa idadi ya watu. Hata hivyo, kwa mbinu ya sampuli ya upendeleo, hata sampuli kubwa huendesha hatari ya kutokuwa mwakilishi wa idadi ya watu.

    Wanafunzi mara nyingi huuliza kama ni “nzuri ya kutosha” kuchukua sampuli, badala ya kuchunguza idadi ya watu wote. Ikiwa utafiti umefanywa vizuri, jibu ni ndiyo.

    Zoezi\(\PageIndex{8}\)

    Kituo cha redio cha ndani kina msingi wa shabiki wa wasikilizaji 20,000. Kituo hicho kinataka kujua kama watazamaji wake wangependelea muziki zaidi au vipindi vya majadiliano zaidi. Kuuliza wasikilizaji wote 20,000 ni kazi isiyowezekana.

    Kituo hiki kinatumia sampuli ya urahisi na huchunguza watu 200 wa kwanza wanaokutana katika moja ya matukio ya tamasha la muziki wa kituo hicho. Watu 24 walisema wanapendelea maonyesho zaidi ya majadiliano, na watu 176 walisema wanapendelea muziki zaidi.

    Je, unafikiri kwamba sampuli hii ni mwakilishi wa (au ni tabia ya) nzima 20,000 msikilizaji idadi ya watu?

    Tofauti katika Data

    Tofauti iko katika seti yoyote ya data. Kwa mfano, makopo 16-ounce ya kinywaji yanaweza kuwa na ounces zaidi au chini ya 16 ya kioevu. Katika utafiti mmoja, makopo nane ya ounce 16 yalipimwa na kuzalisha kiasi kinachofuata (kwa ounces) cha kinywaji:

    15.8; 16.1; 15.2; 14.8; 15.8; 15.9; 16.0; 15.5

    Mipangilio ya kiasi cha kinywaji katika 16-ounce inaweza kutofautiana kwa sababu watu tofauti kufanya vipimo au kwa sababu kiasi halisi, 16 ounces ya kioevu, hakuwa kuweka ndani ya makopo. Wazalishaji mara kwa mara huendesha vipimo ili kuamua kama kiasi cha kinywaji katika 16-ounce kinaweza kuanguka ndani ya aina ya taka.

    Jihadharini kwamba unapochukua data, data yako inaweza kutofautiana kiasi fulani kutoka kwa data ambayo mtu mwingine anachukua kwa lengo moja. Hii ni ya asili kabisa. Hata hivyo, ikiwa wawili au zaidi wanachukua data sawa na kupata matokeo tofauti sana, ni wakati wa wewe na wengine kutathmini upya mbinu zako za kuchukua data na usahihi wako.

    Tofauti katika Sampuli

    Ilielezwa hapo awali kwamba sampuli mbili au zaidi kutoka kwa idadi sawa, kuchukuliwa nasibu, na kuwa na karibu na sifa sawa ya idadi ya watu kuna uwezekano kuwa tofauti na kila mmoja. Tuseme Doreen na Jung wote wanaamua kujifunza kiwango cha wastani cha wakati wanafunzi katika chuo chao kulala kila usiku. Doreen na Jung kila kuchukua sampuli ya 500 wanafunzi. Doreen inatumia sampuli utaratibu na Jung anatumia nguzo sampuli. Sampuli ya Doreen itakuwa tofauti na sampuli ya Jung. Hata kama Doreen na Jung walitumia njia sawa ya sampuli, kwa uwezekano wote sampuli zao zingekuwa tofauti. Wala itakuwa mbaya, hata hivyo.

    Fikiria juu ya kile kinachochangia kufanya sampuli za Doreen na Jung tofauti.

    Ikiwa Doreen na Jung walichukua sampuli kubwa (yaani idadi ya maadili ya data imeongezeka), matokeo yao ya sampuli (wastani wa muda mwanafunzi analala) inaweza kuwa karibu na wastani halisi wa idadi ya watu. Lakini bado, sampuli zao zitakuwa, kwa uwezekano wote, tofauti na kila mmoja. Tofauti hii katika sampuli haiwezi kusisitizwa kutosha.

    Ukubwa wa Sampuli

    Ukubwa wa sampuli (mara nyingi huitwa idadi ya uchunguzi, kwa kawaida hutolewa alama n) ni muhimu. Mifano uliyoyaona katika kitabu hiki hadi sasa zimekuwa ndogo. Sampuli za uchunguzi mia chache tu, au hata ndogo, zinatosha kwa madhumuni mengi. Katika kupigia kura, sampuli ambazo zinatoka kwa uchunguzi wa 1,200 hadi 1,500 zinachukuliwa kuwa kubwa ya kutosha na nzuri ikiwa utafiti huo ni random na umefanyika vizuri. Baadaye tutapata kwamba hata ukubwa mdogo wa sampuli utatoa matokeo mazuri sana. Utajifunza kwa nini unapojifunza vipindi vya kujiamini.

    Kuwa na ufahamu kwamba sampuli nyingi kubwa ni upendeleo. Kwa mfano, tafiti za kupiga simu zinapendekezwa, kwa sababu watu huchagua kujibu au la.