Skip to main content
Query

3.2: Kuhitimisha data- Takwimu zinazoelezea

  • Page ID
    166395
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Je, unaweza muhtasari data?

    Takwimu zimefupishwa kwa njia mbili kuu: mahesabu ya muhtasari na visualizations ya muhtasari

     

    Mahesabu: Ni aina gani za hatua zinazotumiwa?

    Ili uweze kutafsiri mwelekeo katika data, data ghafi lazima kwanza kutumiwa na kufupishwa katika makundi mawili ya vipimo: Hatua za tabia kuu na Hatua za kutofautiana. Makundi haya mawili ya vipimo yanajumuisha hatua ya kwanza ya uchunguzi wa kisayansi, takwimu za maelezo.

    Hatua ya tabia ya kati (kituo cha) - Hutoa taarifa ya jinsi data nguzo karibu baadhi ya thamani moja katikati. Kuna hatua mbili za kituo cha kutumika mara nyingi katika uchunguzi wa kibiolojia:

    • Maana (wastani) - Jumla ya maadili yote ya mtu binafsi imegawanywa na idadi ya jumla ya maadili katika sampuli/idadi ya watu. Hii ni kipimo cha kawaida cha kituo cha chini ya usambazaji wa usawa na ni nyeti kwa nje.
    • Wastani - Thamani ya kati wakati kuweka data imeagizwa kwa cheo cha usawa (juu hadi chini). Hii ni kawaida kutumika wakati data ni skewed na ni sugu kwa outliers.

    Hatua za kutofautiana (kuenea) — Inaeleza jinsi kuenea nje au kutawanyika data ni. Kuna hatua mbili kuu za kuenea kutumika katika uchunguzi wa kibiolojia:

    • Range - Inathibitisha umbali kati ya maadili makubwa na madogo ya data.
    • Mkengeuko wa kawaida - Inathibitisha tofauti au utawanyiko kutoka kwa wastani wa seti ya data. Kupotoka kwa kiwango cha chini kunaonyesha kwamba data huelekea kuwa karibu sana na maana; kupotoka kwa kiwango cha juu kunaonyesha kwamba pointi za data zinaenea juu ya maadili mengi. Hesabu hii ni nyeti kwa nje.
    • Hitilafu ya kawaida - Inatambua tofauti katika njia kutoka kwa seti nyingi za data au usambazaji wa sampuli wa dataset yako ya awali.

       

    Kuangalia data: Je, meza na grafu zinatumiwaje?

    Baada ya takwimu zote zinazoelezea zinahitajika zimehesabiwa, kwa kawaida huonekana kwa muhtasari katika meza au grafu.

    Majedwali:

    Jedwali ni seti ya maadili ya data yaliyopangwa katika nguzo na safu. Kwa kawaida nguzo zinajumuisha jamii pana ya data, na safu zinajumuisha mwingine. Ndani ya kila jamii pana kuna makundi ambayo huamua ngapi nguzo na safu meza ina. Majedwali hutumiwa kukusanya na kufupisha data. Hata hivyo, wakati mwingi ambapo meza zinawasilishwa, zinajumuisha data iliyofupishwa, si data ghafi. Ingawa meza zinawezesha data iliyofupishwa kuwasilishwa kwa njia ya utaratibu, watu wengi wanapendelea kutafsiri meza kwenye chombo chenye nguvu zaidi cha kutazama data, grafu.

    Grafu:

    Grafu ni mchoro unaoonyesha uhusiano kati ya kiasi cha kutofautiana, kwa kawaida ya vigezo viwili, kila kipimo kinapimwa pamoja na jozi moja ya shoka kwenye pembe za kulia. Grafu zinaweza kuonekana kama chati au kuchora. Grafu nyingi hutumia baa, mistari, au sehemu za mduara ili kuonyesha data. Hata hivyo, kuna wakati mwingine wakati grafu zimefunikwa juu ya ramani ili pia kuonyesha eneo la kijiografia, au hata huhuishwa kuwa na maingiliano.

    Makundi makubwa ya aina ya grafu:
    • Circle/Pie — chati ya mviringo imegawanywa katika vipande ili kuonyesha uwiano wa namba. Katika chati ya pie, urefu wa arc wa kila kipande (na hivyo angle yake ya kati na eneo), ni sawa na kiasi kinachowakilisha. Ingawa inaitwa kwa kufanana kwake na pie ambayo imekatwa, kuna tofauti juu ya njia ambayo inaweza kuwasilishwa.
    • Mstari - Aina ya chati ambayo inaonyesha habari kama mfululizo wa pointi za data zinazoitwa 'markers' zilizounganishwa na makundi ya mstari wa moja kwa moja. Ni aina ya msingi ya chati ya kawaida katika nyanja nyingi. Ni sawa na kutawanya njama isipokuwa kwamba pointi kipimo ni amri (kawaida kwa thamani yao x-mhimili) na alijiunga na makundi moja kwa moja line. Chati ya mstari mara nyingi hutumiwa kutazama mwenendo katika data juu ya vipindi vya muda - mfululizo wa wakati - hivyo mstari mara nyingi hutolewa kwa muda.
    Mzungua/Pie grafu na mifano ya grafu ya mstari
    Kielelezo\(\PageIndex{a}\): Mifano ya grafu ya mduara/pie (a.) na grafu ya mstari (b.). Picha iliyoundwa na Rachel Schleiger (CC-BY-NC).
    • Kuwatawanya njama — Je, ni grafu ambayo maadili ya vigezo viwili yanapangwa pamoja na shoka za usawa na wima, mfano wa pointi zinazosababisha kuonyesha uwiano wowote uliowekwa . Takwimu zinaonyeshwa kama mkusanyiko wa pointi, kila mmoja ana thamani ya kutofautiana moja inayoamua nafasi kwenye mhimili usio na usawa na thamani ya kutofautiana nyingine inayoamua msimamo kwenye mhimili wima.
    Mfano wa njama ya kuwatawanya
    Kielelezo\(\PageIndex{b}\): Mfano wa njama kuwatawanya. Picha iliyoundwa na Rachel Schleiger (CC-BY-NC).
    • Bar - Chati au grafu ambayo inatoa data categorical na baa mstatili na urefu au urefu sawia na maadili kwamba wao kuwakilisha. Baa zinaweza kupangwa kwa wima au kwa usawa.
    • Histogram — Ni uwakilishi wa takriban wa usambazaji wa data za namba. Ili kujenga histogram, hatua ya kwanza ni “bin” (au “ndoo”) maadili-yaani, kugawanya maadili yote katika mfululizo wa vipindi - na kisha kuhesabu jinsi maadili mengi yanavyoanguka katika kila kipindi. Mapipa ya kawaida huelezwa kama vipindi vya mfululizo, visivyoingiliana vya kutofautiana. Mapipa (vipindi) lazima iwe karibu (maana hakuna nafasi kati yao kama kuna kwenye grafu za bar), na mara nyingi (lakini hazihitajiki kuwa) za ukubwa sawa. Kama mapipa ni ya ukubwa sawa, mstatili ni kujengwa juu ya bin na urefu sawia na frequency-idadi ya kesi katika kila bin.
    Mfano wa grafu ya bar na histogram
    Kielelezo\(\PageIndex{c}\): Mifano ya grafu ya bar (a.) na histogram (b.) kwa kutumia dataset sawa. Picha iliyoundwa na Rachel Schleiger (CC-BY-NC).

    Attribution

    Rachel Schleiger (CC-BY-NC)