2.R: Takwimu za maelezo (Tathmini)

Last updated
Save as PDF

Page ID: 179500

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

2.1 Onyesha Data

Mpango wa shina na jani ni njia ya kupanga njama na kuangalia usambazaji. Katika njama ya shina na jani, maadili yote ya data ndani ya darasa yanaonekana. Faida katika njama ya shina na jani ni kwamba maadili yote yameorodheshwa, tofauti na histogram, ambayo inatoa madarasa ya maadili ya data. Grafu ya mstari mara nyingi hutumiwa kuwakilisha seti ya maadili ya data ambayo kiasi kinatofautiana na wakati. Grafu hizi ni muhimu kwa kutafuta mwenendo. Hiyo ni, kutafuta muundo wa jumla katika seti za data ikiwa ni pamoja na joto, mauzo, ajira, faida ya kampuni au gharama kwa kipindi cha muda. Grafu ya bar ni chati inayotumia ama baa za usawa au wima kuonyesha kulinganisha kati ya makundi. Mhimili mmoja wa chati unaonyesha makundi maalum yanalinganishwa, na mhimili mwingine unawakilisha thamani ya kipekee. Baadhi ya grafu za bar zinawasilisha baa zilizokusanywa katika makundi ya zaidi ya moja (grafu za bar zilizowekwa), na wengine huonyesha baa zilizogawanywa katika sehemu ndogo ili kuonyesha athari za ziada (grafu za bar zilizopigwa). Grafu za bar ni muhimu hasa wakati data ya categorical inatumiwa.

Histogram ni toleo la graphic la usambazaji wa mzunguko. Grafu ina baa za upana sawa inayotolewa karibu na kila mmoja. Kiwango cha usawa kinawakilisha madarasa ya maadili ya data ya kiasi na kiwango cha wima kinawakilisha masafa. Urefu wa baa unafanana na maadili ya mzunguko. Histograms ni kawaida kutumika kwa ajili ya seti kubwa, kuendelea, upimaji data. Poligoni ya mzunguko pia inaweza kutumika wakati wa kuchora seti kubwa za data na pointi za data zinazorudia. Data kawaida inakwenda y -axis na mzunguko kuwa graphed juu ya x -axis. Grafu za mfululizo wa muda zinaweza kusaidia wakati wa kuangalia kiasi kikubwa cha data kwa variable moja kwa kipindi cha muda.

2.2 Hatua za Eneo la Data

Maadili yanayogawanya seti ya data iliyoagizwa na cheo katika sehemu 100 sawa huitwa percentiles. Asilimia hutumiwa kulinganisha na kutafsiri data. Kwa mfano, uchunguzi katika 50 ^th percentile itakuwa kubwa kuliko 50 asilimia ya uchunguzi mwingine katika seti. Quartiles hugawanya data katika robo. Robo ya kwanza (\(Q_1\)) ni asilimia 25 ^th, robo ya pili (\(Q_2\)au wastani) ni 50 ^th percentile, na robo ya tatu (\(Q_3\)) ni 75 ^th percentile. Aina ya interquartile, au\(IQR\), ni kiwango cha katikati ya asilimia 50 ya maadili ya data. Ya\(IQR\) hupatikana kwa kutoa\(Q_1\) kutoka\(Q_3\), na inaweza kusaidia kuamua nje kwa kutumia maneno mawili yafuatayo.

\(Q_3 + IQR(1.5)\)
\(Q_1 – IQR(1.5)\)

2.3 Hatua za Kituo cha Data

Maana na wastani inaweza kuhesabiwa ili kukusaidia kupata “kituo” cha kuweka data. Maana ni makadirio bora ya kuweka data halisi, lakini wastani ni kipimo bora wakati kuweka data ina outliers kadhaa au maadili uliokithiri. Hali itakuambia datum (au data) inayotokea mara kwa mara katika seti yako ya data. Maana, wastani, na mode husaidia sana wakati unahitaji kuchambua data yako, lakini ikiwa kuweka data yako ina safu ambazo hazina maadili maalum, maana inaweza kuonekana haiwezekani kuhesabu. Hata hivyo, maana inaweza kuhesabiwa ikiwa unaongeza mipaka ya chini na mipaka ya juu na ugawanye na mbili ili kupata midpoint ya kila muda. Panua kila midpoint kwa idadi ya maadili yaliyopatikana katika upeo unaofanana. Gawanya jumla ya maadili haya kwa idadi ya maadili ya data katika seti.

2.6 Skewness na Maana, Median, na Mode

Kuangalia usambazaji wa data kunaweza kufunua mengi kuhusu uhusiano kati ya maana, wastani, na mode. Kuna aina tatu za mgawanyo. Haki (au chanya) usambazaji skewed ina sura kama Kielelezo\(\PageIndex{11}\).

2.7 Hatua za Kuenea kwa Data

Kupotoka kwa kawaida kunaweza kukusaidia kuhesabu kuenea kwa data. Kuna milinganyo tofauti ya kutumia ikiwa ni kuhesabu kupotoka kwa kiwango cha sampuli au ya idadi ya watu.

Kupotoka Standard inaruhusu sisi kulinganisha data ya mtu binafsi au madarasa kwa kuweka data maana numerically.
\(s=\sqrt{\frac{\sum(x-\overline{x})^{2}}{n-1}} \text { or } s=\sqrt{\frac{\sum f(x-\overline{x})^{2}}{n-1}}\)ni formula ya kuhesabu kupotoka kwa kawaida kwa sampuli. Ili kuhesabu kupotoka kwa kiwango cha idadi ya watu, tutatumia maana ya idadi ya watu, μ, na formula\(\sigma=\sqrt{\frac{\sum(x-\mu)^{2}}{N}} \text { or } \sigma=\sqrt{\frac{\sum f(x-\mu)^{2}}{N}}\).