2.1: بيانات العرض
- Page ID
- 198843
الرسوم البيانية الجذعية والورقية (المخططات الجذعية) والرسوم البيانية الخطية والرسوم البيانية الشريطية
يأتي رسم بياني بسيط، وهو الرسم البياني الجذعي أو المخطط الجذعي، من مجال تحليل البيانات الاستكشافية. إنه اختيار جيد عندما تكون مجموعات البيانات صغيرة. لإنشاء المخطط، قسّم كل ملاحظة للبيانات إلى جذع وورقة. تتكون الورقة من رقم نهائي مهم. على سبيل المثال، يحتوي 23 على جذع اثنين وأوراق ثلاثة. يحتوي الرقم 432 على الجذع 43 والورقة الثانية. وبالمثل، فإن الرقم 5432 له جذع 543 والورقة الثانية. يحتوي العدد العشري 9.3 على الجذع التاسع والورقة الثالثة. اكتب السيقان في خط عمودي من الأصغر إلى الأكبر. ارسم خطًا رأسيًا على يمين السيقان. ثم اكتب الأوراق بترتيب متزايد بجوار الجذع المقابل لها.
مثال\(\PageIndex{2}\).1
بالنسبة لفصل ما قبل حساب التفاضل والتكامل الربيعي لسوزان دين، كانت درجات الاختبار الأول على النحو التالي (من الأصغر إلى الأكبر):
33؛ 42؛ 49؛ 53؛ 55؛ 55؛ 61؛ 63؛ 67؛ 68؛ 68؛ 69؛ 69؛ 72؛ 73؛ 74؛ 78؛ 80؛ 83؛ 88؛ 88؛ 88؛ 88؛ 88؛ 88؛ 90؛ 92؛ 94؛ 94؛ 94؛ 94؛ 94؛ 94؛ 94؛ 94؛ 94؛ 96؛ 100
\ (\ pageIndex {1}\) رسم بياني للجذع والأوراق «>ستيم | ورقة |
---|---|
3 | 3 |
4 | 2 9 9 |
5 | 3 5 5 |
6 | 1 3 7 8 8 9 9 |
7 | 2 3 4 8 |
8 | 0 3 8 8 |
9 | 0 2 4 4 4 4 6 |
10 | 0 |
تُظهر القصة الدرامية أن معظم الدرجات انخفضت في الستينيات والسبعينيات والثمانينيات والتسعينيات. كانت ثمانية من أصل 31 درجة أو ما يقرب من 26٪ (831) (831) في التسعينيات أو 100، وهو رقم مرتفع نسبيًا من As.
التمارين\(\PageIndex{2}\).1
بالنسبة لفريق كرة السلة في بارك سيتي، كانت نتائج آخر 30 مباراة على النحو التالي (الأصغر إلى الأكبر):
32؛ 32؛ 33؛ 34؛ 38؛ 40؛ 42؛ 43؛ 44؛ 46؛ 47؛ 47؛ 48؛ 48؛ 48؛ 48؛ 49؛ 50؛ 50؛ 50؛ 51؛ 52؛ 52؛ 52؛ 52؛ 53؛ 54؛ 56؛ 57؛ 57؛ 60؛ 61
قم بإنشاء مخطط جذعي للبيانات.
تعد stemplot طريقة سريعة لرسم البيانات وتعطي صورة دقيقة للبيانات. تريد البحث عن نمط عام وأي قيم خارجية. أما القيم المتطرفة فهي ملاحظة البيانات التي لا تتناسب مع بقية البيانات. يطلق عليها أحيانًا القيمة القصوى. عندما تقوم برسم بياني للتغير، سيظهر أنه لا يتناسب مع نمط الرسم البياني. بعض القيم المتطرفة ناتجة عن أخطاء (على سبيل المثال، كتابة 50 بدلاً من 500) بينما قد يشير البعض الآخر إلى حدوث شيء غير عادي. يتطلب الأمر بعض المعلومات الأساسية لشرح القيم المتطرفة، لذلك سنقوم بتغطيتها بمزيد من التفاصيل لاحقًا.
مثال\(\PageIndex{2}\).2
البيانات هي المسافات (بالكيلومترات) من المنزل إلى محلات السوبر ماركت المحلية. قم بإنشاء مخطط زمني باستخدام البيانات:
1.1؛ 1.5؛ 2.3؛ 2.5؛ 2.7؛ 3.2؛ 3.3؛ 3.3؛ 3.5؛ 3.8؛ 4.0؛ 4.2؛ 4.5؛ 4.5؛ 4.7؛ 4.8؛ 5.5؛ 5.6؛ 6.5؛ 6.7؛ 12.3
هل يبدو أن البيانات تحتوي على أي تركيز للقيم؟
ملاحظة
توجد الأوراق على يمين العلامة العشرية.
- إجابة
-
قد تكون القيمة 12.3 غريبة. يبدو أن القيم تتركز على ثلاثة وأربعة كيلومترات.
\ (\ فهرس الصفحات {2}\) «>ستيم ورقة 1 1 5 2 3 5 7 3 2 3 3 5 8 4 0 2 5 5 7 8 5 5 6 6 5 7 7 8 9 10 11 12 3 الجدول\(\PageIndex{2}\) 2.
التمارين\(\PageIndex{2}\).2
توضح البيانات التالية المسافات (بالأميال) من منازل طلاب الإحصاء خارج الحرم الجامعي إلى الكلية. قم بإنشاء مخطط جذعي باستخدام البيانات وتحديد أي قيم خارجية:
0.5؛ 0.7؛ 1.1؛ 1.2؛ 1.2؛ 1.2؛ 1.3؛ 1.5؛ 1.5؛ 1.7؛ 1.8؛ 1.9؛ 2.0؛ 2.2؛ 2.5؛ 2.6؛ 2.8؛ 2.8؛ 2.8؛ 2.8؛ 2.8؛ 2.8؛ 2.8؛ 3.5؛ 3.8؛ 4.4؛ 4.8؛ 4.9؛ 5.2؛ 5.5؛ 5.7؛ 5.8؛ 8.0
مثال\(\PageIndex{2}\).3
يسمح مخطط الجذع والأوراق جنبًا إلى جنب بمقارنة مجموعتي البيانات في عمودين. في قطعة أرض من الجذع والأوراق جنبًا إلى جنب، تشترك مجموعتان من الأوراق في نفس الجذع. الأوراق على اليسار واليمين من السيقان. يوضح الجدول\(\PageIndex{2}\) 4 والجدول\(\PageIndex{2}\) 5 أعمار الرؤساء عند التنصيب وعند وفاتهم. قم بإنشاء مخطط جنبًا إلى جنب مع الجذع والأوراق باستخدام هذه البيانات.
- إجابة
-
\ (\ فهرس الصفحات {3}\) «>
الأعمار عند الافتتاح الأعمار عند الموت 9 9 8 7 7 7 6 3 2 4 6 9 8 7 7 7 6 6 6 6 5 5 5 5 4 4 4 4 4 4 4 4 4 2 1 1 1 1 0 5 3 6 6 7 7 8 9 8 5 4 4 2 1 1 1 0 6 0 0 3 3 4 4 5 6 7 7 8 7 0 0 1 1 1 4 7 8 9 8 0 1 3 5 8 9 0 0 3 3 الجدول\(\PageIndex{2}\) 3.
رئيس | العمر | رئيس | العمر | رئيس | العمر |
---|---|---|---|---|---|
واشنطن | 57 | لينكولن | 52 | مكنسة كهربائية لتنظيف الغبار | 54 |
جيه آدامز | 61 | أ. جونسون | 56 | إف. روزفلت | 51 |
جيفرسون | 57 | منحة | 46 | ترومان | 60 |
ماديسون | 57 | هايز | 54 | أيز | 62 |
مونرو | 58 | جارفيلد | 49 | كينيدي | 43 |
جيه كيو آدامز | 57 | آرثر | 51 | إل جونسون | 55 |
جاكسون | 61 | كليفلاند | 47 | نيكسون | 56 |
فان بورين | 54 | ب. هاريسون | 55 | فورد | 61 |
دبليو إتش هاريسون | 68 | كليفلاند | 55 | سائق الكارة | 52 |
تايلر | 51 | ماككيني | 54 | ريغان | 69 |
بولك | 49 | تي. روزفلت | 42 | جي إتش دبليو بوش | 64 |
تايلور | 64 | تافت | 51 | كلينتون | 47 |
فيلمور | 50 | ويلسون | 56 | جي دبليو بوش | 54 |
بيرس | 48 | هاردينغ | 55 | أوباما | 47 |
بوكانان | 65 | كوليدج | 51 | ترامب | 70 |
رئيس | العمر | رئيس | العمر | رئيس | العمر |
---|---|---|---|---|---|
واشنطن | 67 | لينكولن | 56 | مكنسة كهربائية لتنظيف الغبار | 90 |
جيه آدامز | 90 | أ. جونسون | 66 | إف. روزفلت | 63 |
جيفرسون | 83 | منحة | 63 | ترومان | 88 |
ماديسون | 85 | هايز | 70 | أيز | 78 |
مونرو | 73 | جارفيلد | 49 | كينيدي | 46 |
جيه كيو آدامز | 80 | آرثر | 56 | إل جونسون | 64 |
جاكسون | 78 | كليفلاند | 71 | نيكسون | 81 |
فان بورين | 79 | ب. هاريسون | 67 | فورد | 93 |
دبليو إتش هاريسون | 68 | كليفلاند | 71 | ريغان | 93 |
تايلر | 71 | ماككيني | 58 | ||
بولك | 53 | تي. روزفلت | 60 | ||
تايلور | 65 | تافت | 72 | ||
فيلمور | 74 | ويلسون | 67 | ||
بيرس | 64 | هاردينغ | 57 | ||
بوكانان | 77 | كوليدج | 60 |
هناك نوع آخر من الرسوم البيانية المفيدة لقيم بيانات محددة وهو الرسم البياني الخطي. في الرسم البياني الخطي المحدد الموضح في المثال\(\PageIndex{4}\)، يتكون المحور x (المحور الأفقي) من قيم البيانات ويتكون المحور y (المحور الرأسي) من نقاط التردد. يتم توصيل نقاط التردد باستخدام مقاطع الخط.
مثال\(\PageIndex{2}\).4
في دراسة استقصائية، سُئلت 40 أم عن عدد المرات في الأسبوع التي يجب تذكير المراهق بالقيام بأعماله المنزلية. تظهر النتائج في الجدول\(\PageIndex{2}\) .6 وفي الشكل\(\PageIndex{2}\) 2.
\ (\ فهرس الصفحات {6}\) «>عدد المرات التي يتم فيها تذكير المراهق | التردد |
---|---|
0 | 2 |
1 | 5 |
2 | 8 |
3 | 14 |
4 | 7 |
5 | 4 |
التمارين\(\PageIndex{4}\)
في دراسة استقصائية، سُئل 40 شخصًا عن عدد المرات التي يتم فيها وضع سيارتهم في المتجر لإجراء الإصلاحات. يتم عرض النتائج في الجدول\(\PageIndex{7}\). قم بإنشاء رسم بياني خطي.
\ (\ فهرس الصفحات {7}\) «>عدد المرات في المتجر | التردد |
---|---|
0 | 7 |
1 | 10 |
2 | 14 |
3 | 9 |
تتكون الرسوم البيانية الشريطية من أشرطة منفصلة عن بعضها البعض. يمكن أن تكون الأشرطة مستطيلات أو يمكن أن تكون صناديق مستطيلة (تستخدم في المخططات ثلاثية الأبعاد)، ويمكن أن تكون رأسية أو أفقية. \(\PageIndex{5}\)يحتوي الرسم البياني الشريطي الموضح في المثال على فئات عمرية ممثلة على المحور x والنسب على المحور y.
التمارين\(\PageIndex{1}\)
أضف نصًا للتمارين هنا.
- إجابة
-
الحل 2.5
مثال\(\PageIndex{5}\)
بحلول نهاية عام 2011، كان لدى Facebook أكثر من 146 مليون مستخدم في الولايات المتحدة. يوضح الجدول\(\PageIndex{2}\) 8 ثلاث فئات عمرية، وعدد المستخدمين في كل فئة عمرية، ونسبة (٪) المستخدمين في كل فئة عمرية. قم بإنشاء رسم بياني شريطي باستخدام هذه البيانات.
\ (\ فهرس الصفحات {8}\) «>الفئات العمرية | عدد مستخدمي الفيسبوك | نسبة (%) من مستخدمي فيسبوك |
---|---|---|
13-25 | 65,082,280 | 45% |
26-44 | 53,300,200 | 36% |
45-64 | 27,885,100 | 19% |
الحل
التمارين\(\PageIndex{5}\)
أضف نصًا للتمارين هنا.
- إجابة
-
يتكون السكان في بارك سيتي من الأطفال والبالغين في سن العمل والمتقاعدين. \(\PageIndex{9}\)يوضح الجدول الفئات العمرية الثلاث، وعدد الأشخاص في المدينة من كل فئة عمرية، ونسبة (٪) الأشخاص في كل فئة عمرية. قم بإنشاء رسم بياني شريطي يوضح النسب.
\ (\ فهرس الصفحات {9}\) «>الفئات العمرية عدد الأشخاص نسبة السكان أطفال 67,059 19% البالغون في سن العمل 152,198 43% المتقاعدون 131,662 38%
مثال\(\PageIndex{2}\).6
تحتوي الأعمدة في الجدول\(\PageIndex{2}\) .10 على: العرق أو العرق للطلاب في المدارس العامة الأمريكية لفصل عام 2011، والنسب المئوية لسكان امتحان تحديد المستوى المتقدم لهذا الفصل، والنسب المئوية لمجموع الطلاب. قم بإنشاء رسم بياني شريطي يحتوي على عرق الطالب أو إثنيته (البيانات النوعية) على المحور x، والنسب المئوية لسكان ممتحني المستوى المتقدم على المحور y.
\ (\ فهرس الصفحات {10}\) «>العرق/الإثنية | السكان الممتحنين في AP | إجمالي عدد الطلاب |
---|---|---|
1 = آسيوي أو أمريكي آسيوي أو من سكان جزر المحيط الهادئ | 10.3% | 5.7% |
2 = أسود أو أمريكي من أصل أفريقي | 9.0% | 14.7% |
3 = من أصل إسباني أو لاتيني | 17% | 17.6% |
4 = الهنود الأمريكيون أو سكان ألاسكا الأصليون | 0.6% | 1.1% |
5 = أبيض | 57.1% | 59.2% |
6 = لم يتم الإبلاغ عن/غير ذلك | 6.0% | 1.7% |
- إجابة
-
الحل 2.6
التمارين\(\PageIndex{2}\).6
أضف نصًا للتمارين هنا.
- إجابة
-
يتم تقسيم بارك سيتي إلى ست مناطق تصويت. يوضح الجدول النسبة المئوية من إجمالي الناخبين المسجلين الذين يعيشون في كل منطقة وكذلك النسبة المئوية لمجموع السكان الذين يعيشون في كل منطقة. قم بإنشاء رسم بياني شريطي يوضح عدد الناخبين المسجلين حسب المنطقة.
\ (\ فهرس الصفحات {11}\) «>منطقة عدد الناخبين المسجلين إجمالي عدد سكان المدينة 1 15.5% 19.4% 2 12.2% 15.6% 3 9.8% 9.0% 4 17.4% 18.5% 5 22.8 في المائة 20.7% 6 22.3% 16.8% الجدول\(\PageIndex{2}\) 1.1
مثال\(\PageIndex{2}\).7
يوجد أدناه جدول ثنائي الاتجاه يوضح أنواع الحيوانات الأليفة التي يملكها الرجال والنساء:
\ (\ فهرس الصفحات {12}\) «>الكلاب | القطط | الأسماك | الإجمالي | |
---|---|---|---|---|
رجال | 4 | 2 | 2 | 8 |
نساء | 4 | 6 | 2 | 12 |
الإجمالي | 8 | 8 | 4 | 20 |
بالنظر إلى هذه البيانات، احسب التوزيعات الشرطية للمجموعة السكانية الفرعية من الرجال الذين يمتلكون كل نوع من أنواع الحيوانات الأليفة.
- إجابة
-
- الرجال الذين يمتلكون الكلاب = 4/8 = 0.5
- الرجال الذين يمتلكون القطط = 2/8 = 0.25
- الرجال الذين يمتلكون الأسماك = 2/8 = 0.25
ملاحظة: يجب أن يساوي مجموع كل التوزيعات الشرطية واحدًا. في هذه الحالة، 0.5 + 0.25 + 0.25 = 1؛ لذلك، فإن الحل «يتحقق».
الرسوم البيانية والمضلعات التكرارية والرسوم البيانية للمتسلسلات الزمنية
بالنسبة لمعظم الأعمال التي تقوم بها في هذا الكتاب، ستستخدم الرسم البياني لعرض البيانات. تتمثل إحدى ميزات الرسم البياني في أنه يمكنه عرض مجموعات بيانات كبيرة بسهولة. القاعدة الأساسية هي استخدام الرسم البياني عندما تتكون مجموعة البيانات من 100 قيمة أو أكثر.
يتكون الرسم البياني من مربعات متجاورة (مجاورة). يحتوي على كل من المحور الأفقي والمحور الرأسي. يتم تسمية المحور الأفقي بما تمثله البيانات (على سبيل المثال، المسافة من المنزل إلى المدرسة). يتم تسمية المحور الرأسي إما بالتردد أو التردد النسبي (أو النسبة المئوية للتردد أو الاحتمال). سيكون للرسم البياني نفس الشكل مع أي من التسميات. يمكن أن يمنحك الرسم البياني (مثل المخطط الزمني) شكل البيانات والمركز وانتشار البيانات.
التردد النسبي يساوي تردد القيمة المرصودة للبيانات مقسومًا على العدد الإجمالي لقيم البيانات في العينة. (تذكر أن التردد يُعرّف على أنه عدد مرات ظهور الإجابة.) إذا:
- \(f\)= التردد
- \(n\)= إجمالي عدد قيم البيانات (أو مجموع الترددات الفردية)، و
- \(RF\)= التردد النسبي،
ثم:
\ [\ RF=\ frac {f} {n}\ لا يوجد رقم]
على سبيل المثال، إذا حصل ثلاثة طلاب في فصل اللغة الإنجليزية الخاص بالسيد أهاب المكون من 40 طالبًا على ما بين 90٪ إلى 100٪\(f = 3\)\(n = 40\)، فإن 7.5٪ من الطلاب تلقوا 90-100٪. 90-100٪ هي مقاييس كمية.\(RF = \frac{f}{n} = \frac{3}{40} = 0.075\)
لإنشاء رسم بياني، حدد أولاً عدد الأشرطة أو الفواصل الزمنية، والتي تسمى أيضًا الفئات، التي تمثل البيانات. تتكون العديد من الرسوم البيانية من خمسة إلى 15 شريطًا أو فئات للوضوح. يجب اختيار عدد الأشرطة. اختر نقطة بداية للفاصل الزمني الأول ليكون أقل من أصغر قيمة بيانات. نقطة البداية الملائمة هي القيمة الأقل التي يتم تنفيذها إلى منزلة عشرية أكثر من القيمة التي تحتوي على أكبر عدد من المنازل العشرية. على سبيل المثال، إذا كانت القيمة التي تحتوي على أكبر عدد من المنازل العشرية هي 6.1 وكانت هذه هي أصغر قيمة، فإن نقطة البداية المناسبة هي 6.05 (6.1 - 0.05 = 6.05). نقول أن 6.05 لديها المزيد من الدقة. إذا كانت القيمة التي تحتوي على أكبر عدد من المنازل العشرية هي 2.23 وأقل قيمة هي 1.5، فإن نقطة البداية المناسبة هي 1.495 (1.5 - 0.005 = 1.495). إذا كانت القيمة التي تحتوي على أكبر عدد من المنازل العشرية هي 3.234 وأقل قيمة هي 1.0، فإن نقطة البداية المناسبة هي 0.9995 (1.0 - 0.0005 = 0.9995). إذا كانت جميع البيانات عبارة عن أعداد صحيحة وكانت أصغر قيمة هي اثنان، فإن نقطة البداية المناسبة هي 1.5 (2 - 0.5 = 1.5). أيضًا، عندما يتم نقل نقطة البداية والحدود الأخرى إلى منزلة عشرية إضافية، لن تقع أي قيمة بيانات على الحدود. يتناول المثالان التاليان التفاصيل حول كيفية إنشاء رسم بياني باستخدام البيانات المستمرة وكيفية إنشاء رسم بياني باستخدام بيانات منفصلة.
مثال\(\PageIndex{2}\).8
البيانات التالية هي الارتفاعات (بالبوصة إلى أقرب نصف بوصة) لـ 100 لاعب كرة قدم شبه محترف من الذكور. الارتفاعات عبارة عن بيانات مستمرة، حيث يتم قياس الارتفاع.
60؛ 60.5؛ 61؛ 61؛ 61.5؛
63.5؛ 63.5 64؛
64؛ 64؛ 64؛ 64؛ 64؛ 64؛ 64؛ 64.5؛ 64.5؛ 64.5؛ 64.5؛ 64.5؛ 64.5؛ 64.5؛ 64.5؛ 66؛
66؛ 66؛ 66؛ 66؛ 66؛ 66؛ 66؛ 66؛ 66؛ 66؛ 66؛ 66؛ 66؛ 66؛ 66؛ 66.5؛ 66.5؛ 66.5؛ 66.5؛ 66.5؛ 6.5؛ 66.5؛ 66.5؛ 66.5؛ 66.5؛ 67؛ 67؛ 67؛ 67؛ 67؛ 67؛ 67؛ 67؛ 67؛ 67؛ 67؛ 67؛ 67؛ 67.5؛ 67.5؛ 67.5؛ 67.5؛ 67.5؛ 67.5؛ 67.5
68؛ 68؛ 69؛ 69؛ 69؛ 69؛ 69؛ 69؛ 69؛ 69؛ 69؛ 69؛ 69؛ 69.5؛ 69.5؛ 69.5
؛ 69.5؛ 69.5 70؛ 70؛ 70؛ 70؛ 70؛ 70.5؛ 70.5؛ 70.5؛ 71
؛ 71؛ 71 72؛ 72؛ 72.5؛ 73؛ 73.5
74
أصغر قيمة بيانات هي 60. نظرًا لأن البيانات التي تحتوي على أكبر عدد من المنازل العشرية تحتوي على رقم عشري واحد (على سبيل المثال، 61.5)، فإننا نريد أن تحتوي نقطة البداية على منزلتين عشريتين. نظرًا لأن الأرقام 0.5 و 0.05 و 0.005 وما إلى ذلك هي أرقام ملائمة، استخدم 0.05 واطرحها من 60، وهي أصغر قيمة، لنقطة البداية المناسبة.
60 - 0.05 = 59.95 وهو أكثر دقة من، على سبيل المثال، 61.5 بمنزلة عشرية واحدة. نقطة البداية هي، إذن، 59.95.
أكبر قيمة هي 74، لذلك 74 + 0.05 = 74.05 هي القيمة النهائية.
بعد ذلك، احسب عرض كل شريط أو فاصل زمني للفصول. لحساب هذا العرض، اطرح نقطة البداية من قيمة النهاية وقم بالقسمة على عدد الأشرطة (يجب عليك اختيار عدد الأشرطة التي تريدها). لنفترض أنك اخترت ثمانية أشرطة.
\[\frac{74.05−59.95}{8}=1.76\non\nonumber\]
ملاحظة
سنقوم بتقريب ما يصل إلى وحدتين وجعل كل شريط أو فاصل دراسي بعرض وحدتين. التقريب حتى اثنين هو إحدى الطرق لمنع القيمة من السقوط على الحدود. غالبًا ما يكون التقريب إلى الرقم التالي ضروريًا حتى إذا كان يتعارض مع القواعد القياسية للتقريب. في هذا المثال، استخدام 1.76 كعرض سيعمل أيضًا. المبدأ التوجيهي الذي يتبعه البعض لعرض الشريط أو الفاصل الزمني للفئة هو أخذ الجذر التربيعي لعدد قيم البيانات ثم تقريبه إلى أقرب رقم صحيح، إذا لزم الأمر. على سبيل المثال، إذا كانت هناك 150 قيمة للبيانات، فاخذ الجذر التربيعي لـ 150 وقم بتقريبه إلى 12 شريطًا أو فواصل زمنية.
الحدود هي:
- 59.95
- 59.95 + 2 = 61.95
- 61.95 + 2 = 63.95
- 63.95 + 2 = 65.95
- 65.95 + 2 = 67.95
- 67.95 + 2 = 69.95
- 69.95 + 2 = 71.95
- 71.95 + 2 = 73.95
- 73.95 + 2 = 75.95
تقع الارتفاعات من 60 إلى 61.5 بوصة في الفترة من 59.95 إلى 61.95. تقع الارتفاعات التي تبلغ 63.5 في الفترة من 61.95 إلى 63.95. تقع الارتفاعات من 64 إلى 64.5 في الفترة من 63.95 إلى 65.95. تقع الارتفاعات من 66 إلى 67.5 في الفترة من 65.95 إلى 67.95. تقع الارتفاعات من 68 إلى 69.5 في الفترة من 67.95 إلى 69.95. تقع الارتفاعات من 70 إلى 71 في الفترة من 69.95 إلى 71.95. تقع الارتفاعات من 72 إلى 73.5 في الفترة من 71.95 إلى 73.95. يقع الارتفاع 74 في الفترة من 73.95 إلى 75.95.
يعرض الرسم البياني التالي الارتفاعات على المحور x والتردد النسبي على المحور y.
التمارين\(\PageIndex{2}\).8
البيانات التالية هي أحجام أحذية 50 طالبًا من الذكور. المقاسات عبارة عن بيانات مستمرة حيث يتم قياس مقاس الحذاء. قم بإنشاء رسم بياني واحسب عرض كل شريط أو فاصل دراسي. لنفترض أنك اخترت ستة أشرطة.
9؛ 9؛ 9.5؛ 9.5؛ 10؛ 10؛ 10؛ 10؛ 10؛ 10؛ 10.5؛ 10.5؛ 10.5؛ 10.5؛ 10.5؛ 10.5؛ 10.5 11؛ 11؛ 11؛ 11؛ 11؛ 11؛ 11؛
11؛ 11؛ 11؛ 11؛ 11؛ 11؛ 11؛ 11؛ 11؛ 11؛ 11.5؛ 11.5؛ 11.5؛ 11.5؛ 11.5؛ 11.5؛ 11.5؛ 11.5؛ 11.5؛ 11.5؛ 11.5؛ 11.5
؛ 11.5؛ 11.5؛ 11.5؛ 11.5؛ 11.5؛ 11.5؛ 11.5؛ 11.5؛ 11.5؛؛ 14
مثال\(\PageIndex{2}\).9
قم بإنشاء رسم بياني للبيانات التالية: عدد الكتب التي اشتراها 50 طالبًا جامعيًا بدوام جزئي في ABC College. عدد الكتب عبارة عن بيانات منفصلة، حيث يتم حساب الكتب.
1؛ 1؛ 1؛ 1؛ 1؛ 1؛ 1؛ 1؛ 1؛ 1؛ 2؛
2؛ 2؛ 2؛ 2؛ 2؛ 2؛ 2؛ 2؛ 2؛ 3؛
3؛ 3؛ 3؛ 3؛ 3؛ 3؛ 3؛ 3؛ 3؛ 3؛ 3؛ 3؛ 3؛ 3؛ 4؛ 4؛ 4؛
4؛ 4؛ 4؛ 4؛ 4؛ 5؛
5؛ 5؛ 5؛ 5؛ 5؛ 5؛
6
يشتري أحد عشر طالبًا كتابًا واحدًا. عشرة طلاب يشترون كتابين. ستة عشر طالبًا يشترون ثلاثة كتب. ستة طلاب يشترون أربعة كتب. خمسة طلاب يشترون خمسة كتب. يشتري اثنان من الطلاب ستة كتب.
ونظرًا لأن البيانات عبارة عن أعداد صحيحة، فقم بطرح 0.5 من 1، وهي أصغر قيمة للبيانات وإضافة 0.5 إلى 6، وهي أكبر قيمة للبيانات. ثم نقطة البداية هي 0.5 وقيمة النهاية هي 6.5.
بعد ذلك، احسب عرض كل شريط أو فاصل زمني للفصول. إذا كانت البيانات منفصلة وليس هناك الكثير من القيم المختلفة، فإن العرض الذي يضع قيم البيانات في منتصف الشريط أو الفاصل الزمني للفئة هو الأكثر ملاءمة. نظرًا لأن البيانات تتكون من الأرقام 1، 2، 3، 4، 5، 6، ونقطة البداية هي 0.5، فإن عرض واحد يضع 1 في منتصف الفاصل الزمني من 0.5 إلى 1.5، و 2 في منتصف الفاصل الزمني من 1.5 إلى 2.5، و 3 في منتصف الفاصل الزمني من 2.5 إلى 3.5، و 4 في منتصف الفاصل الزمني من _____ __ إلى _______، و5 في منتصف الفاصل الزمني من _______ إلى _______، و_______ في منتصف الفاصل الزمني من _______ إلى _______.
الحل
احسب عدد الأشرطة كما يلي:
\[\frac{6.5−0.5}{\text{number of bars}}=1\nonumber\]
حيث 1 هو عرض الشريط. لذلك، الأشرطة = 6.
يعرض الرسم البياني التالي عدد الكتب على المحور x والتردد على المحور y.
مثال\(\PageIndex{2}\).10
باستخدام مجموعة البيانات هذه، قم بإنشاء رسم بياني.
\ (\ فهرس الصفحات {13}\) «>عدد الساعات التي أمضاها زملائي في لعب ألعاب الفيديو في عطلات نهاية الأسبوع | ||||
---|---|---|---|---|
9.95 | 10 | 2.25 | 16.75 | 0 |
19.5 | 22.5 | 7.5 | 15 | 12.75 |
5.5 | 11 | 10 | 20.75 | 17.5 |
23 | 21.9 | 24 | 23.75 | 18 |
20 | 15 | 22.9 | 18.8 | 20.5 |
- إجابة
-
الحل 2.10
تقع بعض القيم في مجموعة البيانات هذه على حدود الفواصل الزمنية للفواصل الدراسية. يتم حساب القيمة في فاصل الفصل الدراسي إذا كانت تقع على الحد الأيسر، ولكن ليس إذا كانت تقع على الحد الأيمن. قد يقوم باحثون مختلفون بإعداد رسوم بيانية لنفس البيانات بطرق مختلفة. هناك أكثر من طريقة صحيحة لإعداد رسم بياني.
مضلعات التردد
تتشابه مضلعات التردد مع الرسوم البيانية الخطية، ومثلما تجعل الرسوم البيانية الخطية البيانات المستمرة سهلة التفسير بصريًا، وكذلك تفعل مضلعات التردد.
لإنشاء مضلع ترددي، قم أولاً بفحص البيانات وحدد عدد الفواصل الزمنية، أو الفواصل بين الفئات، لاستخدامها على المحور x والمحور y. بعد اختيار النطاقات المناسبة، ابدأ بتخطيط نقاط البيانات. بعد رسم جميع النقاط، ارسم مقاطع الخط لتوصيلها.
مثال\(\PageIndex{2}\).11
تم إنشاء مضلع التردد من جدول التردد أدناه.
\ (\ فهرس الصفحات {14}\) «>الحد الأدنى | الحد العلوي | التردد | التردد التراكمي |
---|---|---|---|
49.5 | 59.5 | 5 | 5 |
59.5 | 69.5 | 10 | 15 |
69.5 | 79.5 | 30 | 45 |
79.5 | 89.5 | 40 | 85 |
89.5 | 99.5 | 15 | 100 |
التسمية الأولى على المحور x هي 44.5. يمثل هذا فاصلًا يمتد من 39.5 إلى 49.5. نظرًا لأن أقل درجة اختبار هي 54.5، يتم استخدام هذا الفاصل الزمني فقط للسماح للرسم البياني بلمس المحور x. تمثل النقطة المسماة 54.5 الفاصل الزمني التالي، أو الفاصل الزمني «الحقيقي» الأول من الجدول، وتحتوي على خمس درجات. يتم اتباع هذا المنطق لكل من الفواصل الزمنية المتبقية حيث تمثل النقطة 104.5 الفترة من 99.5 إلى 109.5. مرة أخرى، لا يحتوي هذا الفاصل الزمني على بيانات ويتم استخدامه فقط حتى يلمس الرسم البياني المحور x. بالنظر إلى الرسم البياني، نقول أن هذا التوزيع منحرف لأن أحد جانبي الرسم البياني لا يعكس الجانب الآخر.
التمارين\(\PageIndex{2}\).11
قم بإنشاء مضلع ترددي لأعمار رؤساء الولايات المتحدة عند التنصيب الموضح في الجدول\(\PageIndex{15}\).
\ (\ فهرس الصفحات {15}\) «>العمر عند الافتتاح | التردد |
---|---|
41.5-46.5 | 4 |
46.5—51.5 | 11 |
51.5-56.5 | 14 |
56.5—61.5 | 9 |
61.5-66.5 | 4 |
66.5—71.5 | 2 |
تعد مضلعات التردد مفيدة لمقارنة التوزيعات. يتم تحقيق ذلك من خلال تراكب مضلعات التردد المرسومة لمجموعات البيانات المختلفة.
مثال\(\PageIndex{2}\).12
سنقوم بإنشاء مضلع تردد التراكب لمقارنة الدرجات من المثال\(\PageIndex{11}\) بالتقدير الرقمي النهائي للطلاب.
\ (\ فهرس الصفحات {16}\) «>الحد الأدنى | الحد العلوي | التردد | التردد التراكمي |
---|---|---|---|
49.5 | 59.5 | 5 | 5 |
59.5 | 69.5 | 10 | 15 |
69.5 | 79.5 | 30 | 45 |
79.5 | 89.5 | 40 | 85 |
89.5 | 99.5 | 15 | 100 |
الحد الأدنى | الحد العلوي | التردد | التردد التراكمي |
---|---|---|---|
49.5 | 59.5 | 10 | 10 |
59.5 | 69.5 | 10 | 20 |
69.5 | 79.5 | 30 | 50 |
79.5 | 89.5 | 45 | 95 |
89.5 | 99.5 | 5 | 100 |
إنشاء رسم بياني للمتسلسلات الزمنية
لنفترض أننا نريد دراسة نطاق درجة حرارة المنطقة لمدة شهر كامل. كل يوم عند الظهر نلاحظ درجة الحرارة ونكتبها في سجل. يمكن إجراء مجموعة متنوعة من الدراسات الإحصائية باستخدام هذه البيانات. يمكننا العثور على متوسط أو متوسط درجة الحرارة لهذا الشهر. يمكننا إنشاء رسم بياني يعرض عدد الأيام التي تصل فيها درجات الحرارة إلى نطاق معين من القيم. ومع ذلك، تتجاهل كل هذه الطرق جزءًا من البيانات التي جمعناها.
إحدى ميزات البيانات التي قد نرغب في أخذها في الاعتبار هي الوقت. نظرًا لأن كل تاريخ يقترن بقراءة درجة الحرارة لهذا اليوم، فلا يتعين علينا التفكير في البيانات على أنها عشوائية. يمكننا بدلاً من ذلك استخدام الأوقات المعطاة لفرض ترتيب زمني على البيانات. يُطلق على الرسم البياني الذي يتعرف على هذا الترتيب ويعرض درجة الحرارة المتغيرة مع تقدم الشهر رسم بياني للسلاسل الزمنية.
لإنشاء رسم بياني للسلاسل الزمنية، يجب أن ننظر إلى كلا الجزئين من مجموعة البيانات المزدوجة الخاصة بنا. نبدأ بنظام الإحداثيات الديكارتية القياسية. يتم استخدام المحور الأفقي لرسم زيادات التاريخ أو الوقت، ويتم استخدام المحور الرأسي لرسم قيم المتغير الذي نقوم بقياسه. من خلال القيام بذلك، نجعل كل نقطة على الرسم البياني تتوافق مع التاريخ والكمية المقاسة. عادةً ما ترتبط النقاط على الرسم البياني بخطوط مستقيمة بالترتيب الذي تظهر به.
مثال\(\PageIndex{2}\).13
توضح البيانات التالية مؤشر أسعار المستهلك السنوي، كل شهر، لمدة عشر سنوات. قم بإنشاء رسم بياني للتسلسل الزمني لبيانات مؤشر أسعار المستهلك السنوي فقط.
\ (\ فهرس الصفحات {18}\) «>عام | يناير | فبراير | مسخ | أبريل | مايو | يونيو | يوليو |
---|---|---|---|---|---|---|---|
2003 | 181.7 | 183.1 | 184.2 | 183.8 | 183.5 | 183.7 | 183.9 |
2004 | 185.2 | 186.2 | 187.4 | 188.0 | 189.1 | 189.7 | 189.4 |
2005 | 190.7 | 191.8 | 193.3 | 194.6 | 194.4 | 194.5 | 195.4 |
2006 | 198.3 | 198.7 | 199.8 | 201.5 | 202.5 | 202.9 | 203.5 |
2007 | 202.416 | 203.499 | 205.352 | 206.686 | 207.949 | 208.352 | 208.29 |
2008 | 21.080 | 211.693 | 213.528 | 214.823 | 216.632 | 218.815 | 219.964 |
2009 | 211.143 | 212.193 | 212.709 | 213.240 | 213.856 | 215.693 | 215.351 |
2010 | 216.687 | 216.741 | 217.631 | 218.009 | 218.178 | 217.965 | 218.011 |
2011 | 220.223 | 221.309 | 223.467 | 224.906 | 225.964 | 225.722 | 225.92 |
2012 | 226.665 | 227.663 | 229.392 | 230.085 | 229.815 | 229.478 | 229.104 |
عام | أغسطس | سبتمبر | أكتوبر | نوفمبر | ديسمبر | السنوية |
---|---|---|---|---|---|---|
2003 | 184.6 | 185.2 | 185.0 | 184.5 | 184.3 | 184.0 |
2004 | 189.5 | 189.9 | 190.9 | 191.0 | 190.3 | 188.9 |
2005 | 196.4 | 198.8 | 199.2 | 1976 | 196.8 | 195.3 |
2006 | 203.9 | 202.9 | 201.8 | 201.5 | 201.8 | 2016. |
2007 | 207.917 | 208.490 | 208.936 | 210.17 | 210.036 | 207.342 |
2008 | 219.086 | 218.783 | 216.573 | 212.425 | 210.228 | 215.303 |
2009 | 215.834 | 215.969 | 216.177 | 216.30 | 215.949 | 214.537 |
2010 | 218.312 | 218.439 | 218.711 | 218.803 | 219.179 | 218.056 |
2011 | 226.545 | 226.89 | 226.421 | 226.230 | 225.672 | 224.939 |
2012 | 230.379 | 231.407 | 231.317 | 230.221 | 229.601 | 229.594 |
- إجابة
-
الحل 2.13
التمارين\(\PageIndex{2}\).13
الجدول التالي هو جزء من مجموعة بيانات من www.worldbank.org. استخدم الجدول لإنشاء رسم بياني للتسلسل الزمني لانبعاثات ثاني أكسيد الكربون في الولايات المتحدة.
\ (\ فهرس الصفحات {20}\) «>عام | أوكرانيا | المملكة المتحدة | الولايات المتحدة |
---|---|---|---|
2003 | 352,259 | 540 ألفا و 640 | 5,681,664 |
2004 | 343,121 | 540,409 | 5,790,761 |
2005 | 339,029 | 541,990 | 5,826,394 |
2006 | 327,797 | 542,045 | 5,737,615 |
2007 | 328,357 | 528,631 | 5,828,697 |
2008 | 323,657 | 522,247 | 5,656,839 |
2009 | 272,176 | 474,579 | 5,299,563 |
استخدامات الرسم البياني للمتسلسلات الزمنية
تعد الرسوم البيانية للسلاسل الزمنية أدوات مهمة في تطبيقات الإحصاء المختلفة. عند تسجيل قيم نفس المتغير على مدى فترة زمنية طويلة، يصعب أحيانًا تمييز أي اتجاه أو نمط. ومع ذلك، بمجرد عرض نقاط البيانات نفسها بشكل رسومي، تقفز بعض الميزات. الرسوم البيانية للسلاسل الزمنية تجعل من السهل تحديد الاتجاهات.
كيف لا تكذب مع الإحصائيات
من المهم أن نتذكر أن السبب وراء تطوير مجموعة متنوعة من الأساليب لتقديم البيانات هو تطوير رؤى حول موضوع ما تمثله الملاحظات. نريد الحصول على «إحساس» بالبيانات. هل جميع الملاحظات متشابهة جدًا أم أنها منتشرة عبر مجموعة واسعة من القيم، هل يتم تجميعها في أحد طرفي الطيف أم يتم توزيعها بالتساوي وما إلى ذلك. نحن نحاول الحصول على صورة مرئية للبيانات العددية. سنقوم قريبًا بتطوير مقاييس رياضية رسمية للبيانات، لكن عرضنا الرسومي المرئي يمكن أن يقول الكثير. لسوء الحظ، يمكنها أيضًا أن تقول الكثير مما يشتت الانتباه والارتباك والخطأ ببساطة من حيث الانطباع الذي يتركه المرئي. منذ سنوات عديدة كتب داريل هوف كتاب كيفية الكذب مع الإحصائيات. لقد تمت طباعة أكثر من 25 نسخة وبيعت أكثر من مليون ونصف نسخة. كانت وجهة نظره قاسية واستخدم العديد من الأمثلة الفعلية التي تم تصميمها للتضليل. لقد أراد أن يجعل الناس على دراية بهذا الخداع، ولكن ربما الأهم من ذلك هو تثقيفهم حتى لا يرتكب الآخرون نفس الأخطاء عن غير قصد.
مرة أخرى، الهدف هو التنوير باستخدام المرئيات التي تحكي قصة البيانات. تحتوي المخططات الدائرية على عدد من المشكلات الشائعة عند استخدامها لنقل رسالة البيانات. الكثير من قطع الفطيرة تطغى على القارئ. ربما يجب أن تعطي أكثر من خمس أو ست فئات فكرة عن الأهمية النسبية لكل قطعة. هذا هو بعد كل شيء هدف المخطط الدائري، أي المجموعة الفرعية الأكثر أهمية بالنسبة للآخرين. إذا كان هناك مكونات أكثر من هذا، فربما يكون النهج البديل أفضل أو ربما يمكن دمج بعضها في فئة «أخرى». لا يمكن للمخططات الدائرية عرض التغييرات بمرور الوقت، على الرغم من أننا نرى هذه المحاولة كثيرًا. في المستندات المالية الفيدرالية والولائية والمدينة، غالبًا ما يتم تقديم المخططات الدائرية لإظهار مكونات الإيرادات المتاحة للهيئة الإدارية للتخصيص: ضريبة الدخل وضريبة المبيعات وضرائب السيارات وما إلى ذلك. هذه في حد ذاتها معلومات مثيرة للاهتمام ويمكن القيام بها بشكل جيد باستخدام مخطط دائري. يحدث الخطأ عندما يتم تعيين عامين جنبًا إلى جنب. نظرًا لأن إجمالي الإيرادات يتغير من عام إلى آخر، ولكن حجم الفطيرة ثابت، فلا يتم تقديم معلومات حقيقية ولا يمكن مقارنة الحجم النسبي لكل قطعة من الكعكة بشكل هادف.
يمكن أن تكون الرسوم البيانية مفيدة جدًا في فهم البيانات. عند تقديمها بشكل صحيح، يمكن أن تكون طريقة مرئية سريعة لعرض احتمالات الفئات المختلفة من خلال الصورة المرئية البسيطة لمقارنة المناطق النسبية في كل فئة. هنا الخطأ، سواء كان هادفًا أم لا، هو تغيير عرض الفئات. هذا بالطبع يجعل المقارنة بالفئات الأخرى مستحيلة. إنها تزين أهمية الفئة ذات العرض الموسع لأنها تحتوي على مساحة أكبر، بشكل غير لائق، وبالتالي «تقول» بصريًا أن هذه الفئة لديها احتمال أكبر للحدوث.
ربما تكون الرسوم البيانية للسلاسل الزمنية هي الأكثر استخدامًا. لا ينبغي أبدًا عرض مخطط لبعض المتغيرات عبر الزمن على المحاور التي تغير الجزء عبر الصفحة إما في البعد الرأسي أو الأفقي. ربما يتم تغيير الإطار الزمني من سنوات إلى أشهر. ربما كان هذا لتوفير المساحة أو لأن البيانات الشهرية لم تكن متاحة في السنوات الأولى. في كلتا الحالتين، يؤدي هذا إلى إرباك العرض التقديمي وتدمير أي قيمة للرسم البياني. إذا لم يتم ذلك لإرباك القارئ عن قصد، فمن المؤكد أنه عمل كسول أو قذر.
يمكن أن يؤدي تغيير وحدات قياس المحور إلى تخفيف الانخفاض أو إبرازه. إذا كنت ترغب في عرض تغييرات كبيرة، فقم بقياس المتغير بوحدات صغيرة، بنس واحد بدلاً من آلاف الدولارات. وبالطبع لمواصلة الاحتيال، تأكد من أن المحور لا يبدأ عند الصفر أو الصفر. إذا بدأ عند الصفر أو الصفر، يصبح من الواضح أن المحور قد تم التلاعب به.
ربما لديك عميل يهتم بتقلب المحفظة التي تديرها. طريقة سهلة لتقديم البيانات هي استخدام فترات زمنية طويلة على الرسم البياني للسلسلة الزمنية. استخدم الأشهر أو الأرباع بدلاً من البيانات اليومية أو الأسبوعية. إذا لم يؤدي ذلك إلى خفض التقلب، فقم بتوزيع المحور الزمني بالنسبة لمعدل العائد أو محور تقييم المحفظة. إذا كنت تريد إظهار نمو دراماتيكي «سريع»، فقم بتقليص محور الوقت. سيظهر أي نمو إيجابي معدلات نمو «عالية» بصريًا. لاحظ أنه إذا كان النمو سلبيًا، فستظهر هذه الحيلة أن المحفظة تنهار بمعدل كبير.
مرة أخرى، الهدف من الإحصاء الوصفي هو نقل صور ذات مغزى تحكي قصة البيانات. التلاعب المتعمد هو احتيال وغير أخلاقي في أسوأ الأحوال، ولكن حتى في أفضل حالاته، فإن ارتكاب هذا النوع من الأخطاء سيؤدي إلى الارتباك من جانب التحليل.