Loading [MathJax]/jax/output/HTML-CSS/jax.js
Skip to main content
Library homepage
 
Global

2.2: مقاييس موقع البيانات

المقاييس الشائعة للموقع هي الأرباع والنسب المئوية

الرباعيات هي نسب مئوية خاصة. الربع الأول،Q1، هو نفس25th النسبة المئوية، والربع الثالثQ3، هو نفس75th النسبة المئوية. يُطلق على المتوسط، M، كلا من الربع الثاني والنسبة المئوية الخمسين.

لحساب الأرباع والنسب المئوية، يجب ترتيب البيانات من الأصغر إلى الأكبر. تقسم Quartiles البيانات المرتبة إلى أرباع. تقسم النسب المئوية البيانات المرتبة إلى المئات. إن الحصول على نتيجة في90th النسبة المئوية للاختبار لا يعني بالضرورة حصولك على 90% في الاختبار. هذا يعني أن 90٪ من درجات الاختبار هي نفسها أو أقل من درجاتك و 10٪ من درجات الاختبار هي نفسها أو أكبر من درجاتك في الاختبار.

النسب المئوية مفيدة لمقارنة القيم. لهذا السبب، تستخدم الجامعات والكليات النسب المئوية على نطاق واسع. إحدى الحالات التي تستخدم فيها الكليات والجامعات النسب المئوية هي عندما يتم استخدام نتائج SAT لتحديد الحد الأدنى من درجات الاختبار التي سيتم استخدامها كعامل قبول. على سبيل المثال، لنفترض أن Duke يقبل درجات SAT عند75th النسبة المئوية أو أعلى منها. وهذا يترجم إلى درجة 1220 على الأقل.

يتم استخدام النسب المئوية في الغالب مع عدد كبير جدًا من السكان. لذلك، إذا قلت إن 90٪ من درجات الاختبار أقل (وليست هي نفسها أو أقل) من درجاتك، فسيكون ذلك مقبولًا لأن إزالة قيمة بيانات معينة ليست مهمة.

الوسيط هو رقم يقيس «مركز» البيانات. يمكنك التفكير في الوسيط على أنه «القيمة المتوسطة»، ولكن لا يجب أن يكون في الواقع أحد القيم المرصودة. إنه رقم يفصل البيانات المرتبة إلى نصفين. نصف القيم هي نفس الرقم أو أصغر من الوسيط، ونصف القيم هي نفس الرقم أو أكبر. على سبيل المثال، ضع في اعتبارك البيانات التالية.
1;11.5;6;7.2;4;8;9;10;6.8;8.3;2;2;10;1
مرتبة من الأصغر إلى الأكبر:
1;1;2;2;4;6;6.8;7.2;8;8.3;9;10;10;11.5

نظرًا لوجود 14 ملاحظة، يقع الوسيط بين القيمة السابعة، 6.8، والقيمة الثامنة، 7.2. للعثور على الوسيط، قم بإضافة القيمتين معًا والقسمة على اثنين.

6.8+7.22=7

الوسيط هو سبعة. نصف القيم أصغر من سبعة ونصف القيم أكبر من سبعة.

الرباعيات هي الأرقام التي تفصل البيانات إلى أرباع. قد تكون Quartiles أو لا تكون جزءًا من البيانات. لإيجاد الأرباع، ابحث أولاً عن المتوسط أو الربع الثاني. الربع الأول،Q1، هو القيمة المتوسطة للنصف السفلي من البيانات، والربع الثالث،Q3، هو القيمة المتوسطة، أو الوسيط، للنصف العلوي من البيانات. للحصول على الفكرة، ضع في اعتبارك نفس مجموعة البيانات:
1؛ 1؛ 2؛ 2؛ 4؛ 6؛ 6.8؛ 7.2؛ 8؛ 8.3؛ 9؛ 10؛ 10؛ 11.5

المتوسط أو الربع الثاني هو سبعة. النصف السفلي من البيانات هو 1، 1، 2، 2، 4، 6، 6.8. القيمة المتوسطة للنصف السفلي هي اثنان.
1؛ 1؛ 2؛ 2؛ 4؛ 6؛ 6.8

الرقم الثاني، وهو جزء من البيانات، هو الربع الأول. ربع مجموعات القيم بأكملها هي نفسها أو أقل من اثنين وثلاثة أرباع القيم أكثر من اثنين.

النصف العلوي من البيانات هو 7.2، 8، 8.3، 9، 10، 10، 11.5. القيمة المتوسطة للنصف العلوي هي تسعة.

الربع الثالث،Q3، هو تسعة. ثلاثة أرباع (75٪) من مجموعة البيانات المطلوبة أقل من تسعة. يزيد ربع (25٪) من مجموعة البيانات المطلوبة عن تسعة. الربع الثالث هو جزء من مجموعة البيانات في هذا المثال.

النطاق بين الربعي هو رقم يشير إلى انتشار النصف الأوسط أو منتصف 50٪ من البيانات. إنه الفرق بين الربع الثالث (Q3) والربع الأول (Q1).

IQR=Q3Q1

IQRيمكن أن تساعد في تحديد القيم المتطرفة المحتملة. يُشتبه في أن تكون القيمة غريبة محتملة إذا كانت\boldsymbol{\bf{(1.5)(IQR)} أقل من الربع الأول أو أكثر(1.5)(IQR) من الربع الثالث. تتطلب القيم المتطرفة المحتملة دائمًا مزيدًا من التحقيق.

القيم المتطرفة المحتملة

أما القيم المتطرفة المحتملة فهي نقطة بيانات تختلف اختلافًا كبيرًا عن نقاط البيانات الأخرى. قد تكون نقاط البيانات الخاصة هذه أخطاء أو نوعًا من الخلل أو قد تكون مفتاحًا لفهم البيانات.

مثال2.2.14

بالنسبة لأسعار العقارات الـ 13 التالية، قم بحسابIQR وتحديد ما إذا كانت هناك أسعار غريبة محتملة. الأسعار بالدولار.
389,950;230,500;158,000;479,000;639,000;114,950;5,500,000;387,000;659,000;529,000;575,000;488,800;1,095,000

إجابة

الحل 2.14

رتب البيانات من الأصغر إلى الأكبر.

114,950;158,000;230,500;387,000;389,950;479,000;488,800;529,000;575,000;639,000;659,000;1,095,000;5,500,000

M=488,800

Q1=230,500+387,0002=308,750

Q3=639,000+659,0002=649,000

IQR=649,000308,750=340,250

(1.5)(IQR)=(1.5)(340,250)=510,375

Q1(1.5)(IQR)=308,750510,375=201,625

Q3+(1.5)(IQR)=649,000+510,375=1,159,375

لا يوجد سعر منزل أقل من201,625. ومع ذلك,5,500,000 هو أكثر من1,159,375. لذلك،5,500,000 هو أمر غريب محتمل.

مثال2.2.15

بالنسبة لمجموعتي البيانات في مثال درجات الاختبار، ابحث عن التالي:

  1. النطاق بين الربعي. قارن بين النطاقين الربيعيين.
  2. أي قيم خارجية في أي من المجموعتين.
إجابة

الحل 2.15

الملخص المكون من خمسة أرقام للفصول النهارية والليلية هو

\ (\ فهرس الصفحات {21}\) «>
الحد الأدنى Q1 الوسيط Q3 الحد الأقصى
يوم 32 \ (Q_1\)» class= «lt-stats-4548">56 74.5 \ (Q_3\)» class= «lt-stats-4548">82.5 99
ليلة 25.5 \ (Q_1\)» class= «lt-stats-4548">78 81 \ (Q_3\)» class= «lt-stats-4548">89 98
طاولة2.2.21

أ-IQR مجموعة اليوم هيQ3Q1=82.556=26.5

المجموعة الليلية هيIQRQ3Q1=8978=11

النطاق الربعي (الفارق أو التباين) للفصل النهاري أكبر من الفصل الليليIQR. يشير هذا إلى أنه سيتم العثور على مزيد من الاختلاف في درجات اختبار الفصل الدراسي النهاري.

ب. يتم العثور على القيم المتطرفة لفئة اليوم باستخدام قاعدةIQR الضرب 1.5. لذا،
  • Q1IQR(1.5)=5626.5(1.5)=16.25
  • Q3+IQR(1.5)=82.5+26.5(1.5)=122.25

نظرًا لأن القيم الدنيا والقصوى للفصل الدراسي اليومي أكبر من16.25 وأقل من122.25، فلا توجد قيم خارجية.

يتم حساب القيم المتطرفة في الدرجة الليلية على النحو التالي:

  • Q1IQR(1.5)=7811(1.5)=61.5
  • Q3+IQR(1.5)=89+11(1.5)=105.5

بالنسبة لهذه الفئة،61.5 تعتبر أي درجة اختبار أقل من القيم المتطرفة. لذلك، فإن45 الدرجات25.5 هي قيم متطرفة. نظرًا لعدم وجود درجة اختبار أكبر من 105.5، فلا يوجد فرق في الطرف العلوي.

مثال2.2.16

سُئل خمسون طالبًا متخصصًا في الإحصاء عن مقدار النوم الذي يحصلون عليه في كل ليلة مدرسية (تم تقريبه إلى أقرب ساعة). كانت النتائج:

\ (\ فهرس الصفحات {22}\) «>
مقدار النوم لكل ليلة مدرسية (ساعات) التردد التردد النسبي التردد النسبي التراكمي
4 2 0.04 0.04
5 5 0.10 0.14
6 7 0.14 0.28
7 12 0.24 0.52
8 14 0.28 0.80
9 7 0.14 0.94
10 3 0.06 1.00
طاولة2.2.22

أوجد النسبة المئوية ٢٨. لاحظ 0.28 في عمود «التردد النسبي التراكمي». ثمانية وعشرون بالمائة من 50 قيمة بيانات هي 14 قيمة. هناك 14 قيمة أقل من النسبة المئوية 28. وهي تشمل طائرتي 4s وخمسة 5s وسبعة 6s. النسبة المئوية 28 تقع بين الستة الأخيرة والسبعة الأولى. النسبة المئوية 28 هي 6.5.

ابحث عن الوسيط. انظر مرة أخرى إلى عمود «التردد النسبي التراكمي» وابحث عن 0.52. الوسيط هو النسبة المئوية 50 للربع الثاني. 50٪ من 50 هي 25. هناك 25 قيمة أقل من المتوسط. وهي تشمل طائرتي 4s وخمسة 5s وسبعة 6s وأحد عشر من 7s. يقع الوسيط أو النسبة المئوية الخمسين بين القيم 25 أو السابعة والسادسة والعشرين أو السابعة. الوسيط هو سبعة.

أوجد الربع الثالث. الربع الثالث هو نفس النسبة75th المئوية. يمكنك «تحديد» هذه الإجابة. إذا نظرت إلى عمود «التردد النسبي التراكمي»، ستجد 0.52 و 0.80. عندما يكون لديك جميع الأربعة والخمس والستات والسبعات، يكون لديك 52٪ من البيانات. عندما تقوم بتضمين جميع الـ 8، يكون لديك 80٪ من البيانات. إذن، يجب أن تكونbf75th النسبة المئوية ثمانية. هناك طريقة أخرى للنظر إلى المشكلة وهي العثور على 75٪ من 50، أي 37.5، والتقريب إلى 38. الربع الثالث،Q3، هو القيمة 38، وهي ثمانية. يمكنك التحقق من هذه الإجابة عن طريق حساب القيم. (هناك 37 قيمة أقل من الربع الثالث و 12 قيمة أعلاه.)

التمارين الرياضية2.2.16

تم سؤال أربعين سائق حافلة عن عدد الساعات التي يقضونها يوميًا في تشغيل مساراتهم (تقريبها إلى أقرب ساعة). أوجد النسبة المئوية الخامسة والستين.

\ (\ فهرس الصفحات {23}\) «>
مقدار الوقت المستغرق في المسار (ساعات) التردد التردد النسبي التردد النسبي التراكمي
2 12 0.30 0.30
3 14 0.35 0.65
4 10 0.25 0.90
5 4 0.10 1.00
طاولة2.2.23

مثال2.2.17

استخدام الجدول2.2.22:

  1. ابحث عن80th النسبة المئوية.
  2. ابحث عن90th النسبة المئوية.
  3. أوجد الربع الأول. ما الاسم الآخر للربع الأول؟
إجابة

الحل 2.17

باستخدام البيانات من جدول التردد، لدينا:

أ-80th تقع النسبة المئوية بين الثمانية الأخيرة والتسعة الأولى في الجدول (بين41st القيم40th والقيم). لذلك، نحتاج إلى أخذ متوسط41st قيم40th an. 80thالمئوي=8+92=8.5

ب- ستكون90th النسبة المئوية هي قيمة45th البيانات (الموقع هو0.90(50)=45) وقيمة البيانات 45 هي تسعة.

ج.Q1 هي أيضًا النسبة المئوية الخامسة والعشرين. حساب25th الموقع المئوي:P25=0.25(50)=12.513 قيمة13th البيانات. وبالتالي، فإن25th النسبة المئوية هي ستة.

صيغة لإيجاد النسبة المئويةk العاشرة

إذا كنت تريد إجراء القليل من البحث، فستجد عدة صيغ لحساب النسبةkth المئوية. هنا واحد منهم.

k=kthالمئوي. قد تكون أو لا تكون جزءًا من البيانات.

i=الفهرس (ترتيب أو موضع قيمة البيانات)

n=إجمالي عدد نقاط البيانات أو الملاحظات

  • رتب البيانات من الأصغر إلى الأكبر.
  • احسبi=k100(n+1)
  • إذا كان i عددًا صحيحًا، فإنkth النسبة المئوية هي قيمة البيانات فيith الموضع في مجموعة البيانات المرتبة.
  • إذا لم يكن عددًا صحيحًا، فقم بتقريبه لأعلى وتقريبه إلى أقرب عدد صحيح. قم بمتوسط قيمتي البيانات في هذين الموضعين في مجموعة البيانات المرتبة. هذا أسهل للفهم في مثال.

مثال2.2.18

تم إدراج 29 عمرًا لأفضل الممثلين الحائزين على جائزة الأوسكار بالترتيب من الأصغر إلى الأكبر.
18;21;22;25;26;27;29;30;31;33;36;37;41;42;47;52;55;57;58;62;64;67;69;71;72;73;74;76;77

  1. ابحث عن70th النسبة المئوية.
  2. ابحث عن83rd النسبة المئوية.
إجابة

الحل 2.18

1.

  • k=70
  • i= الفهرس
  • n=29
i=k100(n+1)=(70100)(29+1)=21. واحد وعشرون هو عدد صحيح، وقيمة البيانات في الموضع الحادي والعشرين في مجموعة البيانات المرتبة هي 64. النسبة المئوية السبعين هي 64 عامًا.

2.

  • k=83rdالمئوي
  • i= الفهرس
  • n=29
i=k100(n+1)=(83100)(29+1)=24.9، وهو ليس عددًا صحيحًا. قم بتقريبه إلى 24 وما يصل إلى 25. العمر في24th المنصب هو 71 والعمر في25th المنصب هو 72. متوسط 71 و 72. النسبة83rd المئوية هي 71.5 سنة.

التمارين الرياضية2.2.18

تم إدراج 29 عمرًا لأفضل الممثلين الحائزين على جائزة الأوسكار بالترتيب من الأصغر إلى الأكبر.

18;21;22;25;26;27;29;30;31;33;36;37;41;42;47;52;55;57;58;62;64;67;69;71;72;73;74;76;77
احسب النسبة المئوية ٢٠ والنسبة المئوية ٥٥.

صيغة لإيجاد النسبة المئوية للقيمة في مجموعة بيانات

  • رتب البيانات من الأصغر إلى الأكبر.
  • x= عدد قيم البيانات التي يتم حسابها من أسفل قائمة البيانات حتى ولكن ليس بما في ذلك قيمة البيانات التي تريد العثور على النسبة المئوية لها.
  • y= عدد قيم البيانات المساوية لقيمة البيانات التي تريد العثور على النسبة المئوية لها.
  • n= إجمالي عدد البيانات.
  • احسبx+0.5yn(100). ثم قم بتقريبه إلى أقرب عدد صحيح.

مثال2.2.19

تم إدراج 29 عمرًا لأفضل الممثلين الحائزين على جائزة الأوسكار بالترتيب من الأصغر إلى الأكبر.
18;21;22;25;26;27;29;30;31;33;36;37;41;42;47;52;55;57;58;62;64;67;69;71;72;73;74;76;77

  1. ابحث عن النسبة المئوية لـ 58.
  2. ابحث عن النسبة المئوية لـ 25.
إجابة

الحل 2.19

1. عند العد من أسفل القائمة، هناك 18 قيمة بيانات أقل من 58. هناك قيمة واحدة قدرها 58.

x=18وy=1.x+0.5yn(100)=18+0.5(1)29(100)=63.80. 58 هي64th النسبة المئوية.

2. عند العد من أسفل القائمة، توجد ثلاث قيم بيانات أقل من 25. هناك قيمة واحدة قدرها 25.

x=3وy=1.x+0.5yn(100)=3+0.5(1)29(100)=12.07. خمسة وعشرون هي12th النسبة المئوية.

تفسير النسب المئوية والأرباع والوسيط

تشير النسبة المئوية إلى المكانة النسبية لقيمة البيانات عندما يتم فرز البيانات بترتيب رقمي من الأصغر إلى الأكبر. النسب المئوية لقيم البيانات أقل من أو تساوي النسبة المئوية للpth. على سبيل المثال، 15% من قيم البيانات أقل من أو تساوي النسبة المئوية الخامسة عشرة.

  • تتوافق النسب المئوية المنخفضة دائمًا مع قيم البيانات المنخفضة.
  • تتوافق النسب المئوية العالية دائمًا مع قيم البيانات الأعلى.

قد تتوافق النسبة المئوية أو لا تتوافق مع حكم القيمة حول ما إذا كانت «جيدة» أو «سيئة». يعتمد تفسير ما إذا كانت نسبة معينة «جيدة» أو «سيئة» على سياق الموقف الذي تنطبق عليه البيانات. في بعض الحالات، يمكن اعتبار النسبة المئوية المنخفضة «جيدة»؛ وفي سياقات أخرى يمكن اعتبار النسبة المئوية المرتفعة «جيدة». في كثير من الحالات، لا يوجد حكم قيمي ينطبق.

إن فهم كيفية تفسير النسب المئوية بشكل صحيح مهم ليس فقط عند وصف البيانات، ولكن أيضًا عند حساب الاحتمالات في الفصول اللاحقة من هذا النص.

ملاحظة

عند كتابة تفسير النسبة المئوية في سياق البيانات المعطاة، يجب أن تحتوي الجملة على المعلومات التالية.

  • معلومات حول سياق الموقف الذي يتم النظر فيه
  • قيمة البيانات (قيمة المتغير) التي تمثل النسبة المئوية
  • النسبة المئوية للأفراد أو العناصر التي تقل قيم البيانات فيها عن النسبة المئوية
  • النسبة المئوية للأفراد أو العناصر التي تزيد قيم البيانات فيها عن النسبة المئوية.

مثال2.2.20

في اختبار الرياضيات الموقوت، كان الربع الأول من الوقت المستغرق لإنهاء الاختبار 35 دقيقة. فسر الربع الأول في سياق هذا الموقف.

إجابة

الحل 2.20

أنهى خمسة وعشرون بالمائة من الطلاب الاختبار في 35 دقيقة أو أقل. أنهى خمسة وسبعون بالمائة من الطلاب الاختبار في 35 دقيقة أو أكثر. يمكن اعتبار النسبة المئوية المنخفضة جيدة، حيث أن الانتهاء بسرعة أكبر من الاختبار الموقوت أمر مرغوب فيه. (إذا استغرقت وقتًا طويلاً، فقد لا تتمكن من الانتهاء.)

مثال2.2.21

في اختبار الرياضيات المكون من 20 سؤالًا، كانت النسبة المئوية 70 لعدد الإجابات الصحيحة هي 16. فسر النسبة المئوية السبعين في سياق هذا الموقف.

إجابة

الحل 2.21

أجاب سبعون بالمائة من الطلاب على 16 سؤالًا أو أقل بشكل صحيح. أجاب ثلاثون بالمائة من الطلاب على 16 سؤالًا أو أكثر بشكل صحيح. يمكن اعتبار النسبة المئوية الأعلى جيدة، حيث أن الإجابة على المزيد من الأسئلة بشكل صحيح أمر مرغوب فيه.

التمارين الرياضية2.2.21

في مهمة مكتوبة مكونة من 60 نقطة، كانت80th النسبة المئوية لعدد النقاط المكتسبة 49 نقطة. فسر النسبة80th المئوية في سياق هذا الموقف.

مثال2.2.22

في إحدى كليات المجتمع، تبين أن النسبة30th المئوية للوحدات الائتمانية التي يلتحق بها الطلاب هي سبع وحدات. فسر النسبة30th المئوية في سياق هذا الموقف.

إجابة

الحل 2.22

  • يتم تسجيل ثلاثين بالمائة من الطلاب في سبع وحدات ائتمانية أو أقل.
  • يتم تسجيل سبعين بالمائة من الطلاب في سبع وحدات ائتمانية أو أكثر.
  • في هذا المثال، لا يوجد حكم «جيد» أو «سيئ» مرتبط بنسبة مئوية أعلى أو أقل. يلتحق الطلاب بكلية المجتمع لأسباب واحتياجات متنوعة، ويختلف عبء الدورة وفقًا لاحتياجاتهم.

مثال2.2.23

تتقدم مدرسة Sharpe Middle School بطلب للحصول على منحة سيتم استخدامها لإضافة معدات اللياقة البدنية إلى صالة الألعاب الرياضية. استطلعت المديرة 15 طالبًا مجهولاً لتحديد عدد الدقائق التي يقضيها الطلاب في ممارسة الرياضة يوميًا. يتم عرض النتائج من الطلاب الخمسة عشر المجهولين.

0 دقيقة؛ 40 دقيقة؛ 60 دقيقة؛ 30 دقيقة؛ 60 دقيقة

10 دقائق؛ 45 دقيقة؛ 30 دقيقة؛ 300 دقيقة؛ 90 دقيقة؛

30 دقيقة؛ 120 دقيقة؛ 60 دقيقة؛ 0 دقيقة؛ 20 دقيقة

حدد القيم الخمس التالية.

  • الحد الأدنى = 0
  • Q1=20
  • المتوسط = 40
  • Q3=60
  • الحد الأقصى = 300

إذا كنت المدير، هل سيكون لديك ما يبرر شراء معدات اللياقة البدنية الجديدة؟ نظرًا لأن 75٪ من الطلاب يمارسون الرياضة لمدة 60 دقيقة أو أقل يوميًا، وبما أن الوقتIQR هو 40 دقيقة(6020=40)، فإننا نعلم أن نصف الطلاب الذين شملهم الاستطلاع يمارسون ما بين 20 دقيقة و 60 دقيقة يوميًا. يبدو أن هذا يمثل قدرًا معقولًا من الوقت المستغرق في ممارسة الرياضة، لذلك سيكون للمدير ما يبرره في شراء المعدات الجديدة.

ومع ذلك، يحتاج المدير إلى توخي الحذر. يبدو أن القيمة 300 هي قيمة غريبة محتملة.

Q3+1.5(IQR)=60+(1.5)(40)=120.

القيمة 300 أكبر من 120 لذا فهي قيمة شاذة محتملة. إذا قمنا بحذفها وحساب القيم الخمس، نحصل على القيم التالية:

  • الحد الأدنى = 0
  • Q1=20
  • Q3=60
  • الحد الأقصى = 120

لا يزال لدينا 75٪ من الطلاب يمارسون الرياضة لمدة 60 دقيقة أو أقل يوميًا ونصف الطلاب يمارسون ما بين 20 و 60