Skip to main content
Global

2.R: الإحصاء الوصفي (مراجعة)

  • Page ID
    198836
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    2.1 بيانات العرض

    مخطط الساق والأوراق هو طريقة لرسم البيانات وإلقاء نظرة على التوزيع. في مخطط الساق والأوراق، تكون جميع قيم البيانات داخل الفصل مرئية. الميزة في مخطط الجذع والأوراق هي أن جميع القيم مدرجة، على عكس الرسم البياني، الذي يعطي فئات من قيم البيانات. غالبًا ما يتم استخدام الرسم البياني الخطي لتمثيل مجموعة من قيم البيانات التي تختلف فيها الكمية بمرور الوقت. هذه الرسوم البيانية مفيدة للعثور على الاتجاهات. أي العثور على نمط عام في مجموعات البيانات بما في ذلك درجة الحرارة والمبيعات والتوظيف وأرباح الشركة أو التكلفة على مدار فترة زمنية. الرسم البياني الشريطي هو مخطط يستخدم أشرطة أفقية أو رأسية لعرض المقارنات بين الفئات. يُظهر أحد محاور المخطط الفئات المحددة التي تتم مقارنتها، بينما يمثل المحور الآخر قيمة منفصلة. تعرض بعض الرسوم البيانية الشريطية أشرطة مجمعة في مجموعات من أكثر من واحدة (الرسوم البيانية الشريطية المجمعة)، بينما تعرض أخرى الأشرطة مقسمة إلى أجزاء فرعية لإظهار التأثير التراكمي (الرسوم البيانية الشريطية المكدسة). الرسوم البيانية الشريطية مفيدة بشكل خاص عند استخدام البيانات الفئوية.

    الرسم البياني هو نسخة رسومية لتوزيع التردد. يتكون الرسم البياني من أشرطة ذات عرض متساوٍ مرسومة بجوار بعضها البعض. يمثل المقياس الأفقي فئات قيم البيانات الكمية ويمثل المقياس الرأسي الترددات. تتوافق ارتفاعات الأشرطة مع قيم التردد. تُستخدم الرسوم البيانية عادةً لمجموعات البيانات الكمية الكبيرة والمستمرة. يمكن أيضًا استخدام مضلع التردد عند رسم مجموعات بيانات كبيرة بنقاط بيانات متكررة. عادةً ما يتم نقل البيانات على محور y مع رسم التردد على المحور x. يمكن أن تكون الرسوم البيانية للسلاسل الزمنية مفيدة عند النظر إلى كميات كبيرة من البيانات لمتغير واحد على مدار فترة زمنية.

    2.2 مقاييس موقع البيانات

    تسمى القيم التي تقسم مجموعة بيانات مرتبة ترتيبًا إلى 100 جزء متساوٍ بالنسب المئوية. يتم استخدام النسب المئوية لمقارنة البيانات وتفسيرها. على سبيل المثال، ستكون الملاحظة عند النسبة المئوية الخمسين أكبر من 50 بالمائة من الملاحظات الأخرى في المجموعة. تقسم Quartiles البيانات إلى أرباع. الربع الأول (\(Q_1\)) هو النسبة المئوية 25، والربع الثاني (\(Q_2\)أو الوسيط) هو 50 في المائة، والربع الثالث (\(Q_3\)) هو النسبة المئوية 75. النطاق الربعي، أو\(IQR\)، هو نطاق الخمسين بالمائة الوسطى من قيم البيانات. \(IQR\)يتم العثور على هذا بالطرح\(Q_1\) من\(Q_3\)، ويمكن أن يساعد في تحديد القيم المتطرفة باستخدام التعبيرين التاليين.

    • \(Q_3 + IQR(1.5)\)
    • \(Q_1 – IQR(1.5)\)

    2.3 مقاييس مركز البيانات

    يمكن حساب المتوسط والمتوسط لمساعدتك في العثور على «مركز» مجموعة البيانات. المتوسط هو أفضل تقدير لمجموعة البيانات الفعلية، ولكن الوسيط هو أفضل قياس عندما تحتوي مجموعة البيانات على العديد من القيم المتطرفة أو القيم المتطرفة. سيخبرك الوضع بالمسند (أو البيانات) الأكثر تكرارًا في مجموعة البيانات الخاصة بك. يعد المتوسط والمتوسط والوضع مفيدًا للغاية عندما تحتاج إلى تحليل بياناتك، ولكن إذا كانت مجموعة البيانات الخاصة بك تتكون من نطاقات تفتقر إلى قيم محددة، فقد يبدو من المستحيل حساب المتوسط. ومع ذلك، يمكن تقريب المتوسط إذا أضفت الحد الأدنى بالحد العلوي وقسمته على اثنين للعثور على نقطة الوسط لكل فاصل زمني. اضرب كل نقطة وسط في عدد القيم الموجودة في النطاق المقابل. قسّم مجموع هذه القيم على العدد الإجمالي لقيم البيانات في المجموعة.

    2.6 الانحراف والوسيط والنمط

    يمكن أن يكشف النظر إلى توزيع البيانات الكثير عن العلاقة بين المتوسط والمتوسط والوضع. هناك ثلاثة أنواع من التوزيعات. التوزيع المنحرف الأيمن (أو الإيجابي) له شكل مثل الشكل\(\PageIndex{11}\).

    2.7 مقاييس انتشار البيانات

    يمكن أن يساعدك الانحراف المعياري في حساب انتشار البيانات. هناك معادلات مختلفة لاستخدامها في حالة حساب الانحراف المعياري لعينة أو لمجموعة سكانية.

    • يسمح لنا الانحراف المعياري بمقارنة البيانات أو الفئات الفردية بمعناها العددي لمجموعة البيانات.
    • \(s=\sqrt{\frac{\sum(x-\overline{x})^{2}}{n-1}} \text { or } s=\sqrt{\frac{\sum f(x-\overline{x})^{2}}{n-1}}\)هي صيغة حساب الانحراف المعياري للعينة. لحساب الانحراف المعياري للسكان، سنستخدم متوسط السكان، μ، والصيغة\(\sigma=\sqrt{\frac{\sum(x-\mu)^{2}}{N}} \text { or } \sigma=\sqrt{\frac{\sum f(x-\mu)^{2}}{N}}\).