Skip to main content
Global

3.2: تلخيص البيانات - الإحصاء الوصفي

  • Page ID
    169315
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    كيف تلخص البيانات؟

    يتم تلخيص البيانات بطريقتين رئيسيتين: الحسابات الموجزة والتصورات الموجزة

     

    الحسابات: ما أنواع التدابير المستخدمة؟

    لكي تتمكن من تفسير الأنماط في البيانات، يجب أولاً معالجة البيانات الأولية وتلخيصها في فئتين من القياسات: مقاييس الاتجاه المركزي ومقاييس التباين. تجسد هاتان الفئتان من القياسات الخطوة الأولى من البحث العلمي، وهي الإحصاء الوصفي.

    مقاييس الاتجاه المركزي (المركز) - توفر معلومات عن كيفية تجمع البيانات حول بعض القيم المتوسطة الفردية. هناك مقياسان للمركز يستخدمان غالبًا في الاستقصاء البيولوجي:

    • المتوسط (المتوسط) - مجموع جميع القيم الفردية مقسومًا على إجمالي عدد القيم في العينة/السكان. هذا هو المقياس الأكثر استخدامًا للمركز تحت التوزيع المتماثل وهو حساس للظواهر المتطرفة.
    • الوسيط - القيمة المتوسطة عندما يتم ترتيب مجموعة البيانات بترتيب تسلسلي (من الأعلى إلى الأدنى). يُستخدم هذا بشكل شائع عندما تكون البيانات منحرفة ومقاومة للظواهر المتطرفة.

    مقاييس التباين (الانتشار) - تصف مدى انتشار البيانات أو تشتتها. هناك مقياسان رئيسيان للانتشار يستخدمان في الاستقصاء البيولوجي:

    • النطاق - يحدد المسافة بين قيم البيانات الأكبر والأصغر.
    • الانحراف المعياري - يحدد التباين أو التشتت من متوسط مجموعة البيانات. يشير الانحراف المعياري المنخفض إلى أن البيانات تميل إلى أن تكون قريبة جدًا من المتوسط؛ يشير الانحراف المعياري العالي إلى أن نقاط البيانات موزعة على نطاق كبير من القيم. هذه العملية الحسابية حساسة للظواهر المتطرفة.
    • خطأ قياسي - يحدد التباين في الوسائل من مجموعات بيانات متعددة أو توزيع عينة لمجموعة البيانات الأصلية.

       

    تصور البيانات: كيف يتم استخدام الجداول والرسوم البيانية؟

    بعد حساب جميع الإحصائيات الوصفية المطلوبة، يتم تلخيصها بصريًا إما في جدول أو رسم بياني.

    الجداول:

    الجدول عبارة عن مجموعة من قيم البيانات مرتبة في أعمدة وصفوف. عادةً ما تشمل الأعمدة فئة بيانات واسعة، وتشمل الصفوف فئة أخرى. توجد ضمن كل فئة عامة فئات فرعية تحدد عدد الأعمدة والصفوف التي يتكون منها الجدول. يتم استخدام الجداول لجمع البيانات وتلخيصها. ومع ذلك، في معظم الأوقات عند تقديم الجداول، فإنها تتكون من بيانات ملخصة، وليس بيانات أولية. على الرغم من أن الجداول تسمح بعرض البيانات الملخصة بطريقة منظمة، إلا أن معظم الأشخاص يفضلون ترجمة الجداول إلى أداة تصور البيانات الأكثر قوة، وهي الرسم البياني.

    الرسوم البيانية:

    الرسم البياني هو رسم تخطيطي يوضح العلاقة بين الكميات المتغيرة، عادةً من متغيرين، يتم قياس كل منهما على طول أحد المحاور بزاوية قائمة. يمكن أن تبدو الرسوم البيانية مثل مخطط أو رسم. تستخدم معظم الرسوم البيانية أشرطة أو خطوط أو أجزاء من الدائرة لعرض البيانات. ومع ذلك، هناك أحيانًا عندما يتم وضع الرسوم البيانية فوق الخرائط لعرض الموقع الجغرافي أيضًا، أو حتى يتم تحريكها لتكون تفاعلية.

    فئات أنواع الرسم البياني الرئيسية:
    • الدائرة/الفطيرة - مخطط دائري مقسم إلى شرائح لتوضيح النسبة العددية. في المخطط الدائري، يتناسب طول القوس لكل شريحة (وبالتالي الزاوية المركزية والمساحة) مع الكمية التي تمثلها. على الرغم من تسميته بتشابهه مع الفطيرة التي تم تقطيعها إلى شرائح، إلا أن هناك اختلافات في طريقة تقديمها.
    • الخط - نوع من المخطط يعرض المعلومات كسلسلة من نقاط البيانات تسمى «العلامات» المتصلة بمقاطع الخط المستقيم. إنه نوع أساسي من المخططات الشائعة في العديد من المجالات. وهو مشابه لمخطط التبعثر إلا أنه يتم ترتيب نقاط القياس (عادةً حسب قيمة المحور السيني) وربطها بمقاطع الخط المستقيم. غالبًا ما يتم استخدام المخطط الخطي لتصور الاتجاه في البيانات على فترات زمنية - سلسلة زمنية - وبالتالي يتم رسم الخط غالبًا ترتيبًا زمنيًا.
    أمثلة على الرسم البياني للدائرة/الدائرية والرسم البياني الخطي
    الشكل\(\PageIndex{a}\): أمثلة على رسم بياني دائري/دائري (أ.) ورسم بياني خطي (ب). تم إنشاء الصورة بواسطة راشيل شليجر (CC-BY-NC).
    • مخطط التبعثر - هو رسم بياني يتم فيه رسم قيم متغيرين على طول المحاور الأفقية والعمودية، ويكشف نمط النقاط الناتجة عن أي إعداد مسبق للارتباط . يتم عرض البيانات كمجموعة من النقاط، ولكل منها قيمة متغير واحد يحدد الموضع على المحور الأفقي وقيمة المتغير الآخر الذي يحدد الموضع على المحور الرأسي.
    مثال على مؤامرة مبعثرة
    الشكل\(\PageIndex{b}\): مثال لمخطط مبعثر. تم إنشاء الصورة بواسطة راشيل شليجر (CC-BY-NC).
    • الشريط - مخطط أو رسم بياني يعرض البيانات الفئوية بأشرطة مستطيلة بارتفاعات أو أطوال تتناسب مع القيم التي تمثلها. يمكن رسم الأشرطة رأسيًا أو أفقيًا.
    • الرسم البياني - هو تمثيل تقريبي لتوزيع البيانات العددية. لإنشاء رسم بياني، تتمثل الخطوة الأولى في «تجميع» (أو «تجميع») نطاق القيم - أي تقسيم نطاق القيم بالكامل إلى سلسلة من الفواصل الزمنية - ثم حساب عدد القيم التي تقع في كل فاصل زمني. عادةً ما يتم تحديد الصناديق على أنها فواصل زمنية متتالية غير متداخلة للمتغير. يجب أن تكون الصناديق (الفواصل الزمنية) متجاورة (بمعنى عدم وجود مسافات بينها كما هو الحال في الرسوم البيانية الشريطية)، وغالبًا ما تكون (ولكن ليس مطلوبًا) متساوية الحجم. إذا كانت الصناديق متساوية الحجم، يتم وضع مستطيل فوق الحاوية بارتفاع يتناسب مع التردد - عدد الحالات في كل حاوية.
    مثال على الرسم البياني الشريطي والمدرج البياني
    الشكل\(\PageIndex{c}\): أمثلة على الرسم البياني الشريطي (أ) والرسم البياني (ب) باستخدام نفس مجموعة البيانات. تم إنشاء الصورة بواسطة راشيل شليجر (CC-BY-NC).

    الإسناد

    راشيل شليجر (CC-BY-NC)