Skip to main content
Global

8.3: מבוא להסקת מסקנות סטטיסטיות ובדיקת השערות

  • Page ID
    207102
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    מטרות למידה
    • הסבר את המאפיינים של ההתפלגות הנורמלית
    • הסבר את המושג z-score וחשב אותו
    • ערכו בדיקת השערה (בדיקת הבדלי אמצעים)
    • הבדיל בין שגיאות מסוג I ו- Type-II

    הסקה סטטיסטית מוגדרת כתהליך ניתוח הנתונים שנוצרו על ידי מדגם, אך לאחר מכן משמשת לקביעת מאפיין כלשהו של האוכלוסייה הגדולה יותר. זכור, ניתוחי סקרים הם הלחם והחמאה של מדע המדינה הכמותי. מכיוון שסביר להניח שאיננו מסוגלים לסקר את כולם בכל אוכלוסייה, כמו כל המצביעים הרשומים בארה"ב, אנו מייצרים במקום זאת מדגם המאפשר להסיק מסקנות או להסיק מסקנות לגבי האוכלוסייה הנחקרת. דוגמאות שימושיות מכיוון שהיא מאפשרת לחוקרים לבדוק קשרים בין משתנים מבלי להוציא את המיליונים הדרושים לחקר אוכלוסייה גדולה יותר.

    לפני שנדון במושגים של הסקה סטטיסטית ובאמצעי בדיקת מערכות יחסים, נתחיל בבדיקה מחדש של איור 8.1 הממוקם בסוף הסעיף הקודם (סעיף 8.2). תוכלו להבחין כי העקומה בצורת פעמון, כאשר ציוני הבחינה מגיעים לשיא באמצע. עקומה זו נקראת התפלגות נורמלית שבה הערך של הממוצע, החציון והמצב זהה, ונתונים ליד הממוצע שכיחים יותר בהתרחשות. אפשר לומר שרוב המשתנים שמדענים פוליטיים מעוניינים בהם ניתן להניח שהם מופצים באופן נורמלי. אבל, מה מייצג העקומה הזו? גובה הקו מייצג את הצפיפות של תצפית מסוימת.

    האם אתה שם לב ששיא העקומה ממוקם באמצע ההתפלגות? המשמעות היא שיש הרבה יותר תצפיות עם ערך הממוצע או קרוב אליו מכל ערכים אחרים במשתנה המופץ בדרך כלל. במילים אחרות, ככל שתתרחק (או חורג) מהממוצע, תראה פחות תצפיות. זה עשוי להיות הגיוני יותר אינטואיטיבי באמצעות דוגמת ציון הבדיקה מהסעיף הקודם. ציון המבחן הממוצע של 85 מסמל שחלק גדול מהתלמידים קיבלו משהו קרוב ל -85. נזכיר את הרעיון של סטיית תקן? כ -68% מהציונים יירדו בין סטיית התקן הראשונה מהממוצע. בדוגמה לעיל ציינו כי 68% מהתלמידים נופלים בין ציוני 80 ל -90.

    דבר נוסף שאתה עשוי להבחין בעקומת ההתפלגות הנורמלית הוא שהוא סימטרי. מחצית מהתצפיות נופלות מעל הממוצע והחצי השני נמצא מתחת לממוצע. שוב, להתפלגות נורמלית יש אותו ערך לממוצע, חציון ומצב, כלומר ערך הממוצע הוא המתרחש ביותר והוא גם הערך האמצעי. בהתחשב בכך, ההתפלגות הנורמלית מכונה לעתים קרובות נ (μ, σ 2).

    לפעמים, ייתכן שתהיה מעוניין להשוות ערכים מסוימים באמצעות מדדים שונים שנועדו למדוד מושגים דומים. הבה ניקח את SAT ו ACT עבור דוגמה זו (טופס מאומץ OpenIntro סטטיסטיקה). תלמידי תיכון המעוניינים להגיש מועמדות למכללות ואוניברסיטאות לארבע שנים, נדרשים להשלים לפחות אחת ממבחני הכושר הללו. לאחר מכן אוניברסיטאות ומכללות משתמשות בציון SAT או ACT, יחד עם שילוב של תשומות אחרות, כגון GPA ושירות קהילתי, כדי לקבוע אם בקשת הסטודנט מתקבלת. חשוב לציין כי ה- SAT מדורג מתוך 1600 וכי ה- ACT זוכה לציון כ -36. לדוגמה, נניח שקרלוס לקח את ה- SAT וקלע 1300, וטומוקו לקח את ה- ACT וקלע 24. איך אתה יכול להשוות ולקבוע מי ביצע ביצועים טובים יותר? ובכן, דרך אחת היא לתקנן את הציונים אם קיימים נתונים סטטיסטיים מסוימים: הממוצע וסטיית התקן. עם הממוצע וסטיית התקן יחד עם ערכי העניין (במקרה זה ציוני המבחן של קרלוס וטומוקו), אנו יכולים לחשב את ציון Z, המספר לנו את מספר סטיות התקן שתצפית מסוימת נופלת מעל או מתחת מהממוצע.

    ציון Z = איקס-μ/σ (8.6)

    במשוואה 9.6, x מייצג תצפית שאתה מעוניין בה. הממוצע מיוצג על ידי μ ו σ מציין את סטיית התקן של מערך הנתונים. לכן, על מנת שנוכל להשוות את הציון של קרלוס וטומוקו, אנו מחשבים תחילה ציוני z לשניהם ומשווים ביניהם. אנו זקוקים למידע שלהלן גם כדי לבצע משימה זו.

    סטטיסטיקה ישבתי לפעול
    ממוצע (μ) 1100 21
    סטיית תקן (σ) 200 6

    קרלוס לקח את ה- SAT וקלע 1300 כך שציון ה- z שלו הוא:

    Z = (1300-1100) /200 = 1

    קרלוס לקח את ה- ACT וקלע 24 כך שציון ה- z שלו הוא:

    Z = (24-21) /6 = 0.5

    נתונים סטטיסטיים אלה פירושם שהציון של קרלוס היה סטיית תקן אחת מעל הממוצע ואילו הציון של טומוקו היה 0.5 סטיית תקן מעל הממוצע. אז, מי ביצע טוב יותר במבחן הסטנדרטי? התשובה היא קרלוס שכן סטיית תקן אחת מעל הממוצע עדיפה על 0.5 סטיית תקן מעל הממוצע. זכור כי סביר מאוד שלציון z יהיה גם ערך שלילי. זה פשוט אומר שסטיית התקן נמצאת מתחת לממוצע במרחק מסוים. ציוני Z מאפשרים לחוקרים להשוות את הציונים של אותה בחינה שנערכה בקטעי כיתה שונים, בתנאי שהממוצע וסטיית התקן לשתי הכיתות זמינים.

    לאחר שנקבע את הטכניקות להשוואת נתונים, כגון ציונים ל- SAT ו- ACT, המחקר יכול להתחיל לפתח השערות סטטיסטיות. השערות סטטיסטיות הן הצהרות לגבי מאפיינים מסוימים של משתנה או אוסף משתנים. ישנם שני סוגים של השערות המשמשות בבדיקת השערות סטטיסטיות. השערת אפס (Ho) היא הצהרת עבודה המציגה היעדר קשר סטטיסטי בין שני משתנים או יותר. בסטטיסטיקה, אנו רוצים להוכיח האם ניתן להוכיח הצהרת עבודה כשגויה. ההשערה האלטרנטיבית (Ha) קשורה להשערת האפס. ידוע גם בשם השערת מחקר, זוהי פשוט הצהרת עבודה חלופית להשערת האפס. בעיקרו של דבר, זו הטענה שחוקר טוען בעת בדיקת הקשרים בין נתונים. כדי להמחיש בצורה הטובה ביותר השערות סטטיסטיות, השערות אפסיות וחלופיות, הבה נבחן את הנתונים הבאים ונעבור את תהליך בדיקת ההשערה.

    המחלקה למדעי המדינה במכללת סן דייגו סיטי רצתה לבדוק אם למפגשי לימוד נוספים תהיה השפעה כלשהי על ביצועי הסטודנטים בבחינת האמצע. בחרנו סטודנטים באקראי להשתתף במפגשי לימוד נוספים.
    עבור שיעור הפוליטיקה האמריקאית (ממוצע האוכלוסייה) היה 75, עם סטיית התקן של 7 בקרב 200 תלמידים. הציון הממוצע של התלמידים שהשתתפו במפגש הלימוד הנוסף (ממוצע מדגם) היה 82 והיו 50 תלמידים שהשתתפו בהם. האם נוכל להבין אם למפגשי הלימוד הנוספים בממוצע הייתה השפעה כלשהי על ביצועי התלמידים?

    על מנת שנוכל לבצע את הבדיקה הזו, עלינו להחליט על עוד כמה דברים. ראשית, עלינו לקבוע את רמת ההסתברות שנוח לך במונחים של קבלת ההשערה החלופית בטעות. זה נקרא מובהקות סטטיסטית או רמת האלפא. במילים אחרות, זו ההסתברות לדחות את השערת האפס כשהיא נכונה. לדוגמה, אלפא של 0.05 פירושו שאנחנו רוצים להיות בטוחים ב -95%, וזו בדרך כלל הרמה שרוב מדעני המדינה יסכימו שהיא מקובלת. לדוגמא זו, הבה נשתמש באלפא של 0.05 (ביטחון של 95%). החלטה זו הובילה אותנו לזהות אלמנט קריטי נוסף הדרוש לבדיקת השערות: ציון z קריטי. ערך זה אומר לנו אם עלינו לדחות את טענת המחקר או לא. מכיוון שהחלטנו שהאלפא שישמש כאן הוא 0.05, ציון ה- z הקריטי הוא 1.96. אתה יכול לזהות את המספר הזה על ידי טבלת הסתברות z-score הממוקמת לעתים קרובות בחלק האחורי של ספר לימוד סטטיסטי מבוא. כמו כן, עלינו להחליט אם אנו עומדים לערוך בדיקה חד זנבית או דו-זנבית. מכיוון שזה מעבר להיקף ספר לימוד זה, אשתמש במבחן הדו-זנבי לדוגמא זו. את סיכום המידע שיש לנו לדוגמא זו ניתן למצוא בטבלה שלהלן.

    סטטיסטיקה ערך
    ממוצע אוכלוסייה (μ) 75
    סטיית אוכלוסייה (σ) 7
    ממוצע לדוגמא (Y_underbar) 82
    גודל מדגם (n) 50
    רמת אלפא 0.05
    ציון z קריטי 1.96
    השערת אפס (הו) Y_underbar = μ
    השערות אלטרנטיביותI (הא) Y_underbar = μ או Y_underbar > μ

    עכשיו יש לנו את כל המידע הדרוש, אנחנו יכולים לבצע את בדיקת ההשערה באמצעות דוגמה זו. בסופו של דבר, בדיקת השערה כוללת בחינה של נתון הבדיקה שנצפה ביחס לסף שקבעת (ציון z קריטי). אם נתון הבדיקה שנצפה חורג מהערך הקריטי, אנו יכולים לומר בבטחה כי טענת המחקר שלך עשויה להיות נכונה. כדי לחשב את נתון הבדיקה שנצפה (במקרה זה z-score עבור הדגימות) באמצעות המשוואה שלהלן.

    Z obs = |Y_underbar - μ|/

    ז אובס = |82-75 |/7* מ"ר (50)

    כעת השווה את ציון ה- z שנצפה ואת ציון ה- z הקריטי.

    Z הערות: |7.07 |> 1.96 (Z קריטי)

    במקרה זה, מכיוון שציון ה- z שנצפה היה גדול מהסף של 1.96 אנו יכולים לומר כי ניתן לדחות את הטענה כי Y_underbar = μ. לעומת זאת, אם ציון ה- z שנצפה היה קטן מ- 1.96, נגיד, לא הצלחנו לדחות את השערת האפס. חשוב לציין שלעולם איננו מקבלים את השערת האפס. אז מה זה אומר בסופו של דבר? על פי תוצאת הבדיקה כאן, אנו יכולים לומר בבטחה כי התצפית כי הציון הממוצע של אלה שקיבלו תמיכה נוספת היה גבוה מהממוצע באוכלוסייה לא היה תוצאה של שינוי. במילים אחרות, אנו יכולים לשער כי ייתכן שהתמיכה הנוספת תרמה לממוצע הגבוה יותר עבור קבוצת המדגם (תמיכה נוספת). בעוד שהדוגמה שלנו השתמשה בהשוואה של האמצעים באמצעות ציוני z, אנו יכולים להשתמש באותו מושג להשוואה של מבחני האמצעים עם t-test והשוואה של פרופורציות גם כן.

    בעת ביצוע בדיקת השערה כדי להסיק מסקנה סטטיסטית, ייתכן שההחלטות שלך אם לדחות את השערת האפס או לא היו שגויות. אפשר לדחות בטעות את השערת האפס שהייתה נכונה. שגיאה מסוג זה נקראת שגיאה מסוג I, וזה המקרה של מסקנה "חיובית כוזבת". כאשר חוקר לא מצליח לדחות את השערת האפס שהיא שקרית, החוקר ביצע טעות מסוג II (מסקנה "שלילית כוזבת"). אנו יכולים לנסות להתגונן מפני טעויות אלה. רמת המשמעות עליה דנו לעיל (רמת אלפא) היא ההסתברות שתבצע שגיאה מסוג I. על ידי הגדלת רמת האלפא, אתה יכול להבטיח שהסיכוי שלך לבצע סוג או שגיאה זה יופחת. באשר לשגיאה מסוג II, ההסתברות לביצוע שגיאה זו מתייחסת למושג "כוח" בבדיקה. במילים פשוטות, ככל שהמדגם הכלול במבחן גדול יותר, כך הסיכוי שהמחקר יסבול משגיאה מסוג 2.

    בחלק זה הצגנו את הידע הבסיסי כדי להרחיב את העניין שלך בקידום כישורי השיטה הכמותית שלך. מה שנחשפת כאן הוא קצה קטן של קרחון סטטיסטי עצום. אם אתה מעוניין במחקר הפוליטי הכמותי, אנו ממליצים לך להירשם לקורס סטטיסטיקה ברמת מבוא, רצוי במדעי המדינה (אם בית הספר שלך מציע) או במחלקה אחרת למדעי החברה והתנהגות.