לאנשים רבים יש דעות חזקות מאוד לגבי תפקידם של מבחנים סטנדרטיים בחינוך. יש הסבורים שהם מספקים דרך בלתי משוחדת לקבוע את הכישורים הקוגניטיביים של הפרט, כמו גם את איכות בית הספר או המחוז. אחרים מאמינים כי ציונים ממבחנים סטנדרטיים הם גחמניים, אינם מייצגים את מה שהתלמידים יודעים ומטעים כאשר משתמשים בהם למטרות אחריות. לפסיכולוגים חינוכיים רבים ולמומחי בדיקות יש דעות ניואנסות ועושים הבחנות בין המידע שמבחנים סטנדרטיים יכולים לספק לגבי ביצועי התלמידים וכיצד מתפרשים ומשתמשים בתוצאות המבחנים. בראייה ניואנסית זו, רבות מהבעיות הקשורות למבחנים סטנדרטיים נובעות משימוש בהימור הגבוה שלהן, כגון שימוש בביצועים במבחן אחד כדי לקבוע בחירה לתוכנית, סיום לימודים או רישיון, או שיפוט בית ספר כביצועים גבוהים לעומת נמוכים.
האם בדיקות סטנדרטיות מוטות?
בחברה רב תרבותית שאלה מכרעת אחת היא: האם מבחנים סטנדרטיים מוטים נגד קבוצות חברתיות, גזעיות או אתניות מסוימות? שאלה זו הרבה יותר מסובכת ממה שהיא נראית מכיוון שלהטיה יש מגוון משמעויות. משמעות יומיומית של הטיה כרוכה לעתים קרובות בהגינות השימוש בתוצאות מבחן סטנדרטיות כדי לחזות ביצועים פוטנציאליים של תלמידים מוחלשים שהיו להם בעבר מעט משאבים חינוכיים. לדוגמה, האם דוויין, תלמיד תיכון שעבד קשה אך היו לו הזדמנויות חינוכיות מוגבלות בגלל בתי הספר העניים בשכונה שלו ומעט משאבים חינוכיים בביתו, יימנע מסיום התיכון בגלל הציון שלו במבחן אחד. זו לא הייתה אשמתו שלא היו לו המשאבים החינוכיים ואם ניתנה לו הזדמנות עם שינוי הסביבה שלו (למשל על ידי לימודים בקולג ') הביצועים שלו עשויים לפרוח. בהשקפה זו, ציוני המבחנים משקפים אי שוויון חברתי ויכולים להעניש תלמידים שהם פחות מיוחסים, ולעתים קרובות מתפרשים בטעות כהשתקפות של יכולת תורשתית קבועה. חוקרים בדרך כלל שוקלים הטיה בדרכים טכניות יותר ושלושה נושאים יידונו: תוכן פריט ופורמט; דיוק התחזיות ואיום סטריאוטיפי.
תוכן ופורמט פריט. פריטי בדיקה עשויים להיות קשים יותר עבור קבוצות מסוימות מאשר לאחרים. דוגמה להטיה מעמדית חברתית בפריט רב ברירה שאלה את התלמידים את משמעות המונח שדה. התלמידים התבקשו לקרוא את המשפט הראשוני בכתב נטוי ולאחר מכן לבחור את התגובה בעלת אותה משמעות של שדה (Popham 2004, עמ '24):
התחום של אבא שלי הוא גרפיקה ממוחשבת.
- הכד יכול היה להציב את עמדתו
- הכנו את השדה על ידי חריש אותו
- הרופא בדק את שדה הראייה שלי
- לאיזה תחום תיכנס אחרי הלימודים?
ילדים של אנשי מקצוע נוטים יותר להבין את המשמעות הזו של תחום מכיוון שלרופאים, עיתונאים ועורכי דין יש "שדות", ואילו לקופאיות ולעובדי תחזוקה יש משרות כך שילדיהם נוטים פחות לדעת את משמעות התחום הזו. (התשובה הנכונה היא D).
חברות בדיקות מנסות למזער בעיות תוכן מסוג זה על ידי כך שמפתחי בדיקות ממגוון רקעים יבדקו פריטים ועל ידי בחינה סטטיסטית אם קבוצות מסוימות מוצאות פריטים מסוימים קלים או קשים יותר. עם זאת, אכן קיימות בעיות וניתוחים עדכניים של מבחני ה- SAT המילוליים הצביעו על כך שלבנים נוטים להבקיע טוב יותר בפריטים קלים ואילו אפרו -אמריקאים, אמריקאים היספנים ואמריקאים אסיאתיים מקבלים ציון טוב יותר על פריטים קשים (Freedle, 2002). אמנם ההבדלים הללו אינם גדולים, אך הם יכולים להשפיע על ציוני המבחנים. חוקרים חושבים שהפריטים הקלים הכוללים מילים המשמשות בשיחה יומיומית עשויים להיות בעלי משמעויות שונות בעדינות בתרבויות משנה שונות ואילו המילים הקשות (למשל נחרצות, סיקופנט) אינן משמשות בכל שיחה ולכן אין להן וריאציות אלה במשמעות. מבחן formast יכול גם להשפיע על ביצועי הבדיקה. נקבות בדרך כלל משיגות ציון טוב יותר בשאלות חיבור וכאשר ה- SAT הוסיף לאחרונה מרכיב חיבור, הציונים המילוליים הכוללים של הנשים ב- SAT השתפרו ביחס לגברים (הובר, 2006).
דיוק התחזיות
מבחנים סטנדרטיים משמשים בין קריטריונים אחרים כדי לקבוע מי יתקבל למכללות סלקטיביות. נוהג זה מוצדק על ידי עדויות תוקף ניבוי - כלומר שציונים ב- ACT או SAT משמשים לחיזוי ציוני המכללה בשנה א '. מחקרים אחרונים הוכיחו כי התחזיות לסטודנטים שחורים ולטינים פחות מדויקות מאשר לסטודנטים לבנים וכי מנבאים לסטודנטיות פחות מדויקים מתלמידים גברים (יאנג, 2004). עם זאת, אולי באופן מפתיע ציוני המבחנים נוטים לחזות מעט יותר מדי הצלחה במכללה לסטודנטים שחורים ולטינים, כלומר סטודנטים אלה עשויים להשיג ממוצעים נמוכים יותר של ציונים א' ממה שחזו ציוני המבחן שלהם. לעומת זאת, ציוני המבחנים נוטים להיות מעט פחות מנבאים הצלחה במכללה עבור סטודנטיות, כלומר סטודנטים אלה צפויים להשיג ממוצעים גבוהים יותר של ציונים א' ממה שחזו ציוני המבחן שלהם. החוקרים אינם בטוחים מדוע ישנם הבדלים באיזו מידה מבחן SAT ו- ACT מנבאים ציונים ראשונים.
איום סטריאוטיפי
קבוצות שהן סטריאוטיפיות שליליות בתחום כלשהו, כגון ביצועי נשים במתמטיקה, נמצאות בסכנת איום סטריאוטיפי, כלומר חששות שאחרים יראו אותן דרך העדשה השלילית או הסטריאוטיפית (Aronson & amp Steele, 2005). מחקרים הראו כי ביצועי המבחנים של קבוצות סטריאוטיפיות (למשל אפרו -אמריקאים, לטינים, נשים) יורדים כאשר מודגש בפני אלה שעושים את המבחן כי (א) המבחן הוא הימור גבוה, מודד אינטליגנציה או מתמטיקה ו (ב) הם נזכרים האתניות, הגזע או המגדר שלהם (למשל על ידי בקשתם לפני המבחן למלא שאלון דמוגרפי קצר). גם אם אנשים מאמינים שהם מוכשרים, איום סטריאוטיפי יכול להפחית את יכולת זיכרון העבודה מכיוון שאנשים מנסים לדכא את הסטריאוטיפים השליליים. איום סטריאוטיפי נראה חזק במיוחד עבור אותם אנשים שרוצים לבצע ביצועים טובים. ציוני מבחן סטנדרטיים של אנשים מקבוצות סטריאוטיפיות עשויים לזלזל באופן משמעותי ביכולתם בפועל במצבי בדיקה נמוכים.
האם מורים מלמדים את המבחנים?
ישנן עדויות לכך שבתי ספר ומורים מתאימים את תכנית הלימודים כך שהיא משקפת את מה שנמצא במבחנים וגם מכינה את התלמידים לפורמט וסוגי הפריטים במבחן. מספר סקרים של מורים בבית הספר היסודי הצביעו על כך שהושקע יותר זמן במתמטיקה וקריאה ופחות על לימודי חברה ומדעים בשנת 2004 מאשר 1990 (Jerald, 2006). מנהלים בבתי ספר להרשמה למיעוטים גבוהים בארבע מדינות דיווחו בשנת 2003 שהם צמצמו את זמן הבילוי באמנויות. מחקרים אחרונים במדע הקוגניטיבי מצביעים על כך שהבנת הנקרא בנושא (למשל מדע או לימודי חברה) דורשת מהתלמידים להבין הרבה אוצר מילים וידע רקע בנושא זה (Recht & Leslie, 1988). המשמעות היא שגם אם התלמידים ירוויחו כישורי קריאה טובים הם יתקשו ללמוד מדעים ולימודי חברה אם מעט זמן הושקע בנושאים אלה.
ביצוע מבחן בפורמט לא מוכר יכול להיות קשה ולכן המורים עוזרים לתלמידים להתכונן לפורמטים ופריטים ספציפיים של מבחנים (למשל שליליות כפולות בפריטים מרובי ברירה; תגובה בנויה). מוקדם יותר בפרק זה תיארו מורה בחטיבת הביניים, ארין והמנהל ד"ר מוצ'י את הדגש על הכנת המבחן בבתי הספר שלהם. קיים חשש גובר שכמות ההכנה למבחנים המתרחשת כעת בבתי הספר היא מוגזמת והתלמידים אינם מתחנכים אלא מאומנים לבצע מבחנים (פופאם, 2004).
האם תלמידים ומחנכים בוגדים?
קשה להשיג נתונים טובים על מידת הרמאות הנפוצה, אך אנו יודעים שתלמידים שעושים מבחנים בוגדים ואחרים, כולל מנהלי מבחנים, עוזרים להם לרמות (Cizek, 2003; Popham 2006). הצעדים למניעת רמאות מצד התלמידים כוללים הגנה על אבטחת המבחנים, הקפדה על התלמידים להבין את נהלי הניהול, מניעת התלמידים להביא את ההערות שלהם או מכשירים אלקטרוניים לא מאושרים, כמו גם להסתכל על תשובות זה לזה. כמה מורים ומנהלים נתפסו תוך שימוש בשיטות הכנה לא אתיות למבחנים כגון מתן פריטי מבחן בפועל לתלמידים ממש לפני המבחנים, מתן זמן לתלמידים יותר מהמותר, מענה לשאלות התלמידים לגבי פריטי המבחן ולמעשה שינוי תשובות התלמידים (פופאם, 2006). החששות בטקסס בנוגע לרמאות הובילו להקמת כוח משימה עצמאי באוגוסט 2006 עם 15 אנשי צוות מסוכנות החינוך בטקסס שהוקצו לחקור חריגות במבחנים. (ג'ייקובסון, 2006). בעוד שהלחץ על בתי הספר והמורים לגרום לתלמידם לבצע ביצועים טובים הוא גדול, שיטות אלה אינן מוסריות בעליל והובילו לפיטורי אנשי בית הספר מעבודתם (Cizek, 2003).