מהו ה-p-value

p-value

שתפו:

בכתבה על ניסוי קליני לחיסון נגד נגיף ה-HIV (שנערך בשנת 2009) שהופיעה בוול-סטריט גו'רנל, דווח כי למרות שבניסוי נצפתה יעילות של 26%, "ההסתברות כי התוצאה התקבלה במקרה” ("Probability that the result is due to chance") היא למרבה הצער 16%. עיון בטבלה שבכתבה מעלה כי המספר 16% הוא למעשה ה-p-value של תוצאת המחקר. לכן, למרבה הצער, ההסבר כי זו "ההסתברות שהתוצאה התקבלה במקרה", אינו נכון.

אז מהו ה-p-value ומה באמת המשמעות של ערכו?

נתחיל מבראשית. בבסיסה של כל בעיית החלטה סטטיסטית עומדות שתי השערות (hypotheses). ההשערה הבסיסית, המכונה גם “השערת האפס” מבטאת את האמונה (המדעית) המקובלת. בימי גלילאו, השערת אפס טיפוסית יכולה להיות “השמש מסתובבת סביב הארץ”. בניסוי הקליני לחיסון נגד נגיף ה-HIV השערת האפס היא “החיסון הנסיוני לא מפחית את הסיכוי להדבק בנגיף”. ואם נעבור לאנלוגיה של עולם המשפט, הרי שבמדינות מתוקנות מניחים כי אדם המואשם בפשע ועומד לדין הינו זכאי עד שתוכח אשמתו, כלומר השערת האפס של השופט אומרת כי “הנאשם זכאי”.

מול השערת האפס ניצבת תמיד ההשערה האלטרנטיבית. בהקשר המדעי, השערה זו מבטאת תיאוריה חדשה שמועמדת לדחוק את התיאוריה הישנה. גלילאו הציע את ההשערה האלטרנטיבית “הארץ מסתובבת סביב השמש”. עורכי הניסוי הקליני המדובר הציגו את ההשערה האלטרנטיבית כי “החיסון הנסיוני מפחית את הסיכוי להדבק בנגיף”, והתובע מציג בפני השופט את ההשערה האלטרנטיבית כי “הנאשם אשם”.

נישאר באנלוגיה המשפטית. כדי להביא להרשעת הנאשם, התובע צריך להציג בפני השופט עדויות שישכנעו אותו, מעבר לספק סביר, כי הנאשם אכן ביצע את הפשע המיוחס לו. מה זה “מעבר לספק סביר”? כל שופט קובע את הרף שלו לעצמו. אם אדם מואשם בשוד תחנת דלק, למשל, שופט יכול להחליט כי ירשיע את הנאשם אם יופיעו בפניו שני עדי ראיה שיעידו כי הנאשם הוא אכן השודד. שופט מחמיר יותר אולי ידרוש שלושה עדים, וגם הוכחה כי הכסף נמצא בידי הנאשם, ושופט אחר אולי יסתפק בוידאו של מצלמת האבטחה. אנו מקווים כי כל שופט קובע את כלל ההחלטה שלו מראש. מעבר לכך, אנו מצפים לכך שאם שופט מחמיר ירשיע נאשם, גם שופט פחות מחמיר ירשיע את אותו הנאשם.

בניגוד לבתי המשפט, מחקרים מדעיים מסתמכים כמעט צמיד על נתונים כמותיים. נישאר בדוגמה של מחקר קליני לבדיקת יעילות חיסון ניסיוני, אך כדי להביא את הדיון לפסים מדויקים יותר, אשתמש בדוגמא מלאכותית. בדוגמה זו נתעניין רק בנתון אחד, האם אדם שחוסן נדבק במחלה במשך שנה לאחר החיסון, או שלא נדבק, ונניח שההסתברות/סיכון של אדם לא מחוסן להידבק הוא 0.5 כלומר 50%. מפתחי החיסון הניסיוני טוענים כי הסיכון של אדם מחוסן להידבק הוא 0.1 (10%) בלבד, וזהו שיפור משמעותי.

במילים אחרות, השערת האפס היא כי הסיכון להדבקה (של אדם מחוסן!) הוא 0.5, וההשערה האלטרנטיבית אומרת כי הסיכון הוא 0.1.

בשלב הראשון עורכים ניסוי קליני בהיקף קטן, בו מחסנים 20 איש בלבד. אם החיסון לא עובד, אנו מצפים כי 10 מתוכם יידבקו (אם העולם מושלם).

איך נחליט בסוף תקופת המחקר אם החיסון הנסיוני מסתמן כיעיל וכדאי להמשיך בפיתוח? צריך לקבוע כלל החלטה. כלל החלטה לדוגמא הוא לדחות את השערת האפס אם מספר המחוסנים שנדבקו קטן או שווה ל-5.

יש גם אפשרות אחרת להחליט. נניח שבסוף המחקר 7 אנשים נדבקו. עד כמה הנתון הזה משכנע? ברור כי אם משתכנעים ביעילות החיסון אם יש 7 נדבקים, בוודאי נשתכנע אם יהיו 6 נדבקים, או 5, או אף פחות מכך.

אבל כאן לא קבענו כלל החלטה. לעומת זאת אנו יכולים לשאול את עצמנו את השאלה הבאה: נניח כי החיסון אינו יעיל. אם נערוך ניסוי נוסף, מה הסיכוי שנקבל שוב תוצאה של 7 נדבקים או פחות מכך? אם הסיכוי הזה גדול, לא נתרשם במיוחד. העולם לא מושלם. בתיאוריה 10 אנשים מתוך 20 "צריכים" להידבק, וכאן נדבקו 13, שום דבר לא מפתיע.

אבל ככל שהסיכוי לקבל תוצאה של 7 נדבקים או פחות קטן יותר, כך התוצאה מרשימה יותר. במילים אחרות, ככל שהסיכוי הזה הולך וקטן, כך הנטיה שלנו לדחות את השערת האפס תגדל. הסיכוי הזה הוא ה-p-value המדובר.

באופן פורמלי, ההסתברות לקבלת עדות דומה או חזקה יותר מהעדות שנצפתה, בהנחה שהשערת האפס נכונה, היא ה-p-value המפורסם.

בדוגמה הזו, ניתן לחשב כי ה-p-value עבור תוצאה של 7 נדבקים הוא 0.1316. האם זה מספיק משכנע? כל אחד יחליט עבור עצמו.

כמו כן, ההסתברות כי התוצאה 7 התקבלה "במקרה", כלומר כאשר השערת האפס נכונה והחיסון לא יעיל היא 0.0739, ותוצאה זו שונה כמובן מה-p-value.

לשיחת ייעוץ ללא תשלום השאירו פרטים

אולי יעניין אתכם גם:

p-value
מאמרים

מהו ה-p-value

בכתבה על ניסוי קליני לחיסון נגד נגיף ה-HIV (שנערך בשנת 2009) שהופיעה בוול-סטריט גו'רנל, דווח כי למרות שבניסוי נצפתה יעילות של 26%, "ההסתברות כי התוצאה

להמשך »