יום רביעי, 31 באוקטובר 2018

פרשת תאיר ראדה – כשל התובע וכשל הסנגור בהערכת משקל ראיית די אן אי מיטוכונדריאלי


כשל התובע (prosecutor's fallacy) וכשל הסנגור (defense attorney's fallac) הם הטיות קוגניטיביות שהתגלו בתחום המשפטי על ידי וויליאם תומפסון ואדוארד שיומאן ב-1987הכשלים הללו ניתנים לאפיון באופן מדויק בעזרת נוסחת בייס  (ראו מאמר שפרסמתי ביחד עם עו"ד משה פרדס). בפוסט הנוכחי אנסה להסביר את הכשלים באופן אינטואיטיבי בלי שימוש בנוסחת בייס ובהסתברויות מותנות.

דמיינו לכם שעבריין השאיר בזירת פשע בעיר קצרין, פרופיל גנטי, אשר השכיחות שלו באוכלוסיה בישראל היא אחד ל-200. דמיינו שהפרופילים מחולקים באופן אחיד בכל חלקי המדינה. דמיינו חשוד, שגם לו פרופיל גנטי שכזה. כשל התובע הוא הטענה השגויה, כי כי מאחר ונדירות הפרופיל בישראל היא 0.5% בלבד, אז ההסתברות שהחשוד הוא העבריין (הסתברות האשמה האפוסטריורית) היא תמיד ההסתברות המשלימה ל-100% - היינו  99.5%. זהו כשל. שכן לא הבאנו בחשבון את הראיות האחרות באותו מקרה או העדר כאלו. 

נניח שהחשוד הוא אדם אדם אקראי מקריית גת, שפרט להתאמה בפרופיל הגנטי אין שום ראיה אחרת נגדו. תחת הנחת הומוגניות האשמה, היינו שכל אחד מתושבי המדינה אשם באותה מידה, הסתברות האשמה האפריורית, (זאת ללא ראיית הפרופיל הגנטי) היא אחד חלקי כל תושבי המדינה – היינו אחד חלקי שמונה מיליון. העובדה שלעבריין יש פרופיל גנטי ששכיחותו באוכלוסיה היא חצי אחוז, מצמצמת את אוכלוסיית החשודים, מכל תושבי המדינה, ל-40,000 בלבד. לכן, הסתברות האשמה האפוסטריורית של החשוד (זאת שכוללת גם את הראיה הגנטית) עולה מאחד חלקי שמונה מיליון, לאחד חלקי 40,000. למרות שההתאמה הגנטית העלתה את הסתברות האשמה של החשוד פי 200, עדיין, הסתברות אשמה של אחד חלקי 40,000 היא הסתברות אשמה קלושה שאינה מצדיקה אפילו זימון לחקירה. בוודאי שלא מדובר על הסתברות אשמה של 99.5%.

כשל הסנגור הוא הכשל ההפוך. הסנגור טוען כי אותה ראיה חסרת כל משקל, שכן יש בישראל 40,000 אנשים כמו החשוד, והסתברות אשמה של אחד חלקי 40,000 היא הסתברות אשמה קלושה שאינה מצדיקה אפילו זימון לחקירה. הסנגור צודק במקרה שהחשוד הוא אדם אקראי ואין עוד ראיות נגדו. אז אין בכוחה של הראיה לבדה להפליל את החשוד. אבל אם יש ראיות אחרות, אזי הסתברות האשמה האפריורית אינה אחד חלקי שמונה מיליון. נניח שהסתברות האשמה האפריורית, היא בשיעור של 50%. במקרה כזה, אפשר להראות כי ההתאמה הגנטית, מעלה את הסתברות האשמה מ-50% ל-99.5%.

אם נרצה לתת לכשל הסנגור אינטרפרטציה, דמיינו שמדובר על חשוד שיש כנגדו ראיות משמעותיות. בן הזוג שלו טוען שהוא הודה בפניו בביצוע רצח. בן הזוג טוען שראה בגדים מגואלים בדם. החשוד הודה בפני אנשים נוספים כי ביצע את המעשה. התברר שיש לחשוד מחשבות על דם ורצח. החשוד גם ניסה לתקוף בזכוכית אדם אחר. בנוסף, החשוד גר בקצרין. עובדה זאת מחזקת את הראיות נגדו שכן אנחנו יודעים שהמשטרה התמקדה רק בחשודים בקצרין. המשטרה הרי לא עצרה אנשים מפתח תקווה שזרקו את המכנסיים שלהם באותה תקופה. אם כך, איננו מתחילים מהסתברות אשמה האפריורית של אחד חלקי שמונה מיליון. אלא אנו מתחילים עם העדויות המתוארות אשר יהיו כאלו שיחשבו כי הן עולות להסתברות אשמה אפריורית של 50:50 (ויהיו כאלו שיחשבו שאף יותר). ומכאן, שהפרופיל הגנטי מעלה את אותה ההסתברות אשמה אפריורית של 50:50 פי 200, והופך אותה ל-99.5%. אם כך אין מדובר על ראיה עם משקל אפסי, אלא על ראיה העשויה להיות ההבדל בין זיכוי אדם מחמת הספק, לבין הרשעה מעבר לספק סביר. זהו כשל הסנגור.

לא קשה לראות את הדמיון בין הפוסט לבין פרשת תאיר ראדה. קולות בפרקליטות, כפי שעלו בתקשורות, הפחיתו משמעותית ממשקל הראיה. הטענה הייתה כי הפרופיל הגנטי יכול להתאים לעשרות אלפי אנשים. טיעון זה, הוא בדיוק כשל הסנגור. ומי ששוגה בכשל זה הם גורמים בפרקליטות, שלקחו על עצמם את תפקיד הסנגור של א.ק. הדבר צורם מאד, שכן הפרקליטות מייחסת לראיות אחרות עם שיעור שגיאה דומה, משקל גבוה במיוחד.  סדר הגודל בשגיאה חיובית בבדיקות סמים, הוא אחוז. שיעור החיובי הכוזב בראיית טביעת אצבע הוא בסדר גודל של חצי אחוז בממוצע. הנה טבלה שמסכמת את השגיאה בהשוואת טביעות אצבעות כפי שהתגלו בניסויים שונים:

טבלת שגיאה בראיית טביעת האצבע
שגיאה שלילית/רגישות
שגיאה חיובית/ספציפיות
הניסוי
שגיאה שלילית 7.5%
רגישות 61% (הסיבה שהסכום אינו 100% בגלל שיש אפשרות ל-Inconclusive
שגיאה חיובית 0.147%
ספציפיות – 88.7% (הסיבה שהסכום בין שניהם אינו 100% בגלל שיש אפשרות ל-Inconclusive
ניתוח תוצאות של המחברים
שגיאה שלילית של 10.9%
רגישות 89.1%
שגיאה חיובית של 0.165%
ספציפיות של 99.835%
Noblis-FBI Experiment
שגיאה שלילית 7.88%
רגישות 92.12%
שגיאה חיובית 0.68%
ספציפיות 99.32%  
שגיאה שלילית של 27.81%
רגישות -  72.19%
שגיאה חיובית 1.65%
ספציפיות 98.35%


ובכל זאת, למרות שמדובר בראיות עם שגיאה בסדר גודל של חצי אחוז, התביעה לא מפחיתה בערכם. להפך, התביעה משתמשת בהם להרשעה כראיה יחידה!

אני בהחלט חושב שראוי לבדוק את המשקל שיש לתת להתאמה בדי אן אי מיטוכונדריאלי באופן קפדני. יש נקודות  שלא עלו בפוסט הנוכחי שעשויות להפחית את משקלה ויש כאלו שאולי להגדילה. אולם הדבר אמור להיעשות באופן אובייקטיבי ולא באופן מונחה מטרה. אין זה ראוי כי כאשר המטרה להרשיע נאשם, ישתמשו בקריטריונים מדעים מפלילים וכאשר חשוב לתביעה לזכות את א.ק ישתמשו בקריטריונים אחרים. אמת מדעית יש רק אחת והיא אינה תלוית מטרה. אם המשטרה והפרקליטות היו מביעים כלפי הראיות כנגד רומן זדורוב את אותה מידת ספקנות שהם מביעים כלפי הראיות כנגד א.ק, רומן לא היה מזומן לחקירה ובוודאי שלא היה מועמד לדין.  

ישוחרר רומן זדורוב מכלאו, ויפה שעה אחת קודם.



יום שבת, 27 באוקטובר 2018

מדע פורנזי מונחה מטרה - על המשמעות ההסתברותית של ראיית DNA מיטוכונדריאלי וההשלכות הראייתיות של מציאת השערה השייכת לא.ח בפרשת זדורוב

לאחרונה, נמצאה התאמה בין פרופיל די. אן. אי. מיטוכונדריאלי שהופק משערה שנמצאה על גופתה של תאיר ראדה לבין פרופיל די. אן. אי. מיטוכונדריאלי של א.ח - אדם שבשנת 2012 דיווח כי בת זוגתו א.ק הודתה בפניו כי רצחה את תאיר ראדה.
התוצר של ראית די. אן. אי. גרעיני באתר מסוים, הוא שני אללים. אלל אחד מגיע מהאב ואלל אחר מגיע מהאם. כדי לדעת את הנדירות של זוג אללים (נניח (7,9)) אין צורך לדגום את שכיחות הופעת הזוג באוכלוסיה (מה שמצריך מדגם גדול המכיל את כל הזוגות האפשריים). מספיק לדגום את שכיחות האללים הבודדים באותו אתר מכמה מאות פריטים, ואז להשתמש בנוסחת הארדי וינברג (ראה הנוסחה בנספח א של הפוסט הזה). כדי לחשב את נדירות הפרופיל הגנטי כולו המורכב מכמה אתרים משתמשים בכלל המכפלה בהסתברות. פרופיל כזה, מכיל כמות אדירה של אפשרויות. עד כדי כך, שבאופן תאורטי, בהזנחת אפשרות של טעות מעבדה ואוכלוסיות בהם נהוג נישואי קרובים, צירוף של מספר אתרים גובל לפעמים בייחודיות אנושית של הפרופיל.
לא כך שמדובר בדי. אן. אי. מיטוכונדריאלי. כולנו יורשים את די. אן. אי. המיטוכונדריאלי מהאם. אלמלא התרחשות מוטציות, לכולנו היה את אותו די. אן. אי. של האם המיתולוגית חווה. המוטציות הן אלו שיוצרות את השינויים בדי. אן. אי. ובעצם גורמות לעצי משפחה (מהאימא) בהם הדי. אן. אי. המיטוכונדריאלי זהה. עיקרון הארדי וינברג לא רלוונטי לחישוב נדירות הפרופיל מיטוכונדריאלי ועצים משפחתיים.  
כיצד אם כך המדינה מתייחסת לשכיחות פרופיל מיטוכונדריאלי? אפשר ללמוד זאת מהצורה בה המדינה מתייחסת לנדירות פרופיל גנטי המופק מכרומוזום Y. רק לגברים יש כרומוזום Y אותו הם יורשים מהאב. אלמלא התרחשות מוטציות, לכל הגברים היה את אותו כרומוזום Y כמו לאדם הראשון. אולם המוטציות יוצרות עצי משפחה. אם התאמה ב-די אן אי מיטוכונדריאלי משייכת אדם לעץ משפחתי מצד האם, הרי התאמה בפרופיל המופק מכרומוזום Y משייכת אדם לעץ המשפחתי מצד האב. 
לפני כשלוש שנים התייעץ איתי סנגור, לגבי מקרה שבו הייתה התאמה מפרופיל שהופק מכרומוזום Y. באותו מקרה, פרופסור עוזי מוטרו, מומחה תביעה, הציג שיטה לחישוב נדירות הפרופיל. הוא סימן ב -N את כמות הפרופילים במאגר. אם סריקה במאגר לא מניבה אפילו פרופיל זהה אחד, אזי הסתברות ההתאמה המקרית חושבה על פי הנוסחה:
2/(N+2)
עוזי עשה שימוש במאגר עולמי בעל 109379 פרופילים, שמתוכם 228 פרופילים של ישראלים. שימוש בנוסחה הניב כי שיעור הגברים באוכלוסיה העולמית, אשר להם פרופיל גנטי הזהה בכל 17 סמני כרומוזום Y לפרופיל שהופק מדגימת גבר שנלקחה מהלידן של המנוחה באותו תיק, נאמד באחד ל-54700 בערך. הוא המשיך והבהיר: "במילים אחרות, אם ניקח גבר אקראי ונבדוק את פרופיל Y שלו (ב-17 אתרים) הוא ימצא זהה לפרופיל שבדגימה מלידן המנוחה בהסתברות של 0.00183% (בערך) וימצא שונה בהסתברות של 99.998%". עוזי מוטרו לא סייג את עצמו ולא הבהיר כי באוכלוסיה הישראלית, המספרים יכולים להיות גבוהים בהרבה.
צורת חישוב הנדירות של פרופיל גנטי המופק מכרומוזום Y שקולה לחישוב הנדירות של פרופיל המופק מ-די. אן. אי. מיטוכונדריאלי. אלו אותן בעיות בהסתברויות. יושרה אקדמית ומשפטית ראויה היא כי אם משתמשים לחישוב הסטטיסטיקה במדגמים מחו"ל, אזי יש לעשות כן גם במקרה א.ח ולהיפך. ד"ר חן קוגל טען כי כאשר השוו את הפרופיל מיטוכונדריאלי למאגר המונה-26,000 פרופילים גנטים לא נמצאה אפילו התאמה אחת. אם כך, ועל פי צורת החישוב של פרופסור מוטרו מדובר על ראיה שמלמדת על נדירות של אחד חלקי 13,000 בערך.
לא חלפו שעות בודדות מאז הפרסום, וכבר נשמעו קולות שהתקשורת מייחסת אותם לפרקליטות, כי המאגר בחול לא רלוונטי ויש להתעלם ממנו. בהשוואה למאגר ישראלי התקבלו 9 התאמות מתוך 2000 פרופילים (אחד ל-200) ולכך יש להתייחס. וזה אומר כי יש בישראל כ-40,000 אנשים נוספים להם פרופיל כמו שנמצא על תאיר. אם פרופילים גנטיים בחול לא רלוונטיים לפרופילים בישראל, מדוע עוזי מוטרו לא ציין אפשרות דרמטית שכזאת בחוות הדעת שלו על נדירות פרופיל שהופק מכרומוזום Y? ההבדל בין הסתברות של אחד לחמישים וארבע אלף, לחצי אחוז הוא שמים וארץ. השימוש בהסתברויות שהתקבלו ממאגר גדול בחול, כאשר זה משרת את מטרות התביעה, בעוד הטענה כי יש להשתמש במאגר ישראלי בלבד, כאשר זה אינו משרת את מטרות התביעה, הוא מדע מונחה מטרה והוא פסול לחלוטין.
בספרות העוסקת הערכת ראיות במשפט הפלילי ידועים המושגים כשל התובע (prosecutor's fallacy) וכשל הסנגור (Defense attorney's fallacy). כשל התובע נובע מההנחה המוטעית כי הסתברות האשמה האפריורית המופיע בנוסחת בייס היא תמיד 50% ללא תלות בראיות המקרה. הכשל הוא המחשבה המוטעית כי אם החיובי הכוזב של ראיה הוא חצי אחוז, אזי גם הסתברות האשמה היא 99.5% תמיד, בכל מקרה ומקרה. מהצד השני, כשל הסנגור נובע מההנחה שההסתברות האשמה האפריורית המופיעה בנוסחת בייס היא נמוכה מאד בכל מקרה ומקרה, ללא תלות בראיות האחרות. על פי כשל הסנגור, ראיה שהחיובי הכוזב שלה הוא חצי אחוז מלמדת שיש בישראל 40,000 שהראיה תצביע עליהם ועל כן, הראיה חסרת משקל ואפשר להתעלם ממנה תמיד. הכשל הוא באותם מקרים שאותו חשוד אינו אדם אקראי מתוך אותם 40,000 אלא הוא אחד שראיות משמעויות אחרות קושרות אותו לפשע. במקרה שלנו, לאור הראיות האחרות כנגד א.ק. ראיה שהחיובי הכוזב שלה הוא חצי אחוז היא משמעותית ביותר. אציין, כי החיובי הכוזב בהשוואות טביעת אצבע נע בין 0.16% (בניסוי של האף בי אי) ל-1.6 אחוז (בניסוי מסוים באקדמיה). זהו סדר הגודל בהשוואת די. אן. אי. מיטוכונדריאלי במקרה הנוכחי. ובכל זאת, התביעה אינה מתעלמת מראיית טביעת האצבע אלא משתמשת בה, שלא בצדק אפילו כראיה יחידה להרשעה!
במקרה הנוכחי, הטענה שאפשר להתעלם מראיה של התאמה בדי. אן. אי. מיטוכונדריאלי, כי היא יכולה להתאים גם לרבים אחרים לוקה בכשל הסנגור. רק שהכשל הזה מגיע הפעם מכיוון התביעה שרוצה כנראה להמעיט ככל האפשר מהראיות כנגד א.ק. זאת בניגוד צורם לפרשנות המפלילה שניתנה לכל בדל ראיה שהוא לכאורה כנגד זדורוב.
אמת מדעית אמורה להיות אובייקטיבית ולא תלויה במטרה. אני סבור שחוות דעתו של מוטרו מוטעית. באותה נשימה אני סבור שהתאמה בהשוואה של די. אן. אי. מיטוכונדריאלי היא ראיה נסיבתית משמעותית, שמחזקת מארג של ראיות אחרות, למרות שאינה יכולה להפליל בעצמה. על החוזק הראיתי של ראיה כזאת יצטרכו לדון באופן מדעי אמיתי ואובייקטיבי, ולא כתלות במטרה אותה רוצים להשיג. וכאשר תמצא הדרך, היא תצטרך להיות מיושמת בכל התיקים בישראל, ולא רק במקרה בודד.