רעש נתוני קורונה

מה עושים?
שרטוט של הוירוס
קורונה תמונה: https://www.scientificanimations.com/ h.m.wikipedia.org

המאמר נכתב במשותף עם ניקי קונס

למרות המאמצים המדעיים, החיסונים והניסיונות לחזור לשגרה, נראה שנגיף הקורונה מסרב להיעלם מחיינו. יתרה מכך, נדמה שהוא עדיין לא אמר את מילתו האחרונה.

וכאן עולה השאלה: איך לא נופלים שוב בפח בעת קבלת החלטות בתקופה הקרובה? השאלה נוגעת לכל המערכות הקריטיות במדינה ובעיקר למערכת החינוך, נוכח "רעש" הנתונים שמציף את הציבור ואת מקבלי ההחלטות. באופן כללי, "רעש" נתונים הוא מצב מתסכל. עם זאת, הוא גם מאפשר לבחון אסטרטגיות התמודדות חדשות עם הקורונה לצד הנחות עבודה ישנות.

בניהול סיכונים קיים המונח As low as reasonably practical, ומשמעותו: הפחתת סיכונים עד היכן שאפשר. ומקבלי ההחלטות צריכים להיעזר בניתוח נתונים כדי להגיע לאיזון שכזה. על מנת לנהוג כך עליהם לדרוש מידע איכותי, בעיקר בעולם מתקדם שבו המדע הוא חזות הכול.

זוכה פרס נובל בכלכלה הפרופ' דניאל כהנמן מתאר בספרו האחרון " Noise: a flaw in human judgement ", את ההשפעה של "רעש" בקבלת החלטות מעבר להטיות כאלה ואחרות. מקבלי ההחלטות מוצפים במספרים עם "רעש", המציאות משתנה, והמעבר ממספרים למידע שמאפשר לקבל החלטות אינו דבר פשוט. לא רק כהנמן ניסה לתהות על מהותם של הנתונים המפוזרים. חוקרים רבים הקדישו מאמצים למציאת פתרון לנושא: "רעש הנתונים וחיבורים למציאות", גם אני עסקתי בכך בספר "איכות המידע" (קנת ושמואלי, הוצאת ויילי, 2016). כעיקרון, הקושי בניתוח נתונים נוצר במצב שבו אין בהם דפוס התנהגות ברור על פי ניסיון קודם. עם זאת, בסיטואציה שאליה נקלע העולם עם הקורונה כבר הצטברו לא מעט נתונים, והבעיה כעת היא עודף נתונים וחוסר במידע.

כאן עולה שאלה נוספת: כיצד להתמודד עם חוסר מידע במציאות סבוכה כל כך, עם נגיף מאיים כל כך?

השלב הראשון הוא ניתוח המציאות ומציאת מוקדי סיכון באמצעות הנתונים, וחלוקתם לקטגוריות. כך למשל המציאות העולמית מלמדת כי מעט מאוד מדינות החליטו והצליחו לייצר הגנה מלאה מפני הנגיף לאורך זמן.

יתרה מכך, הגדרת מדיניות של אפס הדבקה הוכחה כלא יעילה ולפיכך, המציאות מחיבת מדיניות של חיים לצד הקורונה (לא רק מחוסר ברירה, אלא גם כ"יישור קו" אסטרטגי עם מדינות רבות בעולם).

קטגוריה ראשונה בהמחשת ההתמודדות עם רעש נתונים יכולה להיות מקורות חדירת הנגיף. כך למשל, שדה תעופה נחשב גורם סיכון לקורונה. מכאן שהוא צריך להיות מוקד מרכזי לטיפול ולהתמודדות. בישראל נתב"ג זוהה מלכתחילה כמקור להכנסת וריאנטים. כל זמן שהוא פתוח, יש להניח שאכן ייכנסו וריאנטים חדשים. מכאן שיש להשקיע בניתור גלובלי של מקורות פוטנציאליים על מנת להאט את קצב החדירה.

קטגוריה שנייה היא הנגיף – האיום מהקורונה נובע מהווריאנטים שהנגיף מייצר. כעת מדברים על זן הדלתא פלוס, שהחל בהודו והִכה חזק ברחבי העולם ואחריו ייתכן שיגיע נגיף קטלני יותר. לכן גם כאן נדרש ניתוח מקיף הכולל מחשבה בהתאם לנתונים.

קטגוריה שלישית הם המחוסנים – מרב האנשים שיכולים להתחסן כבר התחסנו באופן מלא. וכעת נדרש לנטר את יעילות החיסונים בקבוצות שונות ולפעול בהתאם. מתן חיסון שלישי לאוכלוסיות מתחת לגיל 60 צריך להתבסס על ניטור כזה.

לזמן יש משמעות. אחרי כשנה וחצי של מגפה עולמית, יש לשים דגש על פתרונות מותאמים לעת הנוכחית ולא להתייחס לפתרונות שעבדו בעבר, או שלא. כך למשל, השאלה האם סגר רביעי יהיה בכלל אפקטיבי? חייבת להיבחן בדקדקנות.

וכך גם לגבי מתן סדרי עדיפות למערכות שונות במדינה, כמו למשל מתן עדיפות יתרה למערכת החינוך שסבלה מניהול בעדיפות נמוכה בתחילת הקורונה.

המדיניות שתינקט בכל אחת מהקטגוריות אמורה להתבסס על נתונים, ועל כן השאלה המרכזית היא איך בוחנים את הקטגוריות בעזרת ניתוח נתונים?

התשתית להערכת איכות מידע (Kenett, R. and Shmueli G. (2016) Information Quality: The Potential of Data and Analytics to Generate Knowledge, Wiley) כוללת ארבעה מרכיבים (components) : מטרות הניתוח, הנתונים שישמשו לניתוח, שיטות הניתוח, ופונקציית התועלת.

וכן שמונה ממדים (dimensions) הכוללים: רזולוציית הנתונים, מקורות הנתונים, צורת השילוב של הנתונים, רלוונטיות הנתונים מבחינת זמן האיסוף, נגישות תוצאות הניתוח בהתחשב במטרות, יכולת ההכללה, יכולת קבלת החלטות והנעה לפעולה על בסיס הניתוח, ולבסוף תקשורת הממצאים בצורה המתאימה והאנשים המתאימים.

במאמר זה נתמקד בארבעה ממדים:

רזולוציה (data resolution) – כדי להבין את משמעות נתוני ההדבקה צריך לבחון חתכים שונים של אוכלוסייה, למשל על פי אזורי מגורים. דוגמאות כאלה ניתן למצוא באתר משרד הבריאות.

שילוב נתונים (data integration) – כשיש גישה לנתונים ממקורות שונים, כמו נתוני תחלואה ונתוני התנהגות אוכלוסייה )כגון שימוש בתחבורה ציבורית(, צריך למצוא דרך נכונה לשלב ביניהם. קיימים מודלים כגון רשתות בייסיאניות המאפשרים זאת באופן יעיל.

הכללה (generalizability) – נתוני המאמתים מבוססים על בדיקות. האם הבדיקות שבוצעו מאפשרות להכליל את הממצאים לכלל האוכלוסייה ו/או לקבוצות שונות באוכלוסייה?

הנעה לפעולה (action operationalization) – ניתוח הנתונים מכוון לסייע למקבלי החלטות. יכולת מקבלי החלטות לגבש תוכניות פעולה על בסיס המידע שסופק הוא מרכיב חשוב באיכות המידע.

המסגרת הזו, המכונה InfoQ , מספקת תשתית שמאפשרת להצביע על ליקויים בניתוח הנתונים ולכוון לשיפורים כדי להביא מידע איכותי שמסייע לקובעי מדיניות. יש להבחין בין נתונים שנאספים באופן שוטף, נתונים נצפים, לבין נתונים שנאספים כחלק מניסוי או התערבות מתוכננת. למשל בהשוואת קבוצות שבהן הייתה התערבות שונה. אם הבחירה של הקבוצות בוצעה בתכנון סטטיסטי, אפשר יהיה ללמוד על תוצאות ההתערבות. דוגמה מצוינת ניתן למצוא במחקרים של בנרג'י ודופלו, זוכי פרס נובל לכלכלה ב-2019, שהתייחסו לרעש הנתונים וליכולת לטפל בו, תוך שימוש במושגים כמו הפחתת סיכונים.

האקדמיה מצאה את הדרך לטפל בנתונים גם בלי פאניקה, וכל שצריך הוא להשתמש בה, בעיקר כעת כשנדמה שחוזרים על אותן טעויות וכשאינסוף מידע משתחרר לאוויר.

Facebook
Twitter
LinkedIn
WhatsApp
Email

10 תגובות

  1. הבעיה איננה בנתונים אלא קודם כל בקונספירציות, בזיוף עובדות, וכדומה

  2. הבעיה היא שכמה חוקרים יגיעו למסקנות שונות מאותם נתונים. והאזרח מן השורה נשאר עם סימני שאלה

  3. מאמר מעניין ונוגע בבעיה של ריבוי נתונים אינו תחליף לניתוח.
    באופן אישי, שמחתי לראות עוד מישהו שמשתמש במונח ALARP בניהול סיכונים. מושג שנתקלתי בו מעט במסגרת עיסוק בניהול סיכונים ומצאתי לנכון לכתוב עליו ערך בויקיפדיה העברית.

  4. למאמר יש השלכות עולמיות.
    בתקווה גדולה שאנשי המקצוע בתחומי בריאות הציבור, החינוך, התיירות, התחבורה, הכלכלה ועוד יוכלו להשתמש בכלים המוצעים כדי להוציא תובנות מבוססות על מידע ולהביא אותם למקבלי ההחלטות.

  5. גם עודף נתונים
    גם נתונים סותרים
    גם נתונים מזוייפים
    גם נתונים שגויים
    גם כלי מדידה שונים
    גם פרשנות מקצועית לא אחידה
    איך אפשר בכלל לפתור את הבעיה?

  6. מאמר מעניין בנושא חשוב שגם מציב בעיה וגם שם מולו פתרון. ממאמר כזה אפשר ללמוד.

  7. בשביל זה יש מומחים מקצועיים משכילים שמכירים את השיטות והנוסחאות ויביאו לנו מסקנות מוסכמות ואחראיות.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

פרסום תגובה מהווה הסכמה לתנאי השימוש באתר.
התגובות יפורסמו לפי שיקול דעת העורך.

עשוי לעניין אותך

דילוג לתוכן