מפלצות האינטרנט, Big Data ומחקר אקדמי

הפוטנציאל והסיכונים במחקר המתבסס על הרשת החברתית
תמונה של דודי אילת
דודי אילת

בשנים האחרונות גובר והולך העניין הפוליטי, הכלכלי והתקשורתי בענקיות הרשתות החברתיות ומנועי החיפוש – פייסבוק, גוגל וטוויטר. דומה שחברות אלו, המגלגלות מאות מיליארדי דולרים והן מונופול בתחומן ואולי אפילו מצביעות על כשל שוק, הפכו גם למעין "האח הגדול". נדמה שהחזון האפוקליפטי של ג'ורג אורוול בספרו "1984", על המדינה הטוטליטרית היודעת הכול על כולם, הולך ומתממש בידי חברות עסקיות נוצצות שכולם רוצים לעבוד בהן והן סמל של גאונות והצלחה.

האידאל הזה מתנפץ כיום לרסיסים לאחר שעלו שערוריות כמו פרשת קיימברידג' אנליטיקה – חברה בריטית שבאמצעות פרופילים של משתמשים בפייסבוק איתרה, סיננה ופילחה מידע ובהתאם שיווקה תכנים פוליטיים משמעותיים לבוחרים פוטנציאליים במסע הבחירות הראשון של דונלד טראמפ. רבים מצביעים על הכוח האדיר של הרשתות החברתיות והיכולת להשתמש בהן לצרכים פוליטיים ולצורכיהם של בעלי ההון המחזיקים בהן, וטוענים שכוחם הפוליטי להעלות ולהוריד פוליטיקאים מעיב על עקרונות דמוקרטיים, מעבר לכשל השוק עצמו, הנובע מקיום מונופול גלובלי כמו חברת פייסבוק.

יחד עם זאת, כמו בכל חרב פיפיות יש גם צד חיובי, והוא שלרשתות החברתיות יש פוטנציאל אדיר מבחינת היכולת לזהות בהן מגמות חברתיות ודעת קהל בנושאים שונים ומגוונים. הן פלטפורמה חשובה המשמשת את הציבור הרחב, את הפוליטיקאים ואת ארגוני החברה האזרחית, והדיון הציבורי בהן הוא כיכר השוק המודרנית – לטוב ולרע.

המחקר האקדמי-פוליטי יכול לצאת נשכר מהרשתות החברתיות. הן יכולות להיות כר פורה לאיסוף נתונים ולזיהוי מגמות במה שנקרא Big data. לדוגמה מדד השנאה של קרן ברל כצלנסון, המופעל על ידי חברת מערכות מידע המנטרת ביטויים שונים המלמדים על רמת האלימות בשיח הציבורי ועל מושאי האלימות מבחינת המגזרים בחברה הישראלית. מדובר בדו"ח של מחקר המנטר במשך כל שעה במשך היום כחצי מיליון שיחות ברשתות החברתיות – סטטוסים, תגובות, טוקבקים, ציוצים וכיו"ב – ומסיק מהן נתונים חשובים על רמת הקיטוב בחברה הישראלית. מבחינה מחקרית מדובר כאן על קפיצה אדירה לכאורה מבחינת המחקרים הכמותיים והאיכותניים, ועל שיפור ניכר ביכולת ובקלות לזהות נתונים מספריים, לבצע ניתוחי תוכן ולהסתמך עליהם כדי לנבא מגמות בהיקפים גדולים בהרבה בהשוואה לבסיסי הנתונים ששימשו את החוקרים בעבר ושעדיין משמשים אותם.

את מסגרות המדגם המקובלות – הנחקרים מקבלים שאלונים ולפי תשובותיהם מתקבלות מסקנות, בהתחשב ברמת סיכון וטעות דגימה – מחליפות מסות אדירות של נתונים עם צורך מינימלי בשיתוף הנחקרים. מהנתונים האלה אפשר לנסות לנבא מגמות שונות בתחומים פוליטיים, כלכליים, צרכניים ועוד. אך אליה וקוץ בה. האם הנתונים הנאספים במסות אדירות מהרשתות החברתיות אכן יכולים לנבא את המתרחש – שזו השאיפה העליונה של כל תיאוריה חזקה במדע? אירועים שונים המתרחשים בפתאומיות, כמו לאחרונה רצח נשים בידי בני זוגן, מעידים על פערים גדולים בין הפרופילים והתמונות שאנשים מעלים לפייסבוק לבין מציאות חייהם. דומה שהרשת החברתית, כספוג גדול המכיל הכול, מכילה בין היתר מסות גדולות של מידע לא מדויק ולא מייצג, שטוח ובעל פוטנציאל גדול של טעויות, החל מפרופילים מזויפים וכלה במצגי שווא. אלה מייצרים מצג מציאות מזויף שיכול להטעות משתמשים רגילים וחוקרים המסתמכים על הנתונים. לפיכך, רק הצלבה של הנתונים הגולמיים הנאספים בפייסבוק וברשתות עם מקורות מידע נוספים, כמו קבוצות מיקוד וראיונות עומק, עשויים לתת תמונה נכונה על המידע העצום המתפרסם ברשתות. מידע זה מופעל באמצעות לוגריתמים כאלו ואחרים, שיכולים לתת תמונה כללית אבל לא בהכרח עמוקה.

ה"אח הגדול" – פייסבוק, גוגל וכיו"ב – האוסף עלינו מידע אישי, פוליטי, כלכלי ואחר כל הזמן ובכל מקום דרך כל חיפוש בגוגל שלנו או ברשתות חברתיות, יכול לטעות מדי פעם ולשווק לנו מוצרים שלא מעניינים אותנו. אך ההבדל המהותי בין חברות אלו לבין חוקרים הוא שכשחוקרים טועים, על בסיס מידע לא נכון שנאסף ברשתות, הטעות יכולה לעלות להם הרבה יותר במונחים של קריירה, תדמית וכדומה. ומכאן שמדובר ב-Big data. יש לשיטה פוטנציאל אדיר, אך כמו בכל עיקרון מודיעיני, רק הצלבה של מקורות מידע שונים יכולה לתת מהימנות גבוהה יותר לנתונים.

שיתוף ב facebook
Facebook
שיתוף ב twitter
Twitter
שיתוף ב linkedin
LinkedIn
שיתוף ב whatsapp
WhatsApp
שיתוף ב email
Email

4 תגובות

  1. בסוף הפסקה לםני הארונה נכתב "מידע זה מופעל באמצעות לוגריתמים כאלו ואחרים, שיכולים לתת תמונה כללית אבל לא בהכרח עמוקה." אני מניח שרבים ינחשו שהתכוונת לאלגוריתמים ואלגוריתמים אינם "מפעילים מידע" אלא מעבדים נתונים… כדי לספק לנו תמונה כללית ומקיפה…
    בגלל רשלנות השלטונות, מפלצות האינטרנט מסוגלות היום לבצע ניתוח נתונים על התנהגותנו במגמה לעצב אותה, בהיקף ובעומק ששום קבוצת מחקר אקדמית לא תוכל להגיע אליהם.

  2. אפילו שמות. וגם דעות. ובטח עובדות נוספות.חלק בכלל מראש משתתפים כדי ליצור דיעות מוגנות.

כתיבת תגובה

האימייל לא יוצג באתר.

פרסום תגובה מהווה הסכמה לתנאי השימוש באתר.
התגובות יפורסמו לפי שיקול דעת העורך.

עשוי לעניין אותך