ואכן, הדמנציה חוזרת…

כיצד מתייחסים מפתחי יישומים אל פיתוח ChatGPT?
תמונה של מר גבעון
פרופסור יהושפט גבעון

בשלושה מאמרים קודמים שפרסמתי באתר זה, שניים לפני חמש שנים ואחד לפני ארבע שנים, כתבתי על תופעות הדמנציה בתרבות הדיגיטלית ובתחום הבינה הסינתטית. תיארתי דוגמאות להיעלמותן של תגליות מדהימות מזיכרון המפתחים כתופעה המתגלה לסירוגין מאז שנות החמישים של המאה הקודמת. והנה, אמש נתקלתי בדוגמה עדכנית לתופעה זו. בראיון עם מנכ"ל של חברה ישראלית לפיתוח יישומים יצירתיים באמצעות כלי הבינה החדשים, הצהיר המנכ"ל, וללא צל של היסוס, כי המהפכה של הבינה המלאכותית פרצה לפני מספר חודשים כאשר ChatGPT יצאה לאור. כך יציאה לאור של תוכנה מדהימה מוצגת כתגלית שאין לה עבר היסטורי או שורשים.

המרואיין, במוקד דבריו, השמיע גם ביקורת כנגד אלה הנרתעים מהמצאות חדשות, אשר לדעתו תמיד מעוררות חששות רק בגלל עצם החידוש. בריאיון לא הוזכר החשש ההולך וגובר מפני פגיעה מסוכנת בפרטיות במשתמשים (שבגללה באיטליה נקבע בחוק שפיתוח התוכנה יושהה לפחות לשישה חודשים). על פגיעה זו כתבתי כבר בהתייחסות אל "הרשתות החברתיות". באתרי החדשות יכולנו לקרוא כי "השבוע כמה מהשמות הגדולים בתחום הטכנולוגיה, כולל אילון מאסק, קראו למעבדות הבינה המלאכותית להפסיק את המשך ההכשרה של מערכות הבינה המלאכותית החזקות ביותר למשך שישה חדשים לפחות, תוך ציון 'סיכונים עמוקים לחברה ולאנושות'." בפירוש לא מדובר כאן במשתמשים חדשים היראים מחידושים.

במאמר הנוכחי אתייחס אל מאמר ארוך מ-14 בפברואר 2023 שבו ניסה סטיבן וולפרם להסביר לציבור קוראיו "מה עושה ChatGPT… ומדוע הוא מצליח?". במאמר הזה מצאתי 15 פגמים, אם כי לא כולם נוגעים לאובדן זיכרון ביחס לעבר של המאמצים ההרואיים לפתח בינה מלאכותית שתתחרה בבינת האדם.

בראשית המאה הקודמת, כאשר טיורינג וקלייני הציעו את הצעותיהם להגדרת מהו חישוב יעיל, הם מיד חקרו והוכיחו את מגבלות ההגדרות שהם הציעו. זאת גישה של חוקרים בעלי יושרה אקדמית. לא מציעים כלי בלי לחקור ולתאר גם את מגבלותיו. וולפרם במאמרו אינו מזכיר כלל את הלקחים של טיורינג, פוסט וקלייני, ואף לא שום אפשרות שייתכן שלתוכנה החדשה הזאת יש מגבלות עקרוניות. כנראה את וולפרם לא עניינו התכונות העקרוניות של הכלים החדשים ובוודאי לא מגבלותיהם.

נוסף לכך, במאמרו וולפרם מקדיש דפים רבים לתיאור הרשתות של הנוירונים הממוחשבים המתפקדות ב"הכשרה" של התוכנה הנדונה וגם מרכיבות אותה. רשתות אלה הן פרי עבודתם של מקולק ופיטס (1943), אשר חקרו מוחות של צפרדעים וכך גילו את מבנה הנוירון ואת מבנה המוח כרשתות המורכבות מנוירונים. מחקר זה עודד מחקרים רבים בתחום מדעי המוח מהסוג שהיה נהוג בשנות ה-50, בראשית ימי מדעי המחשב. הנה, בשנת 1951 הוכיח סטיבן קלייני כי רשתות כאלה – אפילו כאלה המכילות לולאות, בניגוד לרשתות שעליהן מתבססת תוכנת ChatGPT – אינן מסוגלות לייצג את כל האירועים אלא אך ורק אירועים מהסוג המוגבל לאוטומטים הסופיים (הוא זה שקרא לאירועים האלה "אירועים רגולריים"), ולכן רשתות אלה אינן מסוגלות להגיע לרמת התפקוד של מכונות טיורינג או אפילו לזהות תבניות תחביריות מתוחכמות מן הסוג הנפוץ הבא לידי שימוש וביטוי בשפות תכנות. הוספת אפשרות הלמידה, המתבטאת בשינויים בהגדרות של ערכי הסינפסות של הנוירונים, לא משנה תוצאה זו, כי בכל רגע נתון כאשר משתמשים ב-ChatGPT, הסינפסות של הרשת שלה הן בעלות ערך קבוע ונתון, כלומר רשת מהסוג שההוכחה של קלייני חלה עליה. רשת נוירונים, מלומדת ככל שתהיה, היא עדיין אוטומט סופי ואיננה מסוגלת לפעול כמו מכונת טיורינג אוניברסלית (קרי כמו מחשב דיגיטלי). כמו מרבית חוקרי מדעי הקוגניציה המטפחים את הרעיון שהמוח הוא מחשב, וולפרם לא הזכיר את תוצאות המחקר הזה בכלל.

אינני יכול לקבוע אם מפתחי הגרסאות החדשות של תוכנת ChatGPT מבססים אותה על מודל לרשתות נוירונים מסוג חדש, שמאפשר התנהגות מתוחכמת יותר של התוכנה. אם כן, אז כפי הנראה זה סוד מסחרי של המפתחים. מצד שני, מודל חדשני לרשתות הנוירונים היה מקבל הד עצום במחקרים העדכניים של מדעי הקוגניציה. לצערי, המאמרים המגיעים אליי ממשיכים לגלות את תופעות הדמנציה גם של מדעי הקוגניציה בהתעלמות גמורה ממחקרו של קלייני ואין בהם סימן להתחדשות בתפיסת ההרכב של רשתות הנוירונים. לכן, בלי לבטל את ספקותיי, זה שנים אני מחכה בסבלנות לחידושים משמעותיים בהבנת התבונה האנושית, שיפורסמו במאמרים האקדמיים…

Facebook
Twitter
LinkedIn
WhatsApp
Email

8 תגובות

  1. הבעיות המתודוליות והמדעיות יפתרו. זאת רק שאלה של זמן. הבעיות האמיתות הן אלה המוסריות והחברתיות והפוליטיות.

    1. לשרית, תודה על תגובתך.
      אינני מבין כיצד תגובתך קשורה לתופעת השכחה שנדונה במאמר. אודה לך אם תסבירי לי.

    2. לשרית א.,
      כדי שבעיות מתודולוגיות ומדעיות ייפתרו אסור לשכוח אותן.

  2. סימני שאלה מעניינים.
    יחד עם זאת אני מאמין שרוב הגולשים לא ממש מבינים את המסרים במאמר

    1. לישי תודה על תגובתך.
      אני מסיק מאמונתך שאתה מצאת במאמר הרבה מסרים לא מובנים, אך אתה מוותר על הבנתם במקום לבקש הסבר. צר לי.

  3. התופעה הזאת של התעלמות ממחקרים קודמים נפוצה גם בתחומים אחרים. פרסום משנות ה-50 זה ממש "אנטיקה". זאת סיבה למכשלה גדולה. לי אמר אחד ממורי, כשהתייעצתי איתו על בחירת נושא לעבודה. דבר ראשון אתה צריך לקרוא כל מה שכתבו על הנושא הזה. אבל כמה מורים כאלה יש ?

    1. לאליהו תודה על תגובתך.
      בכל תחום אקדמי חייבים לנהוג כפי שהמורה שלך הדריך אותך. אחרת התפתחותם תיגדע. כך הדריך אותי מורי פרופ׳ מיכאל רבין כשרציתי לכתוב תזה לתואר שני במתמטיקה. זה צריך להיות מובן מאליו. תחומי הדעת שבהם נמנעים מלנהוג כך הם תחומים הנגועים בפולחן המטען (פיינמן בהרצאת הסיום לתלמידי תואר ראשון בקלטק בשנות ה-80.) עושים תנועות של מחקר מדעי או של פיתוח טכנולוגי ומשלים את עצמם.

    2. לאליהו בורוכוב
      אני מקווה שאינך חושב שאנתיקות אינן רלבנטיות היום.
      האם משפט פיתגורס, שהוכח לפני 2000 שנה ויותר, איננו רלבנטי להנדסה של ימינו?
      האם תוצאות על מגבלות שהוכחו לפני אלפי שנים אינן רלבנטיות כי הן אנתיקות?
      אפילו המכניקה הסטטית וחוק הציפה של ארכימדס רלבנטיים לימינו.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

פרסום תגובה מהווה הסכמה לתנאי השימוש באתר.
התגובות יפורסמו לפי שיקול דעת העורך.

עשוי לעניין אותך

דילוג לתוכן