האם הבנה איננה תנאי קדם לבינה מלאכותית?

האם בינה מלאכותית יכולה לצוץ מאליה?
תמונה של שפי
פרופסור יהושפט גבעון

ההבנה היא נושא רב-ממדי ולכן היא חמקה מהבנתנו במשך מאות שנים. קארל ברייטר, בספרו "חינוך ושכל בעידן הידע" (2002) (פרק 4, עמודים 130-93) דן בבירור תפקיד ההבנה בלמידה ובהוראה. מן הדיון שלו מתברר שבתחום החינוך יש עניין רב בשילוב או בגילום ההבנה בהוראה ובלמידה, אך אין הסכמה לגבי מהות ההבנה. מצב זה לא השתנה עד היום הזה. יש המאמינים שמחקרים עדכניים על מוח האדם יפתרו את הבעיה. ואולם בלי לדעת מה זאת הבנה, כיצד יזהו המציצים במוח האדם את התגלמות תופעת ההבנה במוח?

צריך לציין שלא כל אלה שעסקו בחקר הלמידה וההוראה ראו בהבנה גורם משמעותי. למשל סקינר, שנחשב לאבי הפסיכולוגיה המדעית, טען שמושג ההבנה איננו דרוש כדי להרכיב תיאוריה מדעית ומבוססת על התנהגות האדם בכלל, ועל הלמידה בפרט. כיום נראה שהעוסקים בפיתוח בינה מלאכותית הולכים בדרכו של סקינר ונמנעים מלהגיע לידי הסכמה ברורה ביחס לבירור מהות ההבנה.

במאמר קודם דנתי באופי הידיעה של מומחים מקצוענים וברעיון שניתן להרכיב תוכנות שמממשות ידיעה כזו ולכן תוכנות כאלה נחשבו כהישג מזהיר של פיתוח הבינה המלאכותית. במאמר הזה אני דן בצורך להבין גם את ההבנה כדי לפתח תוכנות נבונות. ידיעה והבנה הן שני היבטים לא זהים של התבונה האנושית. אני יכול לדעת שנכדי למד ללכת אך אינני מבין זאת.

קשה להעלות על הדעת שללא הבנת ההבנה נוכל לדעת להרכיב תוכנות נבונות. הקשר הברור שבין שורשי המילים "הבנה", "תבונה", "בינה" וכדומה אינו מספק מידע כדי לעזור להרכיב תוכנות נבונות. הקושי היסודי בהרכבת תוכנות נבונות מתעצם גם בשל העובדה שכל תוכנה מורכבת מרכיבים שפעולתם מנותקת בעצם מהותם והגדרתם מהבנה. עד כמה סביר להניח שהרכבה שיטתית של תוכנות נבונות מרכיבים חסרי תבונה ניתנת למימוש גם ללא הבנת ההבנה? והנה, המציאות מראה לנו כמה דוגמאות לכך שהנחה זו איננה מופרכת כל כך.

בשנת 1936 ניסח טיורינג את הגדרתו למושג החישוב היעיל, אשר נתפס לפני כן רק בדרך אינטואיטיבית, ללא הגדרה מנוסחת ומוסכמת. על סמך תצפיות בהתנהגותן של מְחשבות אנושיות, הוא ניתח את תהליכי החישוב שתיאר אל-ח'וואריזמי במאה השישית כמוגדרים מפעולות הדורשות מינימום קיצוני של הבנה: זיהוי תווים פשוטים, המוצבים בנייר משובץ, כל אחד במשבצת אחת; תגובות מינימליות, של החלפת תו יחיד בכל פעם; ותזוזה בצעדים מינימליים על פני נייר משובץ, לא יותר ממשבצת אחת בכל פעם; וכדומה.

לניסוח הזה (כמו לניסוחים השקולים לו, שניסחו עמיתיו) היו כמה יתרונות מדהימים וברורים (לכל מי שטרח לקרוא ולהבין את מאמרו של טיורינג לפחות): א. מהנדסי אלקטרוניקה, בראשית המאה הקודמת, יכלו לדעת כיצד לממש את ההגדרה הזו בעזרת בניית מכונות אוטומטיות פשוטות כמערכות בעלות מספר סופי של מצבים ללא שום קושי מיוחד; ב. מושג החישוב היעיל הוגדר מרכיבים המוכרים היטב למהנדסים ולמתמטיקאים ולכן ניתן היה להסיק לגביו מסקנות מתמטיות, וכך, ניתן היה לבסס את תורת החישובים היעילים כתורה מתמטית שימושית; ג. התברר, חד-משמעית, וטיורינג ידע להוכיח זאת, שכל הפונקציות המוכרות למתמטיקאים של המחצית הראשונה של המאה העשרים ניתנות לחישוב באמצעות מכונות כאלה.

חשוב לציין כי טיורינג אומנם השתמש בחיקוי המְחשבות המקצועיות ובצמצום הדיון לרמה שמאפשרת יתרונות אלה, אך הוא הסתפק בהישג הזה ולא ניסה לחקות יכולות מנטליות אחרות שלהן. אפילו במאמרו הבעייתי משנת 1950 הוא לא הציע דרך כיצד ניתן לעשות יותר מזה כדי לקבל תשובה לשאלה "האם מכונות יכולות לחשוב?".

מערכות אלה, שהגדיר טיורינג, למרות פשטות רכיביהן, יכלו אפוא לבצע את כל החישובים הנדרשים במתמטיקה ובהנדסה. מדוע שלא יוכלו, בדרך מתוחכמת כלשהי, בסופו של דבר לבצע גם הבנה, למשל, של החישובים האלה? המרחק בין פעולות המחשבים שבידינו לבין הפעולות הבסיסיות המרכיבות אותם הוא עצום. כל מתכנת, או מתכנתת, שלמדו בקורס שכיח לתיכנות מתקדם, יודעים כמה רחוק "עיבוד נתונים אוטומטי" המיוצג בשפת התכנות שבה הם משתמשים, מהפעולות הפשוטות של שפת מכונה. והם גם יודעים שכל תוכנית של כל מחשב, מתבצעת בפועל כאילו נכתבה מראש בשפת מכונה.

דאגלאס הופשטטר, בספרו "גדל, אשר באך: גביש בן אלמוות" (שהוזכר בכמה וכמה מאמרים קודמים שלי באתר הנוכחי) הקדיש מאות דפים לדיון בפער שבין מורכבוּת התוכנות האפשריות ובין פשטות הרכיבים של המחשבים המודרניים. אני מציע לכן ולכם להתמודד עם קריאה בספר הלא שגרתי הזה בדרך לא שגרתית. למשל, אם תקפצו ותציצו בפרק האחרון של הספר (פרק כ', שכותרתו המשנית היא "האם מכונות יכולות להפגין מקוריות?", בעמודים 772-735 ואילך, במהדורה העברית) תוכלו להבחין בנקל ברמזים לכך שאמונתו של הופשטטר ביצירת בינה מלאכותית משמעותית הייתה צפויה להתערער. ואכן היא התערערה לגמרי ברגע שהופשטטר הבין שהיכולת המנטלית של המְחשבות המקצועיות, בכל היקפה, רחוקה מאוד ממימוש בכלים הדיגיטליים, ובוודאי כאשר איננו מבינים יכולת זאת.

ובטבע הפיזיקלי, במאות מיליוני השנים מאז המפץ הגדול, חלקיקים התרכבו זה עם זה ואטומים צצו מאליהם. ומתערובת של אטומים כך צצו מולקולות. ומתערובת של מולקולות פשוטות צצו מאליהן המולקולות האורגניות המורכבות ומהן כך צצה מולקולת הדנ"א, וכך צצו החיים. ומן החיים צצו יצורים בעלי מוח פשוט ואחרי כן, צצו בעלי מוח מפותח, והנה, צצו התודעה וההבנה של בני אדם. ועדיין איננו מבינים כיצד בדיוק כל זה קרה. האם נוכל לחזור על התהליך הזה ולקבל את תוצאותיו הייחודיות, מבלי להבין את פרטיו? והאם על ידי חיקויים דיגיטליים מתוחכמים של תהליכים אקראיים וחסרי תבונה נוכל לגרום לכך שגם תבונה אמיתית תצוץ מאליה, מבלי להבין תחילה כיצד הבנה נוצרה, בדרך כלשהי, מחלקיקים חסרי תבונה? האומנם – ואולי דווקא כן?

שיתוף ב facebook
Facebook
שיתוף ב twitter
Twitter
שיתוף ב linkedin
LinkedIn
שיתוף ב whatsapp
WhatsApp
שיתוף ב email
Email

10 תגובות

  1. הבנה של הסיבה זה הבסיס שמאפשר לעלות מדרגה בסולם של הבינה המלאכותית. ממליץ על סיפרו של יהודה פרל The book of why

  2. מאמר של ממש שעזר לי לחדד כמה מושגים וכמה תובנות אצלי.

  3. ברור
    איך אחרת ניתן למערכת הוראה איך לנהוג במצב מסוים
    השאלה היא מה צריך להבין

    1. אנא, התבונן בעובדות. מושג ההבנה שייך לתחום מדע השכל, כי ההבנה היא תופעה או התרחשות שכלית. דיון במדע כלשהו איננו מדע ואינו סתם פילוסופיה, אלא פילוסופיה של המדע, שהוא תחום מוגדר בפילוסופיה. הבעיה היא שמדע השכל לא פותח מספיק ולכן התייחסות אל סוגיות שאמורות להיחקר במדע השכל נראות "יותר פילוסופיה".

  4. מצטער ח, דעתי בכלל איננה רלבנטית. ויש שאלות שרק את/ה יכול/ה להשיב עליהן.

    1. לרון תודה על תגובתך.

      נדמה לי שהמאמר שלך עוסק בחשיבה מושגית ולא בהבנה מושגית. עד כמה שהצלחתי להבין בקוראי בו, הוא איננו רלבנטי לתוכן המאמר הנוכחי שלי העוסק בקשיים בהבנת ההבנה עצמה. למשל, במאמר שלך אין כל הגדרה למושג ההבנה. המאמר שלך מציג עקרונות להוראת שני נושאים בלבד (סטטיסטיקה ו"מדע הנתונים" שאינני יודע מהו). הוא מכסימום דוגמה למה שכתבתי במאמר עצמו על הסיכום של ברייטר ביחס לחשיבות המיוחסת להבנה בהוראה ובלמידה.

      דווקא מצאה חן בעיני הסבת תשומת הלב אל הקשיים של התלמידים הנובעים מריבוי הייצוגים הטקסטואליים להצבעה על מספרים. הנה דוגמה משלי: 3^2 – 2^2 = 3 + 2 והכללתה לחוק אלגברי חשוב הנוגע להפרש של שני ריבועים של מספרים, אשר במקרה של שני מספרים *עוקבים*, *תמיד* יהיה סכומם. כל האלגברה צומחת משיויון תכנים (במאמרך קראת לזה משום מה "שקילות של תכנים") של ביטויים שונים הנבנים בדרכים דומות…

      1. הביטוי החשבוני שכללתי בתגובתי לרון התערבל… אנסח אותו במילים כדי לא להיתקל חזיתית באי התאמת עיבוד תמלילים בעברית עם עיבוד תמלילים בסימנים חשבוניים או באנגלית: המספר שלוש בריבוע פחות שתיים בריבוע זהה למספר שלוש ועוד שתיים. מסתתר כאן חוק חשבוני…

כתיבת תגובה

האימייל לא יוצג באתר.

פרסום תגובה מהווה הסכמה לתנאי השימוש באתר.
התגובות יפורסמו לפי שיקול דעת העורך.

עשוי לעניין אותך

ליד מסך מחשב

אתריום

כיצד רוכשים