אם תקראו תיאורים של קורסים חדשניים תוכלו לגלות בהם קטעים שבהם מתואר, בהתלהבות רבה, שימוש בטכנולוגיה חדישה לביצוע הערכה תוך כדי פעולה, למשל "להפעיל את הלומדים בכל נושא שיעור נתון, לספק להם ולמרצה משוב והערכה בזמן-אמת על מצב הלמידה בכיתה, לאפשר התאמה אישית בקצב ובתכנים הרצויים בכל שלב ובכך להפוך את הלומדים למעורבים ולפעילים יותר, ואת הלמידה למשמעותית יותר."
אפשר להבין את ההתלהבות מהאפשרות לעקוב באופן צמוד ומידי באמצעות הכלים החדשים, אך יש כאן התעלמות מהעובדה שאופטימיזציה – ניהול פעילות להשגת יעד תוך כדי ביצוע תיקונים רצופים – המתנהלת רק באמצעות משוב מידי, מכילה מכשלה עקרונית.
דמיינו אדם שמחפש את הרכס הגבוה ביותר בתנאי ראות גרועים באמצעות משוב מידי מגישושיו בשטח. הבעיה הזאת הייתה מוּכּרת לחוקרי הבינה המלאכותית בשנות ה-60 של המאה הקודמת. זאת הבעיה של חיפוש נקודת קיצון, מקסימום או מינימום, בצורה גיאומטרית בהסתמך על שיפוע מקומי.
נניח שאת נמצאת בנקודה על עקום, או על משטח, ושואפת להגיע לגובה מירבי. את נעה מעט, הלוך ושוב, ומקבלת משוב מידי המורה אם את עולה או יורדת. את בוחרת להמשיך בכיוון שמעלה אותך. את יכולה להכליל את האסטרטגיה הזאת למשטחים במספר ממדים כלשהו, והמשוב הוא באמצעות הגרדיאנט, כלומר הכיוון שבו את עולה במידה המירבית. האם תגיעי כך לנקודה הגבוהה ביותר שבמשטח? כל תלמידת תיכון שלמדה לפחות 4 יחידות במתמטיקה מכירה את הבעיה ויודעת שהתשובה שלילית.
ללא מידע נוסף על מבנה המשטח, משוב מידי יוביל אותך רק למקסימום מקומי. גם האבולוציה בטבע – בשרידות המינים – פועלת לפי משובים מידיים, ומתעוררת בעיה דומה. באבולוציה הקושי הזה נפתר באמצעות שימוש במוטציות אקראיות: קפיצות אקראיות במרחב הפעולה, המאפשרות מעבר מרכס לרכס.
אנשי הבינה מלאכותית נתקלו בבעיה הזאת כשרצו לתכנת פותר בעיות כללי ממש באמצעות משוב מידי. ראשי התיבות "GPS" שימשו כשמה של התוכנה שנבנתה בשנות ה-60. כל בעיה הוגדרה כחיפוש אחרי דרך להגיע אל מצב יעד (פתרון רצוי) ממצב תחילי (נתוני הבעיה). לכל בעיה הוגדר מרחב (קבוצת כל המצבים שניתן להגיע אליהם מהמצב התחילי) והוגדרה פונקציית מרחק מהפתרון. התוכנה ביצעה צעד אקראי אחד בכיוון כלשהו במרחב הבעיה. אם הערך של הפונקציה ירד, כלומר התוכנה התקרבה לפתרון, היא זזה למקום הנמוך יותר, וכך הלאה. אם לא התקרבה, אז נשארה במקום, וכך הלאה. כאשר ערך הפונקציה מגיע לאפס, הבעיה נפתרה. יש לנו אלגוריתם נהדר, רק שטמונה בו השגיאה שתיארתי קודם. בניהול כזה של תנועה במרחב נוכל להגיע לנקודה שממנה לא נוכל לזוז, כי הגענו לנקודת מינימום מקומי של המרחק אל פתרון הבעיה. מה שבאמת הפריע למתכנתים של התוכנה הזאת היה שלפעמים, במפתיע, גילתה התוכנה פתרון מוצלח.
השימוש במשוב מידי בחינוך אינו שונה בפוטנציאל שלו מכל שימוש במשוב מידי בתהליכי אופטימיזציה אחרים. זה ניהול עיוור ומקומי שמובטח שיוביל לכל היותר רק להצלחות מקומיות. לפעמים ניהול שכזה יכול לספק לנו הצלחה מפתיעה, אבל רק לפעמים.
תארו לכם תוכנה שיכולה לגלות הוכחות בגיאומטריה. זה קרה והפתיע את בוני התוכנה GPS, וברוב התלהבותם הם אפילו פרסמו מאמר על ההוכחה שגילתה התוכנה. התוכנה עצמה צוינה בין מחברי המאמר. כאמור, אין משהו שמטריף את הדעת יותר מאשר הצלחה נקודתית. לאחר מכן התגלה שכבר בימי יוון הקדומה הכירו המתמטיקאים את ההוכחה. בכל זאת, בוני התוכנה זכו בפרס טיורינג. ואילו התוכנה – היא נעלמה מבימת ההיסטוריה של הבינה המלאכותית, כי המציאות היא השופטת האכזרית ביותר של טכנולוגיות דיגיטליות מבטיחות בעלות פוטנציאל שנתקעות בנקודות קיצון מקומיות.
5 תגובות
אני חושב שחלק גדול מהסטודנטים בכיתה לא ממש יבינו מאממאר כזה
לעידו, תודה על הערתך.
יש לך השערה מעניינת מאד ולכן כדאי שתבדוק אותה. אבל, נניח שאתה צודק, – יש להימנע מפזיזות בהסברת התוצאות. זאת איננה בהכרח אשמתם.
האם תלמידים אלה לא למדו (בסך הכול) מתמטיקה בהיקף של 4 יחידות לפחות, בתיכון או באוניברסיטה, במכינה, או בקורס שפעם קראו לו (כדי להבדיל מהשעורים שניתנים לתלמידי מתמטיקה והנדסת אלקטרוניקה) "קלקולוס"? האם הם לא למדו שבעזרת שיפועים (נגזרות) בלבד לא ניתן לגלות מקסימום (או מינימום)? ומה בדבר קורס באופטימיזציה? ואם הם למדו ולא יודעים ליישם את מה שלמדו, צריך להפנות את האצבע המאשימה אל מוריהם.
ובכל זאת, הטיעון שכיוון השיפוע לא יכול לשמש כמכוון לקראת המקסימום המקסימלי הוא פשוט יותר ממה שהם למדו.
את הצד הפרקטי
היובדות בכל תחום משתנות ובעולם מטורף הקצב בדרך כלל מואץ וצריך כל הזמן לשפר ולעדכן בדרך של ניסוי ותהיה
מסתבר שהשגיאה הזו איננה מובנת ומדביקה אפילו את המחקרים המתקדמים ביותר בבינה מלאכותית בקורס מבוא ל"מכונות לומדות" שנחשב לקורס החיוני לכניסה לעולם הבינה המלאכותית מתואר מודל פרקטי לגילוי תוכנות נבונות על ידי שימוש בגראדיינט (שהוא כיוון השיפוע המירבי במשטח רציף) מבלי להבין את מה שנלמד ב-4 יחידות מתמטיקה בתיכון. אולי המכונות תלמדנה (תהיינה "מכונות לומדות"), אבל מה שבטוח הוא שחוקרים בבינה מלאכותית לא לומדים…