האם בינה מלאכותית יכולה לחשוף את טבעה של הבינה האנושית? בשנים האחרונות למידה עמוקה מרבה לעסוק בזיהוי דפוסים, אך ייתכן כי לבינה מלאכותית משמעות חשובה בהרבה מיכולתה לסווג מידע

-

מאנגלית: ד"ר עידן קורנבלום

השאלה: "מי אנחנו?" – כיצד עובד המוח שלנו ומה טיב היחס בינו לבין היקום – היא החידה המרתקת ביותר שאנו יכולים לשאול את עצמנו בתור בני אדם. אני מאמין כי תחום הבינה המלאכותית יכול להעניק לנו תשובות ייחודיות. מחשבים יכולים לשמש לנו כמודלים ובכך לאפשר לנו להבין את השכל האנושי בתור מערכת סיבתית (casual system), מודלים אותם אנחנו יכולים להעמיד למבחן על ידי בניית מערכות המתחילות לזהות בעצמן הגיון בעולם.

עוד רחוקה הקרקעית

אנו נמצאים בעיצומה של מהפכה טכנולוגית הידועה בכינוי "למידה עמוקה". רשתות עצביות מלאכותית הן אמנם לא דבר חדש והן נמצאות איתנו מאז שנות ה־50 המאוחרות של המאה הקודמת, אך באביב של שנת 2012 קרה משהו יוצא דופן. צוות חוקרים מגוגל ומאוניברסיטת סטנפורד בנה רשת עצבית אשר הורצה על 16,000 ליבות עיבוד, ואימנו אותה בעזרת עשרה מיליון פריימים אקראיים מיוטיוב. לרשת לא היה שום ידע מקדים בנוגע לדברים עליהם היא הסתכלה, והיא גם לא קיבלה שום משוב לגבי הביצועים שלה. היא רק חיפשה אחר מבנה, כל סוג של סדירות (regularity). עשרה מיליון תמונות – ככל הנראה מדובר בכמות מידע גדולה פי עשר מזו אליה נחשף פעוט בחצי שנה הראשונה לחייו. לאחר שלושה ימי אימון, יכלו החוקרים להראות למערכת תמונה שרירותית ממאגר הנתונים ImageNet (המכיל 22,000 סוגי אובייקטים שונים). ב־15.8 אחוזים מהמקרים, הרשת ניחשה נכון את התמונה, למרות שבמשך האימון שלה לא היה שום פיקוח אנושי. הביצועים של המערכת היו טובים יותר ב־70 אחוזים לעומת כל מה שהיה קיים עד אז, היא הייתה טובה יותר מכל תוכנת זיהוי תמונה. כמו כן זכתה המערכת בתהילת אינטרנט מיידית בשל כך שהצליחה לזהות תמונות של חתולים ברמת דיוק של 75 אחוזים (תוצאה לא מפתיעה, כמובן, בהתחשב בכך שהיא אומנה באמצעות יוטיוב).

למידה עמוקה עושה שימוש בהיררכיות של מזהי מאפייני למידה (learning feature detectors), לעתים בעלות מאות שכבות. המערכות שאנו בונים משתפרות בקצב מהיר: בשנת 2015 מחשבים עקפו את בני האדם ביכולתם לזהות תמונות מהמאגר של ImageNet, ובנוסף לכך הם הביסו את בני האדם בפקמן. בשנת 2016, שילוב בין שיטת מונטה קרלו לבין למידה עמוקה הביס את בני האדם במשחק גו, משחק שאז נחשב כנמצא מחוץ לתחום ההישג של המחשבים בעתיד הקרוב.

ועדיין, למרות הצלחות אלו, ישנו מרחק ניכר בין מערכות מחשב לומדות לבין השכל האנושי. ייתכן כי שמעתם על מבחן טיורינג, אשר משימתו היא בניית מערכת אשר גורמת לבני אדם לחשוב שהיא אינטליגנטית (גם אם לא כך הדבר), אך האם אתם יודעים כיצד נזהה מערכת בתור אינטליגנטית באמת? מערכת מלאכותית כזו תבצע מבחן טיורינג – עלינו.

להיות בעל בינה משמעותו להבין כיצד זה מרגיש להיות בעל בינה, ולחפש בינה באחרים. אנו מחפשים אחר הבנה באחרים, ובכלל זה אנו מחפשים לראות האם הם מודעים לעצמם, ואחר האופן בו הם מחפשים את המודעות הזו בנו.

כמה זמן יחלוף עד שנצליח לבנות בינות מלאכותיות? מרווין מינסקי, אשר ייסד את תחום הבינה המלאכותית יחד עם ג'ון מקארתי בשנת 1953, נתן את אחד האומדנים הטובים ביותר שאני מכיר:

האמנתי בריאליזם, כפי שסוכם בהערה של ג'ון מקארתי, לפיה אם נעבוד ממש קשה, תהיינה לנו מערכות אינטליגנטיות תוך 4 עד 400 שנים.

מחול, כדורגל ורעשי רקע

כבר מראשיתו נחצה תחום הבינה המלאכותית לשתי גישות נפרדות: בינה מלאכותית קוגניטיבית, אשר ראתה מודלים ממוחשבים כדרך להבין ולבנות בינה (mind), ובינה מלאכותית צרה, אשר הייתה דיסציפלינה הנדסית שמטרתה לפתח עיבוד מידע חכם יותר. המערכות המלאכותיות לזיהוי דפוסים אשר יצרנו רחוקות מאוד מלהיות בינתיות.

דמיינו שאתם מתבוננים בקבוצת רקדנים במהלך הופעת מחול ואתם רוצים לזהות מי מהם היא אליסה. המערכות שלנו עושות זאת על ידי סינון הרעש – כל המסיח אותנו מזהותה של אליסה: הפוזה, התאורה, הבגד, הבעת הפנים (הספציפית). כל אלו יכולים להשתנות, בעוד שאליסה נשארת, במובן מסוים, אותו הדבר. אך עלינו לחקור מעבר לתהליך הסינון: הרי שבמובן מסוים אין באמת רעש בעולם, שכן כל דבר הוא מאפיין והוא קשור באופן ישיר או עקיף לכל דבר אחר. כל דבר מקבל משמעות בהקשר מסוים (אנחנו מגדירים דבר בתור רעש כאשר הוא לא משרת את האינטרסים שלנו ברגע מסוים). עלינו לנתח את השאלה ברמה שהיא מעבר לזיהוי קטגוריות אינדיבידואליות. עלינו למדל עולם שלם ודינמי.

מצליחים לזהות את אליסה? מקור: Unsplash.

המוחות שלנו עושים זאת על ידי יצירת היררכיות אשר מתחילות עם פרצפציות (percepts) ברמה נמוכה: דפוסים ויזואליים או אקוסטיים פשוטים. אנו מארגנים אותם לסקריפטים דינמיים חישתיים ומוטוריים, לסימולציות מנטליות. בעיני רוחנו, אנו רואים אובייקטים זזים, מאזינים לצלילים וקולות, אנו מתבוננים באינטראקציות בין בני אדם, מדמיינים עולמות אפשריים. אנו ממפים את הסימולציות האלו לקונספטים, בהם אנו יכולים לטפל בעזרת לוגיקה וחשיבה אנליטית, קונספטים אותם אנו ממפים לשפה טבעית, על מנת שנוכל לסנכרן את הרעיונות שלנו עם רעיונותיהם של אחרים.

מוחות אינם מסווגים בטבעם, הם מבצעים סימולציות וחווים חוויות. הסימולציות והחוויות אינן חלק מהמידע המגיע דרך החושים: מידע זה הוא בסך הכל דפוסים חשמליים וכימיים אשר מטיילים על גבי תאי עצב אל עבר מוחנו. העולם שאנו חווים הוא, פשוטו כמשמעו, יצירה של מוחנו. חלום המעוגן בדפוסי האותות הכאוטיים אשר נוצרים על ידי עצבי החישה שלנו. החלום הוא מבנה המידע אשר מנבא בצורה הטובה ביותר מה הולכים להיות האימפולסים הבאים להגיע.

מדפוסים לקונספטים. באדיבות יושה באך.

בתחילת הקריירה האקדמית שלי עבדתי עם קבוצה שלימדה רובוטים כיצד לשחק כדורגל. רובוטים אלו צפו בדפוסי המידע אשר הגיעו למוחות הממוחשבים שלהם מחיישני מצלמה, גלאי תנועה ומדי תאוצה – ניתן להקביל את כל אלו לעצבי חישה. ממידע זה, יצרו הרובוטים מודל של מגרש המשחק, הרובוטים האחרים והכדור. הם השתמשו במודל על מנת לתכנן, לתאם ולהוציא אל הפועל את הפעולות שלהם, אשר היו מונעות על ידי תכניות התנהגות שגרמו להם להוביל את הכדור אל תוך השער – להבקיע גול.

בזמן נסיעות נהגנו להשאיר את הרובוטים בבית, עקב משקלם הכבד ומידותיהם המגושמות. במקום זאת, אפשרנו לרובוטים לשחק בתוך סימולציה של העולם שלהם, עם גופות מדומים, אינטראקציה פיזיקלית מדומה ויצירת תמונה מדומה. עבור הרובוטים לא הייתה שום דרך לשים לב לכל הבדל בין ה־'מדומה' לבין האמיתי, מכיוון שהמידע שהגיע אל המוח הממוחשב של הרובוט היה בעל אותו המבנה בדיוק, ללא קשר למקור היווצרותו. הרובוטים שלנו פעלו בתוך אותו 'עולם חלום' כפי שהיו פועלים במציאות הפיזיקלית המוכרת.

העיקרון לפיו מוחות יוצרים עולם סימולציה, חלום, מתוך מידע חושי, ויהא זה עולמם הפשוט יחסית של שחקני הכדורגל הרובוטיים או עולמם המורכב עד אין שיעור של בני האדם – הוא תולדה של מה שמכונה 'אינדוקציית סולומונוף'.

היכן נמצא המגרש באמת? מקור: Unsplash.

עבר, עתיד, עונג, כאב

בשנות השישים של המאה הקודמת, ריי סולומונוף גילה את הגבול של מה שיכול לדעת מוח אשר מעבד מידע. הוא שאל את עצמו: מה אם מתעורר רובוט ומבין שהוא רק רובוט, מערכת עיבוד מידע המחוברת לסביבה אשר לא נותנת לו דבר פרט למידע (כלומר אינפורמציה בנוגע להבדלים שניתן לתפוס)? מהו מודל העולם הטוב ביותר שרובוט זה יכול להמציא? אינדוקציית סולומונוף טוענת שהטוב ביותר שיכול הרובוט לעשות הוא למצוא את התוכנה הקצרה ביותר אשר מנבאת באופן המדויק ביותר, על סמך תצפיות העבר, את התצפית הבאה – והיא עושה זאת עבור כל התצפיות. בפרספקטיבה של בינה מלאכותית, כל המוחות הם מערכות לעיבוד מידע כגון זו, אשר יוצרים עולם סימולציה, חלום, ממידע חושי. תפיסתנו את העולם, ובכללה רעיונותינו אודות חומר, אנרגיה, חלל, אנשים ואמנות, הינה חלום דינמי בו עושה מוחנו שימוש על מנת לחזות תצפיות עתידיות על סמך תצפיות עבר.

תפיסתנו את העולם, ובכללה רעיונותינו אודות חומר, אנרגיה, חלל, אנשים ואמנות, הינה חלום דינמי בו עושה מוחנו שימוש על מנת לחזות תצפיות עתידיות על סמך תצפיות עבר

למידה עמוקה העניקה לנו תובנות חשובות לגבי האופן שבו נוירונים מסוגלים לקחת זרמי אותות ולגלות בתוכם מבנה. המוחות שלנו יכולים לעשות דברים עם המבנים האלו, דברים שמחשבים עדיין מתקשים מאוד לעשות: אנו יכולים לארגן אותם לעולם שלם ודינאמי, ולארגן אותם מחדש לעולמות אפשריים. זה מאפשר לנו לדמיין, לזכור, להיות יצירתיים (באופן בו מרבית בעלי החיים האחרים אינם יכולים להיות).

מערכת העצבים שלנו היא מערכת הבקרה של האורגניזם שלנו. מקורן של לולאות היזון חוזר רבות הינו במערכת העצבים. חלקן שוכנות בגזע המוח, מווסתות את טמפרטורת הגוף שלנו, את קצב פעימות הלב ודפוסי הנשימה. לעתים קרובות לולאות היזון חוזר אינן מספיקות, ועלינו לשנות את האינטראקציה עם הסביבה על מנת לשמור את האורגניזם בחיים. כאב הוא מסר האומר לנו לעשות פחות ממה שאנו עושים כרגע, בעוד שעונג מבקש מאיתנו לעשות עוד מהפעולה הנוכחית. עונג וכאב מכתיבים את פעולותינו ומקומותינו. הם נמצאים במוח האמצעי. כמו כן, הם מהווים בנוסף אותות למידה, כך שאנו יכולים לנווט את עצמינו לכיוון של עונג עתידי ולהימנע מכאב עתידי. על מנת לגרום לזה לקרות, הם יוצרים קשרים בין הצרכים שלנו לבין מקומות בעולם.

העבודה שאני עושה נוגעת בעיקר בהבנת מבנה הצרכים שלנו, אותם הצרכים אשר מקנים רלוונטיות מוטיבציונלית לדברים שאנו תופסים, חווים, מחליטים ומצפים להם.

מודל מופשט של מנוע המוטיבציה. באדיבות יושה באך.

כאשר אנו חשים בצורך, אנו יכולים לזמן סיטואציות על מנת להפחית אותו. כאשר אנו חושבים על מקום מסוים, יכולה להתעורר בנו תחושה לגבי האופן בו המקום יכול להיטיב עימנו או לפגוע בנו. אסוציאציות מעין אלו (בין צרכים למקומות) יכולות להיות מאוחסנות בהיפוקמפוס.

יונקים הם בעלי ניאוקורטקס (קליפת המוח), מבנה מוחי שייתכן והדרך הטובה ביותר להבין אותו היא בתור שלוחה של ההיפוקמפוס. הניאוקורטקס שלנו הוא החלק הגדול ביותר במוחנו. זהו המקום בו יוצר האורגניזם את החלום אותו הוא תופס בתור העולם, ובכלל זה הסיפור אותו הוא תופס כעצמו.

עמודות עמודות

הניאוקורטקס שלנו יכול לעשות דברים שעדיין איננו מבינים מספיק טוב על מנת לשחזר אותם באמצעות למידת מכונה. לדוגמה, המחשבות, המושגים והסימולציות המנטליות שלנו הם קומפוזיציוניים. כמו קוביות לגו, אנו יכולים לשלב אותם יחד בדרכים אפשריות רבות, או שמא הם לומדים כיצד לארגן את עצמם על מנת לעשות כן. אותם הרכיבים העצביים יכולים להתחבר בדרכים שונות, "להמחיז" במוחנו הליכה בפארק, קטע מוזיקלי, סצנה מסרט או רומן של דוסטויבסקי. חוקרים רבים סבורים שהמוח משיג את היכולת הזו באמצעות ארגון תאי העצב שלו בעמודות קורטיקליות. כל עמודה כזו היא מעגל חשמלי קטן (יחסית), גובהה כ־2 מ"מ והיא מכילה בין 100 ל־400 נוירונים. אני סבור כי כל אחת מהן לומדת לבצע (בקירוב) את התפקיד המתמטי הקטן שלה, והיא נשלטת על ידי מכונת מצבים אשר שולטת באופן בו העמודות מתחברות אחת לשניה ובאופן בו הן מדברות אחת עם השניה.

העמודות מסודרות לפי אזורים קורטיקליים. כל אחד מהאזורים מתמחה בסוגים מסוימים של מאפיינים, וכאשר העמודות מחוברות אחת לשניה הן יוצרות עולם זז ודינמי. באזור קורטיקלי טיפוסי ישנן כמה מיליון עמודות קורטיקליות. ניתן לחשוב על אזור קורטיקלי ככלי נגינה בתזמורת אשר מנגנת את "מוזיקת מוחנו", בעודו מוצא הגיון בחלק מן העולם ומתאם חלק מן ההתנהגות שלנו.

חלק מ־"כלי הנגינה" מקושר לקלט החושי שלנו (למשל זה המגיע מרשתית העין או מחוט השדרה). לכלי נגינה אחרים יש גישה לשליטה המוטורית שלנו. רובם פשוט מאזינים לשכניהם אשר מעבירים הלאה את המוזיקה שלהם, וכך נוצרים זרמי עיבוד.

לא קיימת דרך עבורנו לחוות את המוזיקה הקורטיקלית בשלמותה, אך ישנו אזור מוחי בתזמורת הזו אשר מתפקד כמנצח

לא קיימת דרך עבורנו לחוות את המוזיקה הקורטיקלית בשלמותה, אך ישנו אזור מוחי בתזמורת הזו אשר מתפקד כמנצח. הסברה היא שאזור זה נמצא בקליפת המוח הקדם־מצחית הגבית־צדית והוא מקושר למרבית האזורים האחרים במוח, כך שהוא יכול לשים לב למה שהם עושים. למנצח אין "מוח" משל עצמו. הוא בסך הכל אזור מוחי בעל מומחיות מסוימת, כמו האזורים האחרים, וביכולתו לתת תשומת לב שטחית רק למה שחלק מאזורי המוח האחרים עושים בזמן נתון. תפקידו דומה למה שמנצח עושה בתזמורת אמיתית: הוא מנסה לשלוט ולווסת את הכלים האחרים כאשר הם מזייפים או כאשר קיים קונפליקט ביניהם, והוא זה שקובע כיצד תשמע היצירה הסופית בקונצרט בו תשבו הערב. למנצח יש תפקיד ניהולי והוא מספק משוב על ביצועיו של המוח. ללא המנצח, מוחנו עדיין יוכל לבצע את מרבית הפונקציות להן הוא מסוגל, אך נהייה כסהרורים המהלכים מתוך שינה. אדם המהלך מתוך שינה יכול לפתוח דלתות, לעזוב את ביתו, לענות על שאלות או אפילו לבשל ארוחה, אך "אין אף אחד בבית": פעולותיו של הסהרורי נעדרות קוהרנטיות ואינן מוכוונות מטרה.

מי מנצח על המנצח? מקור: Unsplash.

כל תהליך אשר מתרחש במערכת העצבים שלנו נועד לווסת חלק מן האורגניזם וסביבתו. המנצח מווסת את תפקוד הניאוקורטקס עצמו. בכל רגע נתון הוא ימקד את הקשב שלו לכלי קורטיקלי אחד (או לכלים מעטים), בעוד האחרים יכולים להמשיך ולנגן ברקע, שלא תחת השגחתו. על מנת ללמוד ולהרהר, המנצח יתחזק פרוטוקול של הדבר בו הוא טיפל. פרוטוקול זה הוא סדרה של קישורים לחוויות אשר נוצרו על ידי כלים קורטיקליים אחרים. זהו המקום היחיד בו מתבצעת אינטגרציה של חוויית המציאות שלנו, היכן שניתן לחוות חלקים נפרדים של המודלים המנטליים שלנו – יחד.

הרשומות הטריות ביותר בפרוטוקול של המנצח מהוות את חוויית העכשיו שלנו. ייתכן ותודעה היא למעשה הזיכרון הטרי ביותר של מה שקליפת המוח הקדם־מצחית שלנו טיפלה בו. חוויה מודעת אינה חוויה של להיות בעולם, או באיזשהו מרחב פנימי. זוהי רקונסטרוקציה של חלום, המעוגנת במוזיקה אשר מנוגנת על ידי יותר מחמישים אזורים, המורכבים מ־86 מיליארד נוירונים. רקונסטרוקציה זו משתקפת בפרוטוקול של אזור יחיד. אני מכנה זאת "תיאוריית המנצח של התודעה" (conductor theory of consciousness). אחד האספקטים המעניינים של התודעה שוכן ביכולת של המנצח למקד את הקשב שלו אל הפרוטוקול שלו עצמו, ובכך לחוות את החוויה של להיות מודע. באופן זה, לא רק שהמוח שלנו מספר לעצמו סיפור אודות עצמו, אלא שהוא גם מאזין לסיפור הזה.

חוויה מודעת אינה חוויה של להיות בעולם, או באיזשהו מרחב פנימי. זוהי רקונסטרוקציה של חלום, המעוגנת במוזיקה אשר מנוגנת על ידי יותר מחמישים אזורים, המורכבים מ־86 מיליארד נוירונים

היעד שלי בתור חוקר בינה מלאכותית הוא לבנות מערכות שעושות יותר מאשר לסווג מידע. אני רוצה לבנות מערכות שלומדות לבנות חלום דינמי מהמידע, מערכות שמגלות שהן בינה בפני עצמן, מערכות שמבצעות מבחן טיורינג – עליך. אני מאמין שבניית מערכות כאלו מהווה את הסיכוי הטוב ביותר שלנו לגלות מי אנחנו.

הערת המתרגם

תרגום ופרסום המאמר שזה עתה קראתם נעשה בהסכמת הכותב, ואת המאמר המקורי תוכלו למצוא כאן. כמו כן נמליץ לכם לבקר באתר האינטרנט של יושה באך ובאתר הקרן לבינה המלאכותית, היכן שהוא מכהן כיום כראש חטיבת המחקר.

יושה נוהג להרצות בכנס השנתי של ה־Chaos Computer Club. סדרת ההרצאות שהעביר בכנסים אלו מומלצת בחום לכל מי שמתעניין במוח, תודעה וטבע המציאות ובחרנו להביא כאן קישור לאחת מהן, אודותיה אנו מקווים לכתוב בעתיד:

בנוסף, אולי תהנו לצפות בשיחת ה־TED של יושה הדנה בנושאי מאמר זה:

דימוי שער: "פוקוס סלקטיבי על אישה תכולת־עין", Amanda Dalbjörn. מקור: Unsplash.

שיתוף ב facebook
שיתוף ב print
שיתוף ב whatsapp
שיתוף ב email