"ביקום העצום שלנו מסתתר סוד עמוק ומפתיע". אני מדמיין שאני שומע את קולו העמוק והרגוע של דיוויד אטנבורו מקריין במבטא בריטי מושלם סרט על הקוסמוס ב־BBC. "מתחת לפני השטח של כל מה שאנו רואים ומרגישים, מהחלקיקים הזעירים ביותר ועד לגלקסיות הענקיות, מסתתר קוד – קוד מתמטי. במשך אלפי שנים בני אדם ניסו לפצח את הקוד הזה. התרבויות העתיקות ראו בו את יד האלוהים. המדענים המודרניים רואים בו את חוקי הפיזיקה. אבל אולי, רק אולי, שתי הגישות הללו אינן כה שונות זו מזו".
בא' בתשרי נברא אדם, אבי האנושות. שיא היצירה האלוהית. בא' בתשרי אנו חוגגים את הולדתו, הולדתנו, הולדת אדם שנברא בצלם, אדם בעל בחירה חופשית. בכל התנ"ך, אבחן הפילוסוף ליאו שטראוס, אין מונח מקביל לטבע. הטבע הוא הכאוס. הוא החושך. הסינים מתארים את הבריאה כיין ויאנג, הכאוס והסדר, שנבראו יחדיו. ביהדות, החושך הוא המצב הטבעי והכאוטי, והאור הוא התיקון והסדר. התוהו ובוהו והחושך הם החומרה העירומה, והאור האלוהי הוא התוכנה. ואת הפקודה אלוהים לא נותן ב־HTML, הוא נותן בשפה טבעית. העולם נברא במילים עבריות: "ויאמר אלוהים יהי אור, ויהי אור".
בקבלה, האותיות העבריות נחשבות בעלות כוח עצום. "ספר יצירה", אחד הטקסטים הקדומים ביותר של הקבלה, מתאר כיצד העולם נברא באמצעות 22 אותיות הא'־ב' ועשר הספרות. האותיות הן אבני הבניין של המציאות, וכל צירוף שלהן יוצר משמעות חדשה ומשפיע על המציאות הפיזית והרוחנית. כל אות היא צינור של אנרגיה אלוהית. למשל, הגימטריה, שיטת החישוב המיסטית, מייחסת ערכים מספריים לאותיות ומבקשת לחשוף קשרים נסתרים בין מילים ומושגים.
תראו, אף פעם לא הייתי חסיד גדול של גימטריה וכל דילוגי האותיות, אבל השבוע פתאום הבנתי משהו די מדהים, שהביא אותי לכתוב את הטור הזה: 2,000 שנה אחרי "ספר יצירה", בתוך מודלי השפה המתקדמים ביותר של הבינה המלאכותית מסתתר עיקרון דומה. כמו שבגימטריה מילים בעלות ערך מספרי זהה או דומה נחשבות קשורות – כך גם במודל השפה, מילים עם וקטורים דומים נחשבות קרובות במשמעותן. ואני אסביר לכם מדוע אני חושב שגימטריה היא סוג של סבתא רבתא של טכניקות מתקדמות בעיבוד שפה טבעית ובינה מלאכותית.
במודלי שפה מתקדמים, כל מילה מיוצגת על ידי וקטור – רשימה של מספרים (בדרך כלל בין 100 ל־300 מספרים) שמייצגים את המשמעות וההקשר של המילה. תחשבו על זה כמו "טביעת האצבע" המספרית של המילה. כאמור, מילים עם וקטורים דומים נחשבות קרובות במשמעותן. למשל, הווקטורים של "מלך" ו"מלכה" יהיו קרובים זה לזה, כמו גם "כתר" או "ארמון". המרחק בין הווקטורים מייצג קרבה סמנטית. הווקטורים של "מחשב", "לפטופ" ו"טאבלט" יהיו קרובים זה לזה במרחב המספרי. "אכל", "לעס", "בלע" יהיו קרובים, אבל רחוקים יותר מ"הלך" או "רץ". "שמח", "מאושר", "עליז" יהיו קרובים, אבל רחוקים מ"עצוב" או "מדוכא".
וזה לא שמודל השפה של הבינה המלאכותית מקבל פה הנחיות מפורשות ממתכנת – אף אחד לא מזין את המודל בערכים מספריים לכל המילים השונות בכל השפות השונות. אף אחד לא מלמד את המודל: "אלו מכשירים דיגיטליים" או "אלה פעלים" או "אלו מצבי רוח". המודל לומד את כל הקטגוריות והיחסים האלה לבד, רק מתוך ההקשרים שהוא מזהה בטקסט.
מוסר נוירולוגי
מודל שפה מתחיל עם וקטורים אקראיים לכל מילה, ואז הוא קורא כמויות עצומות של טקסט (בולע את כל ויקיפדיה, למשל). בכל פעם שהוא מזהה מילה בהקשר מסוים, הוא מעדכן מעט את הווקטור שלה, כלומר את הערך המספרי של המילה. לאורך זמן, מילים שמופיעות בהקשרים דומים מקבלות וקטורים דומים, כלומר ערכים מספריים דומים. ומה שמדהים זה שהמודל יכול להכליל מהדוגמאות שראה ליחסים שמעולם לא ראה במפורש. כלומר, המודל עושה גזירה שווה והיקש.
לדוגמה, אם הוא למד על היחס בין "מלך" ל"מלכה" ובין "שחקן" ל"שחקנית", הוא יכול להסיק יחס דומה בין "סופר" ל"סופרת", גם אם מעולם לא פגש דוגמה כזו. יובל נח הררי (שאני חושב שהוא שרלטן) טוען שהכל זה בשר. הכל זה חומר. הכל זה מדע. כל המוסרי שבאדם אינו יותר מכמה נוירונים שהתחברו בפוקס, כמו חלקי מתכת שנופלים מהשמיים והופכים למטוס. המוסר, לפי גישתו, אינו אלא תוצר אקראי של אבולוציה נוירולוגית.
התורה, כיסוד במחשבה המערבית, הבינה כי החומר כשלעצמו הוא חסר ערך. הוא יכול להיות קיים, אך הוא חסר תכלית ומשמעות עד שהדיבור יפיח בו חיים. השפה היא הבסיס לכל תרבות, לכל חקיקה, לכל חינוך ולכל מוסר. כל חברה מבוססת על המילים שהיא אומרת, על הסיפורים שהיא מספרת ועל הערכים שהיא מאמצת.
הקטע הפותח של התורה, שבו נכתב "בראשית ברא אלוהים את השמיים ואת הארץ", אינו רק טקסט ספרותי או תיאולוגי, אלא ההצהרה הבסיסית על מבנה המציאות כולו: קודם ישנה המחשבה, הדיבור האלוהי, ורק לאחר מכן ישנו החומר. הדיבור האלוהי מעניק לחומר משמעות, מוסר ותכלית. ההבנה הזו היא מהותית לכל מחשבה אנושית על סדר חברתי, על צדק ועל מוסר.
האם ייתכן שסיפור הבריאה והמדענים המודרניים מתארים בשפות שונות את אותה האמת היסודית על טבע היקום? האם המילה היא אכן הקוד שבאמצעותו נכתבת ומשוכתבת המציאות? השפה והמילים הן גם אפשרות לתיקון. ואנחנו זקוקים להרבה תיקון ולהרבה שפה טובה.
נקווה לשנה טובה, לדיבור טוב, לתיקון גדול בינינו.