תקשורת בקצב

העתיד עוד מעט כאן. האם בינה מלאכותית תשפר את איכות הדיבור של חולי ALS? פריצות דרך מחקריות מוכיחות שאפשר ליצור תקשורת טובה ומהירה יותר.

מאת: אריאל גורדון, מומחה למחשבים.

הדרך היחידה העומדת כיום לרשות חוליALS  שמבקשים לתקשר עם הסביבה היא באמצעות שימוש במצלמה שעוקבת אחר תזוזת העיניים והופכת ל"עכבר מחשב", בעזרת תוכנות כמו גריד 3, או דפי קישור. אולם, למרות הטכנולוגיה המתקדמת, השימוש באמצעי תקשורת זה עדיין נחשב איטי, קשה ומסורבל.

מחקרים חדשים בתחום המוח והמחשוב, שהתפרסמו ב-2019, מראים שבעתיד אפשר יהיה לשנות את שיטת התקשורת ולתקשר בקצב רגיל לאדם, ישירות ממוחו של החולה.

בתחילת השנה התפרסמו שני מאמרים מרתקים בעיתון Nature שמוכיחים כי ניתן לשחזר דיבור בעזרת השתלת אלקטרודות בתוך המוח. המחקר הראשון מאוניברסיטת קולומביה בינואר 2019, והשני מאוניברסיטת קליפורניה בסן פרנסיסקו באפריל 2019. בשניהם השתתפו חמישה חולי אפילפסיה שבמוחם הושתל מערך אלקטרודות באזורי הדיבור והשמיעה לשם טיפול במחלה. שני המאמרים הראו יכולת ייצור דיבור מלאכותי על סמך מדידה של גלי מוח באזורים אלו בגישה שונה.

מאותות חשמליים לדיבור

ישנם מספר אזורים במוח שיכולים לשמש לקריאת דיבור. האזור הראשון והעיקרי הוא הקורטקס השמיעתי המשמש אותנו בשני אופנים: כשאנחנו מקשיבים וכשאנחנו מדברים. אנחנו מדמיינים, או ליתר דיוק קודם "שומעים" בדמיון את המילים שאנחנו הולכים להגיד, ואז שולחים את הפקודות לשרירי הפה, כדי להפיק את המילים עצמן.  משום כך, ניתן תיאורטית להפיק דיבור באופן ישיר מהקורטקס השמיעתי. שני אזורים נוספים, ששימשו את המחקר השני, הם אזור ייצור הדיבור במוח, ואזור הקורטקס התחושתי שבו המוח חש את תנועות שרירי הפה ומבקר את הדיבור לפיהן.

הבעיה העיקרית היא כיצד לתרגם את האותות החשמליים שאנחנו מודדים במוח לדיבור שניתן להבנה. שני המחקרים השתמשו בגישה שונה כדי לפענח את האותות החשמליים והראו שניתן לתרגם אותם לדיבור. 

רשת לימוד עמוק

כדי ליצור תוכנה הלומדת את האותות החשמליים מהמוח ומתרגמת אותם לקול, השתמשו בשני המחקרים בשיטת התכנות שנקראת רשתות נוירונים עם לימוד עמוק או רשת לימוד עמוק.

רשת לימוד עמוק מאפשרת למחשב לזהות תבניות ולתרגם אותם למשהו אחר. למשל על ידי התבוננות במאות תמונות של פיל לזהות תמונה אחרת של פיל ולקלוט שמדובר ב"פיל". המעניין בשיטת תכנות זו שאנחנו אומרים למחשב מה ללמוד ואיך אבל אין לנו מושג אמיתי מה המחשב באמת למד. אנחנו רק יכולים לבדוק את איכות הלמידה על ידי בחינת התוצאות, ולכן תמיד ניתן לשפר את הרשת בעזרת רעיונות חדשים.

המחקר באוניברסיטת קולומביה

אוניברסיטת קולומביה התרכזה בפיתוח רשת לימוד עמוק להפקת קול לפי מדידה של גלי מוח באזור השמיעה. מטרת המחקר הייתה לבדוק את רמת הזיהוי של קולות המופקים על ידה מגלי מוח שנמדדו באזור השמיעה.

רשת הלימוד העמוק למדה להפיק דיבור על ידי הסתכלות על פעילות מוחית בחמשת הנבדקים בעת שמיעה של סיפור באורך שלושים דקות, שהוקרא על ידי ארבעה דוברים שונים. הסיפור לא כלל מספרים או ספרות.

לאחר שהמערכת למדה בעזרת הסיפור, שני דוברים אחרים הקריאו לנבדקים  ספרות. המערכת קיבלה את האותות החשמליים מהמוח בזמן האזנת הנבדקים לספרות, ותרגמה אותם  לדיבור מלאכותי.

75% מהאנשים זיהו נכון את הספרה המדוברת. זו הייתה פריצת דרך משמעותית על פני מחקרים קודמים, בהם לא יכלו השומעים לזהות כלל את הדיבור. סביר להניח שניתן לשפר בהרבה את תוצאות המחקר על ידי שיפור הרשת, כך שנגיע לדיבור מלאכותי טוב יותר.  עם זאת המערכת לא הראתה במחקר תרגום קול רק על ידי מחשבה של הנבדק, ולא ברור כרגע מה תהיה איכות ההפקה. כמו כן, לא ברור איך המערכת מפרידה בן קול נשמע לקול במחשבה.

המחקר מאוניברסיטת קליפורניה

במחקר השני הושגה תוצאה מהפכנית עוד יותר על ידי מימוש אחר של רשת הלימוד העמוק. כדי להשיג תוצאה זו המחקר השתמש בהאזנה במקביל לאותות משלושה אזורים במוח: אזור הקורטקס השמיעתי, אזור הקורטקס התחושתי שחש ואחראי על תזוזת שרירי הפה, ומשמש לבקרה של המוח על הדיבור. ואזור הקורטקס שאחראי על הפקת הדיבור על ידי אותם שרירים.

במחקר הזה השתמשו החוקרים בשתי רשתות לימוד עמוק: באחת, ללמוד איך האותות בשלושת האזורים במוח ביחד מתורגמים לתזוזת שרירי הפה. אחרי הלמידה, רשת זו ידעה לתרגם מחשבה בשלושת האזורים לתנועת שרירים בפה. רשת  הלימוד העמוק השנייה למדה איך תזוזת שרירי הפה מיתרגמת לקול ברמקול, וידעה לשחזר תנועות שרירים לדיבור בקולו המקורי של הדובר.  יתרונה של שיטה זו הוא שהשימוש בהקשבה בכל אזורי המוח והשימוש בתרגום הכפול גרם לתיקון שגיאות ולסינון רב וכך הושגה רמת דיוק טובה בשחזור דיבור אמיתי בקצב של מאה וחמישים מילים לדקה. המחקר כלל לימוד של המערכת על ידי הקראה של כ-500 משפטים על ידי כל נבדק. אז התבקשו הנבדקים להקריא מספר משפטים חדשים בקול , ולחזור באופן חרישי על המשפטים והמערכת תרגמה את האותות החשמליים של המוח לקול בשני המקרים. לאחר מכן הושמעו המשפטים לאנשים שאינם חולים. כ-60% מהאנשים ששמעו את המשפטים המופקים בשיטה זו הבינו את המשפטים במדויק, ואחוז גדול אף יותר הבין את מהות המשפט.

האתגרים: להפוך את תוצאות המחקר למכשיר אמיתי לחולי ALS

למרות פריצת הדרך במחקר יש עדיין אתגרים לא פתורים המעכבים בניה של מכשיר כזה כבר מחר בבוקר. המחקר אימן את התוכנה לנתח את האותות במוח של כל חולה בנפרד בעזרת משפטים שנתבקשו להגיד ומעקב אחר האותות משלושת האזורים במוח. לכן  המערכת ידעה  לשחזר משפטים רק ממחשבותיו של אותו אדם שעליו אומנה.

בנוסף, המערכת הצליחה להפיק את הדיבור הטוב ביותר, רק כאשר אזור קורטקס הבקרה על שרירי הדיבור היה מעורב. אצל חולי ALS במצב מתקדם זה עלול להיות בלתי אפשרי שכן אין תזוזת שרירים בפה, ולכן גם אין אותות של גלי מוח שהמערכת יכולה ללמוד מאזור הבקרה על השרירים במוח.

גם לימוד מוקדם של המערכת לפני שהאדם מאבד את קולו הוא בעייתי, בגלל הצורך להחליף את האלקטרודות במוח אחרי תקופה מסוימת. בגלל תזוזת האלקטרודות יש צורך ללמד מחדש את המערכת. החוקרים אמנם חושבים שניתן יהיה ליצור מערכת שאפשר להעביר מאדם לאדם וגם לשכלל את המערכת כך שתוכל לתת ביצועים טובים גם ללא אותות מאזור הבקרה במוח, ועדיין יש להוכיח טענות אלו. 

למרות תוצאות נחותות יותר במערכת שהוצגה על ידי אוניברסיטת קולומביה,  לדעתי, היא תוכל לעבוד טוב יותר בעתיד על חולי ALS.

יתרון המערכת הוא בכך שאין תלות ביכולת הדיבור של הנבדק, אלא בהשמעת סיפור ולכן יתכן שיש לה יותר פוטנציאל להביא לפתרון אמיתי לחולי ALS.

השלכות נוספות של חידושים אלו לחולי ALS

במחקרים מוצג תרגום של אותות במוח ישירות לדיבור.  לא מן הנמנע יהיה לפתח  שיטות דומות שיוכלו לתרגם מחשבות על הזזת זרוע להזזת זרוע מכאנית על ידי המחשב כדי לאפשר לחולים לאחוז ולהניע דברים. אולי אפילו, אם נפליג על כנפי הדמיון, ניתן יהיה לייצר גוף מכאני מלא כמו בסרט המדע הבדיוני "אוואטר" המאפשר לדמות הראשית לזוז בחופשיות.