זהו כמובן מדע בדיוני אולם למדע בדיוני יש נטייה לבשר עובדות. רבים מאמינים כי המצאות רבות שהופיעו בסדרת המדע הבדיוני נתנו השראה לפיתוחים וחידושים כגון טלפונים ניידים והתפתחויות טכנולוגיות בציוד ונשק צבאי. מתי אם כן יגיע התור של טכנולוגיית תרגום סימולטני אוטומטית אשר תייתר את כל שיעורי השפה המפרכים בבית הספר? ככל הנראה זמן זה קרב. על פי הודעות שפורסמו בחודשים האחרונים ממקורות שונים וביניהם גם חברת הענק מייקרוסופט, אנו קרובים לעידן מכשירי תרגום סימולטני הפועלים, גם אם לא באופן מושלם.     

במהלך הקיץ הציג וויל פאוול, ממציא מלונדון, מערכת המתרגמת את שני הצדדים בשיחה בין דוברי אנגלית וספרדית, זאת במידה והם סבלניים ומדברים לאט. כל דובר החזיק באוזניות המחוברות לטלפון נייד והרכיב משקפיים מיוחדים אשר הציגו את הטקסט המתורגם באופן דומה לכתוביות המופיעות בסרט זר.   

בנובמבר הציגה NTT DoCoMo, מפעילת הטלפונים הניידים הגדולה ביפן, שירות המתרגם שיחות טלפון בשפות יפנית, אנגלית, סינית או קוריאנית. הצדדים מדברים ברציפות כאשר מחשב החברה מאזין לשיחה ומתרגם את המילים תוך שניות ספורות. התוצאה נאמרת בהתאם לדוברים בקול של גבר או אישה.  

אך נראה שהתרומה של מייקרוסופט היא המעניינת ביותר. החידוש הוצג בעת נאומו של ריק ראשיד, ראש מחלקת המחקר של החברה, בכנס בטיאנג'ין בחודש אוקטובר. סיכום נאומו תורגם "חי" למנדרינית. התרגום הופיע תחילה ככתוביות על מקרני וידאו עליונים ואז כקול המיוצר על ידי מחשב. המפתיע היה שהגרסא בסינית של הנאום כללה מאפייני טון והטיות של קולו של מר ראשיד.  

שלושת המערכות שציינו אמנם שונות זו מזו אולם שלושתן מתמודדות עם אותן בעיות. האתגר הראשון הוא לזהות ולהמיר דיבור למידע דיגיטלי. בעבר תוכנה לזיהוי דיבור ניתחה את הנאמר לצלילים המרכיבים, צלילים אלו מכונים פונמה. בשפה המנדרינית ישנן כ- 25, באנגלית 40 ובשפות אפריקניות מסויימות ישנם מעל 100. בשלב הבא נעשה שימוש במודלי דיבור סטטיסטיים וטכניקת הסתברות המכונה "Gaussian mixture modelling" כדי לזהות כל פנומה בטרם מרכיבים מחדש את המילה המקורית. התוצאות הינן סבירות לאוצר מילים מצומצם אולם כל ניסיון לחרוג מעבר לאוצר המילים מוביל לשגיאה באחת מכל ארבע מילים.

 

 

המתרגם שהציג מר ראשיד משתמש במספר שיפורים.ראשית, הזיהוי אינו של פנומה יחידה אלא שלוש עוקבות. באנגלית ישנן מעל 9,000 צירופים כאלו, אולם קל בהרבה לזהות המילים המורכבות מהן מאשר זיהוי לפי פנומה יחידה. פעולת הזיהוי במוצר של מייקרוסופט נשענת על טכניקה מתמטית הנשענת על פעילות המוח האנושי. רשתות מלאכותיות מעין זו הינן חלקים של תוכנה המורכבים מנוירונים וירטואלים. אחת העובדות שאנו יודעים בוודאות בנוגע למוח האמיתי הוא שהנוירונים מאורגנים בשכבות ורשת עצבית עמוקה מעתיקה סידור זה. לדוגמא לרשת של מייקרוסופט ישנם 9 רבדים כאשר הרובד התחתון לומד מאפיינים של גלי קול הדיבור המעובדים, הרובד הבא לומד שילובים של מאפיינים אלה וכך זה ממשיך כאשר בכל רובד עולות קורלציות יותר מתוחכמות. הרובד העליון מנחש מהו הצירוף שהוא חושב שנשמע. באמצעות שימוש בספריות דיבור מוקלטות בהן כל צירוף מתוייג, התוצאה הנכונה מוזנת חזרה לרשת כדי לשפר את ביצועיה.

החוקרים במייקרוסופט טוענים כי במערכת זו יש משמעותית פחות שגיאות (כשליש) מהמערכות המסורתיות ובמקרים מסויימים היתה שגיאה רק באחת מתוך שמונה מילים. גם גוגל החלה להשתמש ברשתות עצביות עמוקות לזיהוי דיבור (בשלב זה לא למטרות תרגום) בטלפונים החכמים שלה. גוגל טוענת כי שימוש זה הוביל לירידה של כ- 20% בשגיאות.     

אולם זיהוי של הדיבור הוא רק השלב הראשון בפעולת התרגום. האתגר הבא הוא לתרגם את הדיבור לא רק למילים בשפת היעד אלא משפטים שלמים. כבר בשלב המילים מתעוררות בעיות בשל מילים נרדפות למשל והעובדה כי ישנם רעיונות מסויימים שפשוט אינם ניתנים לתרגום. סיבות אלו והמבנה התחבירי והדקדוק השונה של כל שפה מובילים למשפטים המוזרים המופקים לעיתים על ידי תוכנות תרגום. 

במצב הנוכחי הצורך להיעזר באוזניות, שירותי ענן ואמצעים אחרים המערכת הסימולטנית של מר פאוול הינה עדיין בשלב האב טיפוס, למרות שהצליחה להתמודד עם תרגום שיחה בשתי שפות שונות. המערכת של מר פאוול פתרה את הבעיה על ידי ניתוב כל דובר לשני מנועי תרגום במקביל. תרגום דובר יחיד הינה טכנולוגיה יותר מתקדמת כאשר המתוחכמת ביותר כיום שייכת ל-Jibbigo, אשר הצליחה לדחוס לתוך אפליקציה יחידה זיהוי דיבור ואוצר מילים של 40,000 מילים בעשר שפות. אפליקציה זו פועלת על מכשירי טלפון חכם ללא צורך אפילו בחיבור לאינטרנט.

 

 

עדיין נותרו בעיות שיש לפתור. בעולם האמיתי אנשים מדברים ביחד, משתמשים בסלנג או משוחחים ברחוב הומה, כל אלו עלולים לשבש את פעולת מערכת התרגום טובה ככל שתהיה. ומכאן נראה כי יש להמתין עוד מספר שנים בטרם המתרגמים האוניברסליים מ"מסע בין כוכבים" יעברו ממדע בדיוני לחלק מהמציאות.

 

המאמר תורגם מאנגלית על ידי הצוות של חברת ביירון שירותי תרגום ושפות