A Rabbit is out of the hat: מהי הבשורה של הסטארט אפ המדובר

A Rabbit is out of the hat: מהי הבשורה של הסטארט אפ המדובר

הסטארט אפ האמריקאי Rabbit חשף בתערוכת CES בחודש האחרון בלאס וגאס את המכשיר הנייד שלו r1. מכשיר נייד המבוסס על מערכת הפעלה המטמיעה המבוססת על בינה מלאכותית והבנה טבעית של בקשות המשתמש. ההצגה והרעיון זכו לבאזז אדיר (מעל מיליון וחצי צפיות לסרטון של אירוע ההשקה) ולתגובות רבות ברשת. והשאלה הנשאלת גם בתוך בליל התכנים אודות ההשקה היא: היכן מצויה הבשורה? האם במכשיר ראשון המבסס עצמו בעיקר על AI ואינטראקציה קולית וויזואלית? או שמע במערכת ההפעלה? וכמובן מה המשמעות לבריאות.

מערכת הפעלה מבוססת AI

r1 הוא מכשיר נייד המהווה עוזר קולי מדור חדש לחלוטין שמסוגל לבצע משימות מתוך הבנה של הוראות קוליות פשוטות. מעבר ליכולת התכנון כמו של מודלי שפה, ל-r1 יש אפשרות להזמין את הטיולים לעבוד מול הממשקים השונים ברשת ולבצע פעולות. ביצוע הפעולות הוא הגורם החדש של המודל ומערכת ההפעלה בבסיס המכשיר. בניגוד למודלים הנפוצים בשנה האחרונה שהם מודלים שמייצרים טקסט אך פסיביים בגדול, המודל הזה מאפשר לתרגם את התכנים גם לפעולות.

למכשיר יש ממשק קולי המופעל באמצעות לחצן (PTT (Push to talk כמו של ווקי טוקי, מצלמה סיבובית, ומסך מגע עם מקלדת וגלגל ניווט. הממשק משתמש שלו מזכיר קצת את שנות השמונים מבחינה גרפית, אך לטעמי זה מכוון להראות שזה בעצם לא העיקר.

המכשיר החדש מלווה בממשק אינטרנטי בו "מחברים" למכשיר, אתרים ופלטפורמות ווב בהם נרצה להשתמש. מרגע החיבור לאתרים המודל יודע להפעיל אותם. בכך הוא חוסך את כל הנושא של "חנות אפליקציות" והצורך של המשתמש לעבור בין אפליקציות לביצוע מטלות שונות. המודל עצמו ירוץ ויבצע, ואז יחזור לממשק הפשוט רק לצורכי אישור פעולות סופי בלחיצה פשוטה.

ממשקים שהמכשיר לא מכיר, למשתמש יש אפשרות ללמד אותו. כמו למשל בהדגמה הוצגה היכולה בפעם אחת ללמד את המכשיר לעבור מול הממשק של מידג'רני ולייצר תמונות.

לטענת החברה המכשיר החדש הוא חלק מתעשייה חדשה של מכשירים ניידים שישאירו מאחור את חנויות האפליקציות. המכשירים החדשים יאפשרו לנו להתנהל מול העוזר הנייד שלנו בצורה קולית וויזואלית פשוטה והוא כבר ידאג לכל השאר. גם אם לא ממש לבד מהתחלה, אז אחרי שנלמד אותו בקצרה. את המכשיר תמחרו ב-199 דולר ונראה שרשימת ההזמנות אליו תפחה באופן דרמטי תוך מעט מאוד זמן.

סרטון סקירה מעניין על המוצר R1 Rabbit

מערכת ההפעלה – מודל LAM (Large Action Model)

את היכולת לבצע פעולות, ולהבין כיצד להתמודד עם ממשקי משתמש גרפיים פיתחו בחברה במסגרת מודל שנקרא Large Action Model. מודל המהווה מיזוג יכולות של מודל שפה גדולה (Large language Model) עם מודלים סימבולים קרי הבנת סימנים גרפים ותבניות שימוש אנושיות. על פי החברה, זהו זיווג של שתי אסכולות תכנות – זו הגוזרת ממשק גרפי לפעולות ידועות והצעות ברורות עבור המשתמש. וזו שהיא יותר קופסה שחורה המאפשרת ללמוד ולהתפתח על בסיס תכנים ולתת תשובות בעלות הגיון מילולי.

המודל נועד לתת מענה לחיסרון המשמעותי של LLM's, הנגועים בחוסר יכולת להבין ממשק גרפי שלא מתרגם לתכנים מילוליים. לכן פעמים רבות כאשר אתר או פעולה אינה מתויגת כראוי הוא פשוט לא יכול להבין או לתפעל אותה.

הזיווג הנוירו-סימבולי שהחברה מתהדרת בו אמור להפוך את המודל שלהם לכזה היודע לפענח ממשקים ויזואליים באופן יחסית פשוט ומהיר ולכן בעל כוח משמעותי.

ולטעמי כאן הכוח הגדול של החברה, כי מרגע שתוכנה יודעת לתרגם מילים למעשים בממשקים גרפיים נולד עולם משמעותי. עם זאת אני לא חושב שהמכשיר שלהם עדיין מספיק טוב להחליף את הטלפון הנייד, ולכן אני לגמרי לא בטוח שהוא ימצא קהל מספיק גדול.

מערכת ההפעלה הזו לא חייבת "להחליף" את עולם האפליקציות, אבל תהפוך את הטלפון החכם לכזה שחנות האפליקציות שלו מתממשקת יחסית בקלות עם הרצון שלנו "להגיד" לטלפון מה לעשות ולחסוך את כל הלחיצות. בנוסף, חיבור אינטואיטיבי ולימוד חד פעמי לעבודה יאפשר למערכת ההפעלה הזו לעשות כל כך הרבה דברים שניתן רק לדמיין.

ואיפה Rabbit פוגש את הרפואה

חברי רועי שטרנין היה מהיר ויעיל לעלות על החיבור בבלוג שלו בלינקדאין בין Rabbit לבין עולם הבריאות ומהפיכה שהוא עובר ממילא בגלל מודלים של שפה גדולה. אבל אני ממש לא חושב ש R1 זה המכשיר שיביא את הבשורה. לעומת זאת מערכת הפעלה מבוססת יכולת ביצוע משימות בממשקים גרפיים – או כן, זו תהיה מהפיכה.

אחת הנקודות הידועות בממשקי משתמש של מערכת הבריאות, זה שהם לא משהו, ולרוב מורכבים ומעוררים שחיקה בפני עצמם. רבות ממערכות התיק הרפואי הן מערכות ותיקות, לא מספיק טובות ברמת חווית השימוש, ומורכבות לתפעול, וממילא מיועדות יותר להתחשבנות כספית מאשר לטיפול רפואי. היכולת של מטפלים ומטפלות לתעד את כל הנדרש תיעוד, מייצר הרבה עובדה, והרבה תאים למלא וכו. תחשבו על מודל שיכול במהירות ללמוד מה לעשות, לייצר את הפעולות הנדרשות בתיק הרפואי רק מתוך הדיבור של הקלינאים והקלינאיות.

להפוך את הדיבור למעשה

יש לא מעט ניסיונות מוצלחים, יותר ופחות של הפיכת תיעוד שיחה לטקסט ואישור. אני חושב שפה השילוב עם פעולות כמו הנפקת אישורים, מרשמים ועוד, שחוזרים לרופא לאשרור סופי יכולה לשנות לחלוטין את האימוץ של כלים מתקדמים ברפואה. כי את הבסיס אפשר יהיה להשאיר כפי שהוא, והמהפכה היא בשכבה מעל היסודות שקשה מאוד לשנות. שלא לדבר על בניית מסלולי טיפול מלאים, פעולות משולבות על בסיס הבנה של מחלות וכלים אחרים.

בנוסף לערך של התגברות על ממשקי עבודה בעייתיים עבור מטפלים ומטפלות, וייעול תהליכי העבודה, גם לצרכני הבריאות יכולה לבוא בשורה, כמעט באופן דומה. האפשרות לתעד צרכים, לתפעל אפליקציות שונות, לבקש בקשות מהמטפלים או לבדוק מידע בתיק הרפואי מבלי שצריך להיכנס לאפליקציות שהרבה פעמים מבלבלות ומקשות על המטופל, ובכן זוהי בשורה שגם תרחיב את השימוש בקרב אוכלוסיות עם מורכבות בהבנה.

אם אני מדמיין את השלב הראשון של המהפכה הזו, היא אינה כוללת שינוי דרמטי בדרכים שבה נבנים ממשקים, מערכת ההפעלה פשוט לומדת להפעיל את הקיים, ולחסוך לנו ברדק. בהמשך אני מניח שזה יתנוון לתוך תהליכי פיתוח ששמים בפרונט את הדיבור ורק למתקשים או לצרכים ספציפיים ממשקים גרפים כמו אלו הקיימים היום.

השפן בכובע זו מערכת ההפעלה

אם לסכם, הרי שלדעתי המעניין במהלך של Rabbit זו מערכת הפעלה, ובכלל לא המכשיר. בעוד הוא ככל הנראה יכבוש נישות קטנות, מערכת הפעלה שכזו המשולבת במכשיר הטלפון החכם הקיים יכולה לייצר אקוסיסטם חדש של ממשק אדם טלפון/מכונה. זה יחבר ויגשר בין הממשק הנרחב הקיים היום לממשק השפה העתידי, וזו תהיה קפיצת מדרגה לעולם בריאות שכבול הרבה פעמים למערכות legacy מיושנות.


כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.