בינה מלאכותית בעברית להורדה בחינם – אל תפספסו
הרובוטים מדברים עברית – והם בחינם. לא, זו לא בדיחה
טוב, אז מה הקטע עם בינה מלאכותית בעברית?
מכירים את זה שאתם מנסים לדבר עם צ'אט-בוט בעברית והוא עונה לכם ב"מויצ'ה חומוס"? או שמישהו מספר לכם בגאווה שהבינה המלאכותית של החברה שלו יודעת עברית, אבל כשאתם שואלים אותה "איפה השירותים?" היא עונה "כן, בהחלט!"? אז קבלו בשורה מרעישה: העולם משתנה, והבינה המלאכותית סוף סוף מתחילה לדבר בשפה שלנו — עברית — ולא פחות חשוב מזה: בחינם.
כן, כן. העולם הטכנולוגי שסביבנו נע במהירות שיכולה לגרום לסבתא שלכם לחשוב שהממיר של הטלוויזיה זה כבר סאברט. והנה, לתוך המרק הדיגיטלי הזה נוחתת המהפכה הכי חמה (בלי לשרוף טראפיק) — בינה מלאכותית שמתמחה בעברית, זמינה לכל גולש עם קצת סקרנות וכמה קליקים.
אז איך זה עובד בעצם? 🤖
בשנים האחרונות צצו להם שלל מודלים של בינה מלאכותית שיודעים לכתוב, לדבר, לתרגם, ולהתווכח (כן, גם עם החותנת). כל אלה דרשו — לפחות בעבר — משאבים מטורפים, שרתים שעליהם אפשר להטיס חללית, ו… המון אנגלית.
אבל משהו השתנה:
- מאגרי דאטה בעברית – חוקרים ואנשים טובים החלו לבנות מאגרי תוכן, קטעי שיחה, מאמרים ופוסטים מפייסבוק רק בעברית.
- קהילה פתוחה ודינמית – מפתחים ישראלים התחילו לתרום מודלים פתוחים (Open Source) שהתאמנו על התוכן הזה.
- פלטפורמות כמו Hugging Face – מאפשרות לכל אחד, כולל הדוד מהמסעדה שאוהב חידונים, להוריד מודל חינמי ולהתקין אותו על המחשב. באחריות קלה יותר מהתקנת מדפסת.
5 מודלים בעברית שיגנבו את ההצגה
1. AlephBERT – המלך הבלתי מעורער
הדור הבא של עיבוד שפה טבעית לעברית. זו גרסה מותאמת של מודל BERT המפורסם של גוגל, שעברה חינוך עברי יסודי ומעמיק. היא יודעת לענות על שאלות, להבין הקשרים, ולפעמים גם לזהות שירים של שלמה ארצי. בערך.
2. HeBERT – כי גם ענן צריך להרגיש בבית
גרסה עברית נוספת, שפותחה בקפדנות (ובפיצוחים) באוניברסיטת חיפה. יודעת להתמודד עם טקסטים משפטיים, טוויטים צבעוניים, וקללות של נהגים. רק אל תשאלו אותה על פוליטיקה, היא בדיסוננס קוגניטיבי.
3. GPT-Neo-X בשירות העברית
הגרסה היותר "יצירתית" של GPT הפתוח. אמנם היא לא נוצצה כמו GPT-4, אבל כשהיא משולבת עם דטא עברי, היא מוציאה פנינים של ממש. אפשר לבקש ממנה לכתוב שיר ליום העצמאות או להציע שמות כלבים מהתנ"ך.
4. LLama עברית? כן, בהחלט
המודל של Meta הגיע עם שאיפות גדולות — והוא בהחלט מספק. גרסאות מקומיות כמו "Aleph-LLaMa" מאפשרות הפעלה מקומית, אפילו על לפטופ סטנדרטי. מופלא? כן. עובד? גם. שותה סוללה? כמו פיל.
5. ChatGPT הישראלי ● הגרסאות המקומיות
מיזמים כמו AI21 ו־NLPHUB הוציאו גרסאות גנריות ושירותים שדוברים עברית בגאווה, בלי לתרגם כל שאלה פעמיים ולחשוב פעמיים אם "חביתוש" זה באמת מילה.
רגע… זה באמת בחינם?!
לא באנו לסבן. כל הכלים שהוזכרו למעלה זמינים לשימוש חינמי במידה מסוימת (יש כאלו שדורשים רישום, או שיש להם מגבלות שימוש), וניתן אפילו להפעיל אותם לוקאלית על המחשב האישי שלכם — בלי שרתים באמזון, בלי הענן, ובלי לשלם על כל שאילתה כאילו היא אספרסו כפול בת"א.
- אין צורך בחיבור קבוע לאינטרנט – אפשר להוריד ולהשתמש גם בצורה לא מקוונת.
- מתאים לפרויקטים פרטיים, לימודיים, ולעסקים קטנים.
- תמיכה בשפה העברית הולכת וגדלה – מה שהתחיל קצר יחסית, כיום משוכלל למדי.
שאלות שאנשים שואלים (ונורא פוחדים לשאול בקול רם):
– זה לא מסוכן להפעיל מודל כזה בבית?
לא אם אתה לא מנסה ללמד אותו להכין קפה או לזייף פסקי דין.
– יש גרסאות שתומכות גם בערבית / רוסית?
חלק מהמודלים תומכים ביותר משפה אחת, אבל לפעמים הם מדברים כמו חבר מהטיול אחרי צבא – "הלו חבר, אתה רוצה שווארמה ברוסית?"
– כמה עולה לשלב את זה באתר שלי?
חינם. אם אתה יודע להתחבר ל־API או להפעיל מודל במחשב, אתה מסודר.
– למה כל שאלה חמישית המודל עונה בעברית מעורבת עם אנגלית?
זה חלק מהקסם. המודלים עדיין לומדים, ואולי הם פשוט אוהבים את הביטוי "Whatever".
– איך אפשר לתרום? או לשפר את הבינה?
קהילות כמו Hugging Face, AI21Labs ופורומים ישראליים פתוחים להצעות, מאמרים, תרגומים וקובצי אימון. ובקיצור: מי שרוצה לקחת חלק – בשמיים אין גבולות.
אבל למה זה כזה חשוב בכלל?
מעבר לדיבוב רובוטים בעברית, יש פה עניין עקרוני: אם לא נשקיע בעברית ב-AI – היא תישאר מאחור. אתם רוצים שצ'אט-בוט של הדואר יענה לכם באנגלית שבורה ב-2040? לא. אתם רוצים שהמערכת תבין את ההבדל בין "ברד" ל"ברד"? כן. אז הנה ההזדמנות שלנו לדחוף קדימה – בחינם, בזמננו הפנוי, ולמען הקונצנזוס הלשוני הלאומי.
ומה הלאה? לאן כל זה הולך?
- עוזרות קוליות בעברית גיבורת-על – סוף סוף נוכל להגיד "שוגר, הדלקי דוד" בלי שתקבל קריזה.
- מודלים מותאמים לתחומים מקצועיים – רפואה, חוק, הוראה ציבורית. כן, בצניעות.
- הנגשת AI לחינוך – בתי ספר יוכלו ללמד באמצעות צ'אט-בוטים שיכולים להחזיר תשובה באותה עברית שהמורה למילולית פעם זלזלה בה.
אז מה למדנו היום, ילדים? (וסבתא ובן דוד מהצבא)
בינה מלאכותית בעברית זה לא רק פיצ'ר מגניב — זו התחלה של מהפכה עם ניחוח של חומוס וריח של קפה שחור. הכלים כבר כאן, הידע זורם, הקהילה עובדת, והחלק הכי מדהים? אתם יכולים להיות חלק מזה — בלי לשלם, בלי לחתום על חוזים, ובלי להבין גרמנית טכנית.
אז פעם הבאה שאתם נתקלים בבינה מלאכותית ששואלת אתכם "Can I help?" אל תתגברו על הציניות. פשוט תגידו לה: "דברו אליי עברית, יא AIים!"