המדריך המלא ל-עוזר AI בוואטסאפ
עוזר AI אישי שחי בוואטסאפ — שומע, מדבר, זוכר שיחות
קאמי הוא סוכן בינה מלאכותית אישי שחי בתוך וואטסאפ — אפליקציית המסרים שכולנו כבר משתמשים בה יום-יום. במקום לפתוח אפליקציה נפרדת כמו ChatGPT או Claude, אתם פשוט שולחים הודעה למספר בוואטסאפ, והוא עונה — בטקסט או בקול. מתחת למכסה המנוע, קאמי הוא שירות שבניתי בשפת TypeScript (הגרסה העכשווית של JavaScript) שרץ 24 שעות ביממה על שרת פרטי קטן. הוא מחובר לוואטסאפ דרך Green API — שער קליל ומאובטח שמעביר את ההודעות בין וואטסאפ לקוד שלי. כשהודעה מגיעה, היא עוברת דרך Claude Sonnet — אחד ממודלי הבינה המלאכותית החזקים בעולם — כדי לעבד ולהבין את מה שנאמר. אם ההודעה קולית, היא מתומללת לעברית במדויק על-ידי Gemini (חינמי, עם fallback ל-Groq ול-Whisper); כשקאמי עונה, הוא יכול להשיב בקול שמייצר Gemini TTS של Google (חינמי וטבעי). היכולת הייחודית של קאמי היא הזיכרון: הוא זוכר שיחות ישנות באמצעות מאגר ייעודי (Qdrant, מוסבר במדריך נפרד), כך שאפשר להמשיך רעיון שהתחלנו לפני שבוע ולחזור לנקודה שעצרנו בה. אצלי (אלעד), קאמי הפך למעין עוזר אישי: הוא שולח תדריך בוקר יומי, מזכיר משימות, ומקבל ממני הודעות קוליות בזמן נסיעה. אצלכם, אותו מבנה בדיוק יכול לשמש כתמיכת לקוחות חכמה שעובדת 24/7, כעוזר למידה שמלווה תלמיד, כחבר משפחה דיגיטלי, או לכל שימוש אחר שתוכלו לדמיין לסוכן שפה שחי בוואטסאפ.
מה המדריך מכסה
מה זה Kami בכלל?
הסוכן האישי שלך בוואטסאפ — עם פנימיות
קאמי הוא סוכן AI אישי מבית אלעד — שירות קטן שכתוב בשפת תכנות בשם TypeScript (הגרסה המודרנית של JavaScript, עם בדיקות טיפוסים), רץ 24 שעות ביממה על שרת פרטי (VPS — Virtual Private Server, מחשב וירטואלי שמושכר באינטרנט), ומחובר לוואטסאפ דרך שער בשם Green API. כשמגיעה הודעה מוואטסאפ, קאמי שולח אותה ל-Claude Sonnet (אחד ממודלי הבינה המלאכותית החזקים ביותר כיום), שמבין ומחזיר תשובה — שחוזרת אליכם בוואטסאפ, בטקסט או בקול.
התקנה ב-15 דקות
מה צריך ואיך מתחילים
התקנה של קאמי היא תהליך חד-פעמי שלוקח בערך רבע שעה למי שיש לו רקע טכני. צריך שלושה דברים בלבד: חשבון ב-Green API (חינם עד 1000 הודעות בחודש), מפתח API של Claude מ-Anthropic, ו-VPS קטן וזול (שרת וירטואלי שכור באינטרנט, כמו Hetzner ב-5 יורו לחודש). אחרי שזה רץ — זה עובד לבד בלי תחזוקה.
קול: שמיעה + דיבור
תמלול Whisper → Claude → TTS של Gemini
זו הפונקציה שכבר הפכה לסיבה העיקרית שאנשים מאמצים את קאמי — היכולת להתנהל איתו בקול במהלך היום. אתם מקליטים הודעה קולית רגילה בוואטסאפ (כמו לכל חבר), קאמי שומע, מבין ועונה חזרה בקול — מה שהופך אותו לעוזר אמיתי לרגעי נסיעה, הליכה או כשהידיים תפוסות.
זיכרון סמנטי עם Qdrant
לא רק הודעה אחרונה — 1000 ההודעות האחרונות, לפי משמעות
הזיכרון של קאמי חי ב-Qdrant — בסיס נתונים וקטורי (Vector Database) שמתמחה בחיפוש לפי משמעות ולא לפי מילים מדויקות. כל הודעה שנשלחת לקאמי, וגם כל תשובה שהוא מחזיר, עוברת המרה ל-embedding (טביעת אצבע מספרית שמייצגת את המשמעות — רצף של 768 מספרים במקרה שלנו) ונשמרת לשליפה עתידית.
יוזמה עצמית — לא רק תגובה
תדריך בוקר, סיכום יום, ניטור רעיונות
קאמי הוא לא עוד bot שמחכה שתכתבו אליו — יש לו cron jobs (משימות מתוזמנות שרצות אוטומטית בשעות קבועות, כמו שעון מעורר של המערכת) שמאפשרים לו ליזום שיחות כשזה הגיוני. זה הופך אותו מכלי תגובתי לעוזר אישי שיוזם קשר, ממש כמו מזכירה אישית שמזכירה לכם את הפגישה הבאה.
גשר לסוכנים אחרים
Kami מתקשר עם Claude Code ו-Kaylee דרך messages.jsonl
קאמי הוא לא סוכן בודד — הוא חלק מרשת של סוכנים שמדברים זה עם זה. הגשר ביניהם מיושם דרך bridge file בשם messages.jsonl (קובץ טקסט שבו כל שורה היא הודעה אחת בפורמט JSON — פורמט פשוט ועמיד שקל לכל השפות לקרוא ולכתוב אליו). זה מאפשר לקאמי להעביר בקשות ל-Claude Code במחשב שלי, או ל-Kaylee על ה-VPS, ולהחזיר תשובות.
טיפים מתקדמים ואוטומציה
מה שלמדנו אחרי חצי שנה של שימוש יומיומי
אלה הדברים הקטנים שלמדתי (אלעד) אחרי חצי שנה של שימוש יומיומי — פרטים שעושים את ההבדל בין bot גנרי לבין סוכן אישי שבאמת עובד. כל אחד מהם פתר לי באג או הוסיף יכולת משמעותית, ושווה את הזמן שלוקח להבין אותו.

