המדריך המלא ל-סוכנת תשתית אוטונומית
מי שומר על השרת שלך ב-3 בבוקר? סוכנת AI שלא ישנה
קיילי היא סוכנת בינה מלאכותית אוטונומית שאחראית על התחזוקה של כל רשת הסוכנים שלי — 24 שעות ביממה, 7 ימים בשבוע, בלי הפסקה. מתחת למכסה המנוע היא מבוססת על OpenClaw — טכנולוגיה שכבשה את הרשת לאחרונה: מדובר בסוכן AI שיכול לבצע כמעט כל פעולה שתבקשו ממנו בסביבת שרת (להפעיל שירותים, לבדוק לוגים, לתקן הגדרות, אפילו לערוך קוד) בצורה אוטונומית. OpenClaw רץ עם שכבת בינה של Gemini Flash (גרסה חינמית של Google), ויש לו גישה מלאה לכלים הקריטיים של השרת: containers (דרך Docker), שירותי מערכת (systemd) ומערכת הקבצים. אבל היתרון שלו הוא גם החולשה שלו — הוא שולח הרבה בקשות למודלי ה-AI במקביל, מה שהופך שימוש לא מבוקר בו לפוטנציאלית יקר מאוד. לכן חשוב להגדיר לו מראש גבולות: רשימת פעולות מותרות (whitelist), אזורים אסורים ומגבלות תקציב. אצלי קיילי מדברת בטלגרם (הבוט @kylie_elad_bot), שומרת על 10 שירותים בו-זמנית, ומעירה אותי רק כשהיא באמת לא יודעת מה לעשות. אצלכם היא יכולה להיות תחליף ל-on-call, לסדר לוגים אוטומטית, או לשמש סוכנת תחזוקה כללית לכל סביבת שרתים שתפקידה לשמור על יציבות.
מה המדריך מכסה
מה זה Kaylee? הכירו את סוכנת ה-DevOps שלכם
OpenClaw שרץ ב-Docker, חושב עם Gemini, ומדבר בטלגרם
קיילי היא סוכנת בינה מלאכותית אוטונומית שיש לה 'ידיים אמיתיות' על השרת: היא יכולה להריץ פקודות, לבדוק סטטוס של שירותים, לערוך קבצי הגדרה, להפעיל containers מחדש ולקרוא לוגים — בדיוק כמו אדמין מערכת בשר ודם. הבסיס הטכנולוגי שלה הוא OpenClaw — פלטפורמה חדשה יחסית של סוכני AI שנבנתה מעל Claude Agent SDK, שמאפשרת לחבר מודל שפה כלשהו למעטפת של כלי לינוקס ולתת לו לעבוד באופן עצמאי.
התקנה על VPS קיים
הגישה שלה מתחילה מחבילת docker
התקנת קיילי זו הדבקת קונטיינר אחד על שרת לינוקס (VPS) קיים — כל התהליך נשען על Docker (מערכת שמאפשרת להריץ תוכנה בתוך 'קופסה' מבודדת), כך שלא צריך להתקין תלויות ישירות על המערכת שלכם. אצלי (אלעד) היא רצה על Ubuntu 22, בתוך קונטיינר אחד בגודל של כ-200MB, והזמן שלוקח להעלות אותה משרת חדש ועד ההודעה הראשונה בטלגרם הוא בערך 10 דקות. אצלכם זה יעבוד בדיוק אותו הדבר על כל VPS סטנדרטי של 5-20 אירו בחודש.
הכלים שעומדים לרשותה
מ-docker ps ועד grep ל-logs, הכל בפקודה אחת בעברית
ארגז הכלים של קיילי הוא אוסף של 50+ פעולות מוכנות מראש שהיא יכולה להריץ על השרת — בדיוק אותן פקודות שאדמין מערכת אנושי היה משתמש בהן ביום-יום. הרעיון הוא לא שהיא תמציא פקודות חדשות, אלא שהיא תשלוף מתוך אוסף מוגדר היטב (בשפה המקצועית: allowlist, רשימת פעולות מורשות) ותפעיל את הפקודה הנכונה בזמן הנכון. אצלי (אלעד) כל פעולה שהיא מריצה נרשמת אוטומטית, ואני יכול לחזור אחורה ולראות בדיוק מה היא עשתה ומתי.
ניטור תזמוני — heartbeat + health + cleanup
שלוש רמות של מעקב שרצות ברקע
ניטור תזמוני הוא מערכת של משימות שרצות לקיילי ברקע במרווחי זמן קבועים — בלי שאף אחד יבקש מהן להיכנס לפעולה. בלינוקס זה נעשה דרך cron (מנגנון התזמון הוותיק של המערכת). אצלי (אלעד) יש לה שלוש רמות של משימות כאלה שרצות במקביל, וכל אחת מהן אחראית על סוג אחר של בדיקה. השילוב של השלוש הוא מה שהופך אותה ממישהי ש'עונה כששואלים' לסוכנת שבאמת שומרת על השרת באופן יזום.
ריפוי עצמי (Self-Healing)
Hermes-style — זיהוי, אבחון, תיקון, אימות
ריפוי עצמי הוא היכולת של קיילי לזהות בעיה, לאבחן אותה, לנסות לתקן אותה בעצמה, ולאמת שהתיקון באמת עבד — הכל בלי שאף אחד יצטרך להעיר אותה. הדפוס הזה הוא אותו pattern שמערכת Hermes מיישמת לרוחב כל הרשת: מהזיהוי הראשוני ועד לשליחת אלרט כשהמערכת באמת נכנעת. בשפה המקצועית הסלמה (escalation) היא העברת בעיה לגורם שיודע יותר — ואצלנו זה אומר לעורר אותי (אלעד) רק אחרי שקיילי ניסתה והוכיחה שהיא לא מצליחה לבד.
אבטחה: מה אסור לקיילי
Allowlist, בקרה, ו-audit trail
אבטחה היא הסיבה שסוכנת DevOps אוטונומית עם גישה מלאה ל-Docker היא חרב פיפיות: בדיוק אותה יכולת שמאפשרת לה לתקן הכל בעצמה, מאפשרת גם להרוס הכל בטעות או בכוונה אם מישהו שלא צריך משתלט עליה. אצלי (אלעד) יש לקיילי שכבה שלמה של כללי אסור-מותר מוגדרים מראש ב-allowlist (רשימת פעולות מותרות), וכל הפעולות נרשמות ל-audit trail (יומן תיעוד בלתי ניתן לשינוי). אצלכם הפרק הזה הוא חובה לפני שאתם שמים אותה על שרת production.
טיפים מתקדמים
מה שלמדנו אחרי 4 חודשי שימוש
האזור הזה הוא אוסף הניואנסים שמפרידים בין 'יש לי בוט DevOps' ל'קיילי היא באמת חברה מהצוות'. אלו דברים שלמדתי (אלעד) אחרי ארבעה חודשי שימוש יומיומי על שרת production אמיתי — טריקים שהגדילו פי כמה את האמינות שלה, חסכו כסף על מודלים, ונתנו לי שליטה מדויקת יותר על איך היא פועלת. אצלכם כל אחד מהם יחסוך שבועות של ניסוי וטעייה.

