ARKGI2: מדד ביצועים (Benchmark) המתמקד ביכולות Reasoning (הסקה) ליבתיות ולא רק בשליפת מידע. הוא קריטי בפרק זה כי הוא מדגים את הקפיצה של Gemini 1.5 Pro למקום הראשון ביכולת לפתור בעיות לוגיות מורכבות ללא הכוונה.
METR: מדד המודד כמה שעות עבודה רצופות סוכן AI מסוגל לבצע באופן אוטונומי לחלוטין כדי לפתור 50% ממשימות תוכנה מורכבות. זה משנה את חוקי המשחק כי זה מודד סיבולת ואוטונומיה ולא רק תשובה נכונה.
Prompt Injection: טכניקת תקיפה שבה מחדירים הוראות זדוניות לקלט של המודל כדי לעקוף את מנגנוני הבקרה שלו. בפרק מוסבר איך ציוץ פשוט בטוויטר עלול לגרום לסוכן AI שסורק אותו למחוק את קבצי המחשב של המשתמש.
Code Factory: פרדיגמת עבודה שבה תהליך הפיתוח הופך לפס ייצור אוטומטי המנוהל על ידי סוכנים. המפתח אינו כותב קוד אלא מפקח על ה-Intent (הכוונה) ועל הבטחת האיכות בנקודות הביקורת.
Self-aware Code: קוד שמכיל בתוכו את המודעות למבנה שלו, לדוקומנטציה שלו ולדרכי התיקון שלו. זה מאפשר לסוכנים כמו OpenClow לתקן את עצמם ללא התערבות ידנית של מתכנת אנושי.
MCP (Model Context Protocol): סטנדרט פתוח המאפשר למודלים להתחבר למקורות נתונים חיצוניים וכלים בצורה אחידה. בפרק מוצג החיבור בין Figma ל-Claude Code כדוגמה לסגירת לופ בין מעצבי UI למפתחי Frontend.
Key Takeaways
התקינו את OpenClow וביצעו אופטימיזציה למפתחות ה-API שלכם
השתמשו בפקודת Git Worktrees לניהול מספר משימות במקביל עם סוכנים