אנתרופיק משיקה את Claude Opus 4.6: הדור הבא של סוכני AI

אנתרופיק (Anthropic) מכריזה על השקתו של Claude Opus 4.6, העדכון המשמעותי למודל השפה הגדול (LLM) החכם והמתקדם ביותר שלה. המודל החדש מציג קפיצת מדרגה ביכולות קידוד סוכני (agentic coding), שימוש במחשב ובכלים, חיפוש וניתוחים פיננסיים, ומבסס את מעמדו כמוביל בתעשייה, לעיתים בפער ניכר.

Opus 4.6 שופר באופן ניכר במשימות קידוד, עם יכולת תכנון מדויקת יותר, ביצוע משימות סוכני לאורך זמן רב יותר ותיקון שגיאות עצמי בסביבות קוד גדולות. לראשונה במודלי Opus, הוא מציע חלון הקשר (context window) של מיליון טוקנים בגרסת בטא, המאפשר לו להתמודד עם כמויות מידע עצומות מבלי לאבד הקשר. יכולותיו המשופרות של המודל מתבטאות גם במגוון משימות יומיומיות, החל מניתוחים פיננסיים ומחקר ועד ליצירה ושימוש במסמכים, גיליונות אלקטרוניים ומצגות, ובמיוחד בפלטפורמת Cowork, שם הוא יכול לבצע ריבוי משימות באופן אוטונומי.

הביצועים של Opus 4.6 נחשבים לחוד החנית בתעשייה, כפי שמדדי ביצועים (benchmarks) שונים מוכיחים. הוא השיג את הציון הגבוה ביותר במדד הקידוד הסוכני Terminal-Bench 2.0, ומוביל על פני מודלי חזית (frontier models) אחרים במבחן החשיבה הרב-תחומית Humanity’s Last Exam. במדד GDPval-AA, הבוחן משימות ידע בעלות ערך כלכלי בתחומי פיננסים ומשפט, Opus 4.6 עקף את המודל הבא אחריו (GPT-5.2 של OpenAI) בפער של כ-144 נקודות Elo. בנוסף, המודל מציג פרופיל בטיחות כללי חזק, עם שיעורים נמוכים של התנהגויות לא מיושרות (misaligned behavior) בכל מבחני הבטיחות.

במקביל להשקת המודל, אנתרופיק הציגה עדכונים משמעותיים גם ב-API ובמוצרים הנלווים. Claude Code מאפשר כעת הרכבת צוותי סוכנים (agent teams) לעבודה משותפת במקביל. ה-API כולל כעת חשיבה אדפטיבית (adaptive thinking) המאפשרת למודל להחליט מתי נדרשת חשיבה מעמיקה, וכן בקרות מאמץ (effort) המעניקות למפתחים שליטה טובה יותר על רמת האינטליגנציה, המהירות והעלות. כמו כן, הוצגה יכולת דחיסת הקשר (context compaction) המאפשרת למודל לסכם באופן אוטומטי הקשרים ישנים במשימות ארוכות טווח. Claude Opus 4.6 זמין החל מהיום ב-claude.ai, דרך ה-API של Anthropic ובכל פלטפורמות הענן המרכזיות, במחיר של 5 דולר לקלט ו-25 דולר לפלט למיליון טוקנים.

"Claude Opus 4.6 הוא המודל החזק ביותר שאנתרופיק שחררה. הוא לוקח בקשות מורכבות ומבצע אותן בפועל, מפרק אותן לשלבים קונקרטיים, מבצע ומייצר עבודה מלוטשת גם כשהמשימה שאפתנית. למשתמשי Notion, הוא מרגיש פחות כמו כלי ויותר כמו משתף פעולה בעל יכולות."