אנתרופיק משיקה את Claude Sonnet 4.5: מודל קידוד וסוכנים חדש
אנתרופיק (Anthropic) שחררה את Claude Sonnet 4.5, מודל חדש בסדרת המודלים המובילים שלה, אותו היא מגדירה כמודל הקידוד הטוב ביותר בעולם. לדברי החברה, הוא המודל החזק ביותר לבניית סוכנים מורכבים והמצטיין ביותר בשימוש במחשבים. Sonnet 4.5 מציג גם שיפורים משמעותיים ביכולות חשיבה (reasoning) ומתמטיקה, שהן קריטיות לעבודה מודרנית מבוססת תוכנה וכלים דיגיטליים.
לצד השקת המודל, אנתרופיק מציגה שורה של עדכוני מוצר משמעותיים. ב-Claude Code נוספו יכולות כמו נקודות שמירה (checkpoints) ו-תוסף רשמי ל-VS Code. ה-API של Claude קיבל תכונת עריכת הקשר וכלי זיכרון המאפשרים לסוכנים לפעול בצורה מורכבת וארוכת טווח יותר, וביישומי Claude הוכנסו יכולות הרצת קוד ויצירת קבצים ישירות לשיחה. גולת הכותרת היא השקת ה-Claude Agent SDK, אותה התשתית שמניעה את Claude Code, וכעת זמין למפתחים לבניית סוכנים משלהם למגוון רחב של משימות.
ביצועים ובטיחות: מודל החזית המיושר ביותר
ביכולותיו, Claude Sonnet 4.5 מוביל במדד הקידוד SWE-bench Verified, המודד יכולות קידוד תוכנה בעולם האמיתי, עם תוצאות מרשימות. כמו כן, הוא מציג קפיצת מדרגה בשימוש במחשבים, ומוביל במדד OSWorld שבוחן מודלי AI במשימות מחשב יום-יומיות. לקוחות מוקדמים מדווחים על שיפורים דרמטיים, כפי שמציין אחד מהם:
Claude Sonnet 4.5 מאפשר 30+ שעות של קידוד אוטונומי, מה שמשחרר את המהנדסים שלנו לעסוק בעבודה ארכיטקטונית מורכבת ומאפשר להם לטפל בבסיסי קוד עצומים בזמן קצר יותר.
אנתרופיק מציינת גם כי זהו מודל החזית המיושר ביותר ששוחרר על ידה עד כה, עם שיפורים גדולים בהפחתת התנהגויות בעייתיות כמו סגידה (sycophancy), הונאה (deception) וחיפוש כוח (power-seeking), והגנה משופרת נגד התקפות הזרקת פרומפטים (prompt injection). המודל זמין החל מהיום לכלל המפתחים דרך ה-API של Claude במחיר זהה ל-Claude Sonnet 4 (3$/15$ למיליון טוקנים).



