אנתרופיק (Anthropic), חברת מחקר ופיתוח AI המתמקדת בבטיחות וביישור מודלים, שחררה את מודל השפה הגדול (LLM) העדכני שלה, Claude 2.1. המודל זמין כעת דרך ה-API בקונסולה של החברה ומפעיל את חווית הצ'אט ב-claude.ai. Claude 2.1 מביא עמו התקדמות משמעותית ביכולות מפתח עבור ארגונים, כולל חלון הקשר (context window) מוביל בתעשייה של 200,000 טוקנים, הפחתה דרמטית בהזיות המודל, System Prompts, ותכונה חדשה בבטא: שימוש בכלים (tool use). בנוסף, החברה עדכנה את תמחור המודלים כדי לשפר את יעילות העלות ללקוחותיה.

יכולות הליבה של Claude 2.1: חלון הקשר ענק ודיוק חסר תקדים

מאז ההשקה המוקדמת של Claude השנה, המודל שימש מיליוני אנשים למגוון רחב של יישומים – מתרגום מאמרים אקדמיים ועד ניסוח תוכניות עסקיות וניתוח חוזים מורכבים. בתגובה לבקשות המשתמשים לחלונות הקשר גדולים יותר ופלט מדויק יותר במסמכים ארוכים, אנתרופיק הכפילה את כמות המידע שניתן להעביר ל-Claude. המגבלה החדשה עומדת על 200,000 טוקנים, המתורגמים לכ-150,000 מילים, או מעל 500 עמודים של חומר. משתמשים יכולים כעת להעלות מסמכים טכניים כמו בסיסי קוד שלמים, דוחות כספיים, או אפילו יצירות ספרותיות ארוכות. היכולת לתקשר עם גופי תוכן או נתונים כה גדולים מאפשרת ל-Claude לסכם, לבצע שאלות ותשובות, לחזות מגמות, להשוות מסמכים מרובים ועוד.

״עיבוד הודעה באורך 200K טוקנים הוא הישג מורכב וראשון מסוגו בתעשייה. בעוד שאנו נרגשים להביא את היכולת החדשה והעוצמתית הזו לידי המשתמשים שלנו, משימות שבדרך כלל דורשות שעות של עבודה אנושית עשויות לקחת ל-Claude דקות ספורות. אנו מצפים שהשהוי יפחת משמעותית ככל שהטכנולוגיה תתקדם.״

בנוסף להרחבת חלון ההקשר, Claude 2.1 רשם הישגים משמעותיים ביושר ובאמינות, עם ירידה של פי 2 בהזיות (hallucination) ובהצהרות שגויות בהשוואה למודל הקודם, Claude 2.0. שיפור זה מאפשר לארגונים לבנות יישומי AI בעלי ביצועים גבוהים הפותרים בעיות עסקיות קונקרטיות, ולפרוס AI בפעילותם עם אמון ואמינות גבוהים יותר. אנתרופיק בחנה את יושר המודל באמצעות שאלות עובדתיות מורכבות הבוחנות חולשות ידועות במודלים קיימים. Claude 2.1 הפגין סבירות גבוהה יותר להודות בחוסר ודאות במקום לספק מידע שגוי. כמו כן, המודל הציג שיפורים משמעותיים בהבנה ובסיכום, במיוחד עבור מסמכים ארוכים ומורכבים הדורשים רמת דיוק גבוהה, כגון מסמכים משפטיים ודוחות כספיים. בהערכות החברה, נרשמה הפחתה של 30% בתשובות שגויות ושיעור נמוך פי 3-4 של הסקת מסקנות מוטעות. למרות שיפורים אלה, הגברת הדיוק והאמינות של הפלט עבור המשתמשים נותרה בראש סדר העדיפויות של צוותי המוצר והמחקר.

שימוש בכלים, חווית מפתחים משודרגת ו-System Prompts

לבקשת הקהל, נוספה גם יכולת שימוש בכלים (Tool Use), תכונת בטא חדשה המאפשרת ל-Claude להשתלב בתהליכים, מוצרים ו-APIs קיימים של המשתמשים. יכולת זו נועדה להפוך את Claude לשימושי יותר בפעילות היומיומית של המשתמשים. Claude יכול כעת לתאם פעולות בין פונקציות או APIs שהוגדרו על ידי מפתחים, לחפש במקורות מידע אינטרנטיים ולשלוף מידע מבסיסי ידע פרטיים. המודל יכול להחליט באיזה כלי להשתמש כדי לבצע משימה, כגון שימוש במחשבון לחשיבה נומרית מורכבת, תרגום בקשות בשפה טבעית לקריאות API מובנות, מענה על שאלות באמצעות חיפוש בבסיסי נתונים, או ביצוע פעולות פשוטות בתוכנה דרך APIs פרטיים. היכולת נמצאת בשלבי פיתוח מוקדמים, ואנתרופיק מעודדת משתמשים לשתף משוב כדי לעצב ולשפר את המוצר.

במקביל, אנתרופיק פועלת לפשט ולשדרג את חווית המפתחים בקונסולה שלה. מוצר ה-Workbench החדש מאפשר למפתחים לבצע איטרציות על פרומפטים בסביבת פלייגראונד (playground-style), לגשת להגדרות מודל חדשות כדי לייעל את התנהגותו של Claude, וליצור מספר פרומפטים עבור פרויקטים שונים תוך שמירה אוטומטית של גרסאות קודמות. מפתחים יכולים גם לייצר קטעי קוד כדי להשתמש בפרומפטים שלהם ישירות באחד מה-SDK-ים של החברה. בנוסף, הוצגו System Prompts, המאפשרים למשתמשים לספק הנחיות מותאמות אישית ל-Claude כדי לשפר ביצועים, להקנות לו אישיות או תפקיד ספציפי, ולעצב את התגובות באופן עקבי ומותאם יותר לצרכים שלהם.

Claude 2.1 זמין כעת ב-API של אנתרופיק, ומניע גם את ממשק הצ'אט ב-claude.ai, הן למשתמשים בגרסה החינמית והן למשתמשי Pro. השימוש בחלון הקשר של 200,000 טוקנים שמור למשתמשי Claude Pro, שיכולים כעת להעלות קבצים גדולים מתמיד. באנתרופיק מצפים בכיליון עיניים לראות את מקרי השימוש החדשים שהיכולות האלה יעוררו, תוך המשך העבודה על בניית מערכות ה-AI הבטוחות והמתוחכמות ביותר בתעשייה.