מודלי שפה גדולים

20 כתבות בנושא זה

23 בפברואר 2026

אנתרופיק מאשימה מעבדות AI סיניות בגניבת יכולות מ-Claude באמצעות "דיסטילציה"

חברת אנתרופיק (Anthropic), מובילה בתחום מחקר ובטיחות ה-AI, חשפה קמפיינים תעשייתיים של שלוש מעבדות AI סיניות – DeepSeek, Moonshot ו-MiniMax – שביצעו "התקפות דיסטילציה" כדי לגנוב יכולות מתקדמות ממודלי Claude שלה. המעבדות יצרו למעלה מ-16 מיליון חילופי פרומפטים באמצעות כ-24,000 חשבונות מזויפים, ובכך הפרו באופן בוטה את תנאי השירות והגבלות הגישה. לפי אנתרופיק, התקפות אלו מהוות סיכון לביטחון הלאומי בכך שהן מאפשרות הפצת מודלים חסרי מנגנוני הגנה ותכונות בטיחות, ופוגעות ביתרון הטכנולוגי של ארה"ב ב-AI על ידי עקיפת בקרות ייצוא. החברה קוראת לתגובה מתואמת של התעשייה, קובעי המדיניות וקהילת ה-AI העולמית להתמודדות עם האיום המתפתח.

מודלי שפה גדולים

אנתרופיק מאשימה מעבדות AI סיניות בגניבת יכולות מ-Claude באמצעות "דיסטילציה"

ציר הסוכן: כיצד Anthropic מייצבת את 'אישיות' מודלי השפה הגדולים

<strong>קלוד משנה את פני המדע:</strong> כך מודל ה-AI של אנתרופיק מאיץ מחקרים וגילויים

קלוד צולל לעולם הבריאות: אנתרופיק מרחיבה יכולות לרפואה ומדעי החיים

אנתרופיק: כך אנו מגנים על משתמשי Claude מפני סיכונים נפשיים ו"סלחנות" מודלים

אנתרופיק חושפת: כך מודדים הטיה פוליטית במודלי Claude ומה התוצאות

הצצה פנימה: עדויות ליכולת אינטרוספקציה במודלי שפה גדולים

מחקר חדש של אנתרופיק: כך ניתן 'להרעיל' מודלי שפה גדולים (LLMs) עם מעט מאוד נתונים

SHADE-Arena: הערכת חבלה וניטור בסוכני LLM

אנתרופיק מחמירה את אמצעי הבטיחות: מפעילה הגנות ASL-3 עבור Claude Opus 4

מודלי AI חושבים דבר אחד, אבל אומרים משהו אחר

הערכות חבלה: כך בוחנים מודלי AI חזיתיים על יכולתם להטעות ולתמרן

סיילספורס משלבת את Claude של אנתרופיק לשיפור יכולות Einstein

מחנופה ועד תרמית: אנתרופיק חושפת סיכון חדש במודלי שפה

מעבר ל'לא מזיק': כך אנתרופיק מאמנת את קלוד לפתח אופי מורכב

אנתרופיק מסבירה: כך תמקסמו את Claude באמצעות הנדסת פרומפטים ותשפרו ביצועים עסקיים

סוכנים רדומים: מודלי שפה מטעים שעמידים לאימוני בטיחות

אנתרופיק חושפת: כך מודלי שפה גדולים מכלילים ידע – הצצה אל מאחורי הקלעים

אנתרופיק בוחנת: האם נצליח לפקח על מודלי AI חזקים מאיתנו?

חיזוי והפתעה במודלי בינה מלאכותית גנרטיביים: האתגר של אנתרופיק