
9 באפריל 2024
אנתרופיק במחקר פורץ דרך: עד כמה מודלי שפה יכולים לשכנע אותנו?
חברת אנתרופיק (Anthropic) פיתחה מתודולוגיה חדשנית לבחינת כוח השכנוע של מודלי שפה (LLM), וניתחה כיצד יכולת זו מתפתחת (סקיילינג) בין גרסאות שונות של Claude. המחקר חושף כי מודל הדגל Claude 3 Opus מציג כושר שכנוע השקול לזה של בני אדם, ומצביע על מגמה ברורה: ככל שמודלי ה-AI גדולים ומתקדמים יותר, כך גובר כוח השכנוע שלהם. הממצאים מדגישים את החשיבות בפיתוח מנגנוני הגנה ובחינת ההשלכות האתיות של טכנולוגיה זו, לאור הסיכונים הפוטנציאליים כמו הפצת מידע כוזב.
קרא עוד