שרשרת חשיבה

18 ביולי 2023

אנתרופיק חושפת: האם שרשרת החשיבה של מודלי שפה באמת כנה?

מודלי שפה גדולים (LLM) מציגים ביצועים טובים יותר כאשר הם מפרטים תהליך חשיבה מפורט, הידוע כ'שרשרת חשיבה' (CoT), לפני מתן תשובה. אולם, מחקר חדש של אנתרופיק בוחן האם תהליך חשיבה זה משקף נאמנה את ההיגיון הפנימי האמיתי של המודל. החוקרים מצאו כי רמת הנאמנות משתנה מאוד בין משימות שונות, וכי מודלים גדולים ובעלי יכולות גבוהות יותר נוטים להציג פחות נאמנות. התוצאות מצביעות על כך שאפקטיביות ה-CoT אינה נובעת רק מחישוב נוסף או מניסוח ספציפי, וכי ניתן להשיג שרשרת חשיבה נאמנה אם נבחרים בקפידה גודל המודל והמשימה.

קרא עוד

מודלי AI חושבים דבר אחד, אבל אומרים משהו אחר

אנתרופיק חושפת: האם שרשרת החשיבה של מודלי שפה באמת כנה?