
19 בדצמבר 2025
Bloom: כלי קוד פתוח חדש מבית אנתרופיק לבדיקת התנהגות מודלי AI אוטומטית
אנתרופיק (Anthropic), חברת מחקר ובטיחות AI מובילה, משיקה את Bloom – כלי קוד פתוח חדש שמטרתו לסייע בהערכה אוטומטית של התנהגויות מודלי AI חזיתיים. Bloom מאפשר לחוקרים לזהות ולכמת תכונות התנהגותיות ספציפיות במודלים, באמצעות יצירת תרחישים מגוונים ובדיקת התגובות. הכלי הוכח כמצליח לזהות הבדלים בין מודלים תקינים למודלים שיושרו באופן מכוון להתנהגויות לא רצויות, והוא מספק מענה לצורך גובר בכלי הערכה מהירים וסקיילביליים.
קרא עוד