תגובת אנתרופיק לטיוטת דוח קבוצת העבודה ל-AI של מושל קליפורניה

קבוצת העבודה של מושל קליפורניה בנושא מודלי AI חזיתיים פרסמה השבוע את טיוטת הדוח שלה. אנתרופיק מברכת על הדגש ששמה הקבוצה על הצורך בתקנים אובייקטיביים ובמדיניות מבוססת ראיות, ובמיוחד על החשיבות של שקיפות ליצירת סביבת מדיניות AI מתפקדת היטב. לטענת החברה, שקיפות שנעשית בתשומת לב היא כלי בעל עלות נמוכה והשפעה גבוהה להרחבת בסיס הידע סביב טכנולוגיה חדשה, הגברת אמון הצרכנים ועידוד תחרות חיובית בין החברות. אנתרופיק מציינת כי היא שמחה על הדגש של קבוצת העבודה על האופן שבו מעבדות מודלי חזית צריכות להיות שקופות לגבי שיטות פיתוח ה-AI שלהן, ובפרט על הצורך שלהן לחשוף כיצד הן מאבטחות את המודלים שלהן מפני גניבה, וכיצד הן בודקות אותם עבור סיכוני ביטחון לאומי פוטנציאליים.

רבות מהמלצות הדוח משקפות כבר כיום שיטות עבודה מומלצות בתעשייה, שאנתרופיק דבקה בהן. כך למשל, מדיניות ה-Responsible Scaling Policy שלה מפרטת באופן פומבי כיצד החברה מעריכה את המודלים שלה מבחינת סיכוני שימוש לרעה ואוטונומיה, וכן ספי הפעלה המפעילים אמצעי בטיחות ואבטחה מוגברים. אנתרופיק גם מתארת בפומבי את תוצאות בדיקות הבטיחות והאבטחה שלה כחלק מכל שחרור משמעותי של מודל, ומבצעת בדיקות צד שלישי כדי לתגבר את הבדיקות הפנימיות שלה. חברות AI חזיתיות רבות אחרות נוהגות באופן דומה.

בהלימה לממצאי הדוח, אנתרופיק סבורה כי ממשלות יכולות למלא תפקיד בונה בשיפור השקיפות בשיטות העבודה בתחומי הבטיחות והאבטחה של חברות AI חזיתיות. נכון להיום, חברות אלו אינן מחויבות לקיים מדיניות בטיחות ואבטחה, לתאר אותה בפומבי, או לתעד פומבית את הבדיקות שהן מריצות – ולכן לא כל החברות אכן עושות זאת. אנתרופיק מאמינה כי ניתן לעשות זאת באופן "קליל" שאינו בולם חדשנות. כפי שצוין במסמך המלצות מדיניות שהוגש לאחרונה לבית הלבן, החברה מעריכה כי מערכות AI עוצמתיות יגיעו בקרוב – אולי כבר בסוף 2026 – ולכן חשוב שכולם יקדישו מאמץ לבניית משטר מדיניות שיצור שקיפות רבה יותר סביב פרוטוקולי הבטיחות והאבטחה של אופן בניית מערכות AI.

קבוצת העבודה גם הדגישה תחומים שבהם האקדמיה, החברה האזרחית והתעשייה יצטרכו להתמקד יותר בשנים הקרובות – במיוחד בנוגע להשפעות הכלכליות של AI, תחום שאנתרופיק מנסה לתרום לו באמצעות ה-Economic Index שלה. החברה מצפה להעניק משוב נוסף לקבוצת העבודה כדי לסייע ולתרום לעבודת גיבוש הדוח הסופי. אנתרופיק משבחת את המושל על חזונו בפתיחת דיון זה, ומצפה לסייע בעיצוב הגישה של קליפורניה לבטיחות מודלי חזית.

תוכן קשור

ממשלת אוסטרליה ואנתרופיק חותמות על מזכר הבנות לבטיחות ומחקר AI

אנתרופיק משקיעה 100 מיליון דולר ברשת השותפים של Claude

החברה משיקה את Claude Partner Network, תוכנית לארגוני שותפים המסייעים לארגונים לאמץ את Claude.

השקת The Anthropic Institute

אנתרופיק משיקה את The Anthropic Institute, מיזם חדש להתמודדות עם האתגרים המשמעותיים ביותר שמערכות AI עוצמתיות יציבו בפני חברותינו.