רגולציה ממוקדת ל-AI: אנתרופיק קוראת לפעולה דחופה

מודלי AI צוברים כוח ויכולות בקצב מסחרר, ומבטיחים להאיץ את הקדמה המדעית, לחשוף טיפולים רפואיים חדשים ולהניע את הכלכלה העולמית. עם זאת, לצד היכולות המרשימות הללו, טמונים גם סיכונים משמעותיים. אנתרופיק קוראת לממשלות לפעול בדחיפות לגיבוש מדיניות AI ב-18 החודשים הקרובים, שכן חלון ההזדמנויות למניעת סיכונים אקטיבית הולך ונסגר במהירות. רגולציה נבונה וממוקדת היא המפתח למינוף יתרונות ה-AI תוך מזעור סיכונים, בעוד עיכובים עלולים להוביל לרגולציה פזיזה ולא יעילה שתפגע בחדשנות.

בשנה האחרונה, מודלי AI שיפרו באופן דרמטי את יכולותיהם במתמטיקה, חשיבה אקדמית וקידוד, לצד קפיצות משמעותיות בתחומים נוספים. התקדמות זו, אף שהיא מציעה יישומים חיוביים רבים, טומנת בחובה גם פוטנציאל לשימושים הרסניים – בין אם כתוצאה מניצול לרעה בסייבר או בביולוגיה, ובין אם מהתנהגות מקרית או אוטונומית של מודל ה-AI עצמו. צוותי ה-Red Teaming (רד טימינג) הפנימיים של אנתרופיק מצאו כי מודלים קיימים כבר מסייעים במגוון משימות התקפי סייבר, ויכולותיהם בתחום ה-CBRN (כימי, ביולוגי, רדיולוגי וגרעיני) מתקרבות לרמת מומחה. אם לפני כשנה הוזהרה החברה כי מודלי חזית עלולים להוות סיכונים ממשיים בתחומי הסייבר וה-CBRN בתוך שנתיים-שלוש, הרי שההתקדמות המהירה מציבה אותנו קרוב הרבה יותר לסיכונים אלו.

מודלים יכולים לשמש להשגת ידע ברמת מומחה בביולוגיה וכימיה. בכמה מודלים, תשובות לשאלות מדעיות היו מקבילות לאלו שניתנו על ידי מומחים בעלי תואר דוקטורט.

כדי להתמודד עם אי-הוודאות שבסיכונים קטסטרופליים של AI, אנתרופיק פיתחה את מדיניות ה-Responsible Scaling Policy (RSP) שלה – מסגרת אדפטיבית לזיהוי, הערכה והפחתת סיכונים. העקרונות המרכזיים של ה-RSP הם פרופורציונליות, כלומר הגברת אמצעי הבטיחות והאבטחה בהתאם לסף יכולת שהמודל מגיע אליו, ואיטרטיביות – מדידה מתמדת של יכולות המודלים והתאמת הגישות. מדיניות זו, שהפכה לחלק אינטגרלי ממפת הדרכים של החברה, הגדילה את ההשקעה בביטחון מידע והערכות בטיחות, חידדה את הבנת הסיכונים והאיומים, ומעודדת שקיפות. באנתרופיק משוכנעים כי מנגנוני RSP הם מדיניות מעשית שחברות AI יכולות ליישם בהצלחה תוך שמירה על תחרותיות. למרות ש-RSP-ים מומלצים לאימוץ וולונטרי בתעשייה, רגולציה אכיפה חיונית על מנת להבטיח את עמידת החברות בהבטחותיהן.

בהתבסס על ניסיונה עם RSPs, אנתרופיק מציעה שלושה עקרונות מפתח לרגולציית AI יעילה: שקיפות, הדורשת מחברות לפרסם מדיניות RSP ולשתף בתוצאות הערכות סיכון; תמריצים לשיטות בטיחות ואבטחה טובות יותר, שיעודדו פיתוח RSPs אפקטיביים תוך שמירה על גמישות רגולטורית לאור התפתחות הטכנולוגיה; ופשטות ומיקוד, כדי למנוע נטל מיותר וכללים מורכבים. החברה מדגישה את החשיבות של שיתוף פעולה בין קובעי מדיניות, תעשיית ה-AI, מומחי בטיחות, חברה אזרחית ומחוקקים, במטרה לפתח מסגרת רגולטורית אפקטיבית בהסכמה רחבה, לפני שיהיה מאוחר מדי.

רגולציה ממוקדת ל-AI: אנתרופיק קוראת לפעולה דחופה

כתבות קשורות

ממשלת אוסטרליה ואנתרופיק חתמו על מזכר הבנות לבטיחות ומחקר ב-AI

אנתרופיק מזרימה 100 מיליון דולר ל-Claude Partner Network

אנתרופיק משיקה את 'המכון של אנתרופיק': חזית חדשה בבטיחות AI עוצמתי