כיצד AI משפיע על העבודה? אנתרופיק מציגה מדדים חדשניים להבנת השינוי הכלכלי

האם בינה מלאכותית באמת מאיצה את קצב העבודה של אנשים? אילו סוגי משימות היא תומכת בצורה הטובה ביותר? וכיצד היא עשויה לשנות את אופי המקצועות בעתיד?

באנתרופיק, אנו מודדים באופן שוטף את השימוש ב-AI בעולם האמיתי כדי לענות על שאלות בדיוק כאלה. שיטת הניתוח שלנו, השומרת על פרטיות המשתמשים, מאפשרת לנו ללמוד על שיחות המתנהלות ב-Claude.ai (המשקפות בעיקר שימוש צרכני) וב-API שלנו (המשקף בעיקר שימוש עסקי). כל הנתונים מבוססים על ניתוח אקראי של מיליון שיחות מ-Claude.ai (גרסאות Free, Pro ו-Max) ומיליון תיעודים מתעבורת ה-API שלנו (המכונים גם "נתוני ארגונים" מכיוון שהם מייצגים בעיקר שימוש עסקי).

כעת, אנו מוסיפים רמת פירוט חדשה ל'מדד הכלכלי' שלנו. בדו"ח הרביעי, אנו מציגים את מה שאנו מכנים אבני יסוד כלכליות (economic primitives): סט של חמישה מדדים בסיסיים ופשוטים למעקב אחר ההשפעות הכלכליות של Claude לאורך זמן. הסט הראשוני שלנו כולל מורכבות משימה, רמת מיומנות, ייעוד (עבודה, חינוך או שימוש אישי), אוטונומיה של AI, והצלחה. את אבני היסוד הללו אנו מסיקים באמצעות בקשה מ-Claude לענות על סט שאלות משותף לגבי כל שיחה במדגם שלנו עבור דו"ח זה.

להלן פירוט של חמש אבני היסוד הכלכליות:

מורכבות משימה (Task complexity): לוכדת את השוני במורכבות המשימות, כולל משך הזמן שלוקח להשלים אותן ורמת הקושי שלהן. אנו מודדים מורכבות באמצעות זמן אנושי משוער להשלמת משימות ללא AI, זמן שהושקע בהשלמת משימות עם AI, והאם המשתמשים מטפלים במספר משימות בשיחה אחת.
מיומנויות אנושיות ושל AI (Human and AI skills): מתייחסת לאופן שבו אוטומציה מתמזגת עם רמות מיומנות. אם AI מחליף באופן לא פרופורציונלי משימות הדורשות פחות מומחיות ומשלים עבודה בעלת מיומנות גבוהה יותר, הדבר עשוי להגביר את הדרישה לעובדים מיומנים ולהוריד את הדרישה לעובדים פחות מיומנים. אנו מודדים האם משתמשים יכלו להשלים משימות ללא Claude, ואת שנות הלימוד הנדרשות להבנת הפרומפטים ותגובות Claude.
מקרה שימוש (Purpose/Use case): מבחין בין שימוש מקצועי, חינוכי ואישי. השפעות שוק העבודה נובעות ישירות משימוש במקום העבודה, בעוד ששימוש חינוכי עשוי לאותת היכן כוח העבודה העתידי בונה מיומנויות משלימות ל-AI.
אוטונומיה של AI (AI autonomy): מודדת את מידת האצלת קבלת ההחלטות ל-Claude על ידי המשתמשים. הדו"ח האחרון תיעד עלייה בשימוש "הוראתי" שבו משתמשים מפקדים על Claude לבצע משימות באופן מלא. מעקב אחר רמות האוטונומיה – משיתוף פעולה פעיל ועד אצלה מלאה – מסייע לחזות את קצב האוטומציה.
הצלחת משימה (Task success): מודדת את הערכת Claude האם המשימות הושלמו בהצלחה. הצלחת משימה מסייעת להעריך האם ניתן לבצע אוטומציה למשימות ביעילות (האם ניתן לבצע אוטומציה למשימה כלל?) ובאופן חסכוני (כמה ניסיונות יידרשו לאוטומציה של משימה?). כלומר, הצלחת משימה חשובה הן עבור היתכנות והן עבור עלות האוטומציה של משימות עבודה.

אבני יסוד אלה מספקות אינדיקטור מוביל להשפעות הכלכליות הפוטנציאליות של AI – ומאפשרות לנו לענות על שאלות מורכבות הרבה יותר לגבי האופן שבו AI כבר משנה משרות. הדו"ח האחרון שלנו, המדגם שיחות מנובמבר 2025 (בעיקר באמצעות Claude Sonnet 4.5), משתמש באבני היסוד כדי לחקור מגוון רחב של שאלות שלא היינו יכולים לענות עליהן אחרת – כולל האופן שבו שיעורי ההצלחה של Claude ברמת המשימה משתנים במשימות מורכבות יותר, והאם השימוש ב-Claude עד כה עשוי לבשר על אפקט של 'הפחתת מיומנויות נטו' במקצועות רבים. ניתן לקרוא את דו"ח 'המדד הכלכלי' הרביעי כאן. להלן, אנו מסכמים את ממצאיו.

מה למדנו מאבני היסוד הכלכליות שלנו

יישמנו את אבני היסוד הכלכליות שלנו על שאלות הנוגעות למשימות בודדות, מקצועות, ולאחר מכן להשפעות המצטברות האפשריות של השינויים שאנו צופים בהם. (המתודולוגיה המלאה שלנו – כולל פרטים על אופן בדיקת הדיוק של אבני היסוד – מתוארת בפרק השני של הדו"ח המלא.)

משימות

אילו משימות מואצות על ידי AI, ובאיזו מידה?

מצאנו כי משימות מורכבות יותר הואצו בצורה המשמעותית ביותר על ידי Claude. מדדנו זאת לפי הערכתו של Claude למספר שנות הלימוד הנדרשות כדי להבין את קלטי השיחה: ב-Claude.ai, משימות עם פרומפטים שדרשו השכלה תיכונית (12 שנות לימוד) הואצו בפקטור של 9, בעוד שאלו שדרשו תואר אקדמי (16 שנות לימוד) הואצו בפקטור של 12. (ב-API, ההאצה הייתה גדולה אף יותר). תוצאות אלו מרמזות כי רווחי הפריון מ-AI מצטברים כיום במשימות הדורשות הון אנושי גבוה יחסית, מה שמתיישב עם העדויות לכך שאנשי מקצוע 'צווארון לבן' נוטים יותר להשתמש ב-AI בעבודה.

מגמה זו נשמרת – אם כי בצורה חלשה יותר – כאשר אנו מתאימים את הנתונים לשיעורי ההצלחה של המשימות. Claude משלים בהצלחה משימות הדורשות תואר אקדמי ב-66% מהמקרים, לעומת 70% במשימות הדורשות השכלה נמוכה מתיכון. זה מצמצם, אך אינו מבטל לחלוטין, את ההשפעה הכוללת: השפעת Claude על האצת משימות גדלה באופן חד יותר עם המורכבות מאשר הקשר בין מורכבות לירידה בשיעור ההצלחה.

מהם אופקי הזמן שבהם Claude יכול לתמוך במשימות?

מדד הביצועים של METR לאופקי המשימה של AI מראה שמשימות ארוכות יותר קשות יותר למודלי AI להשלמה. אך משך הזמן שבו מודלי AI יכולים לעבוד עולה בהתמדה ככל שהמודלים משתפרים: מדד זה הפך כעת לאינדיקטור מרכזי להתקדמות ב-AI.

אנו משלימים את הניתוח של METR באמצעות אבני היסוד הכלכליות שלנו. בגרף (לא מוצג), אנו מציגים את שיעורי ההצלחה של Claude ברמת המשימה ביחס לזמן שייקח לאדם לבצע אותה משימה, הן ב-Claude.ai והן ב-API שלנו:

מדד הביצועים של METR מציע ש-Claude Sonnet 4.5 (המודל בניתוח שלנו) משיג שיעורי הצלחה של 50% במשימות שאורכות שעתיים. לעומת זאת, נתוני ה-API שלנו מראים ש-Claude מצליח ב-50% במשימות שאורכות כמעט פי שניים (כ-3.5 שעות), וב-Claude.ai, משך הזמן ארוך בהרבה – כ-19 שעות.

אך ייתכן שאין זו סתירה גדולה כל כך: המתודולוגיה שלנו שונה מזו של METR בכמה אופנים חשובים. במדגם שלנו, משתמשים יכולים לפרק משימות מורכבות לשלבים קטנים יותר, וליצור לולאת משוב המאפשרת ל-Claude לתקן את דרכו. ובמקום סט קבוע של משימות, המדגם שלנו מכיל הטיית בחירה מסוימת: משתמשים מביאים ל-Claude משימות שהם בטוחים יותר שיצליחו.

הניתוח שלנו מראה כיצד אופקי הזמן האפקטיביים של Claude עשויים להיראות שונים מאלו שנמצאו במחקר עם סט קבוע של משימות. אנו נעקוב אחר אינדיקטור זה בדו"חות הבאים.

כיצד משתנה אופי העבודה של Claude בין מדינות?

אנו מוצאים ש-Claude משלים סוגים שונים מאוד של משימות במדינות הנמצאות בשלבי פיתוח כלכלי שונים. במדינות עם תוצר מקומי גולמי (תמ"ג) לנפש גבוה יותר, Claude משמש לעיתים קרובות יותר לעבודה או לשימוש אישי – בעוד שבמדינות בקצה השני של הספקטרום, סביר יותר שהוא ישמש לקורסים חינוכיים. זה מתאים לסיפור פשוט של 'עקומת אימוץ', שבה מדינות בעלות הכנסה נמוכה מציגות נתח גדול של שימוש ב-AI לחינוך ולמספר מצומצם יותר של משימות עבודה, בעוד שהשימוש ב-AI מתגוון למטרות אישיות ככל שהמדינות מתעשרות.

תוצאות אלו מתיישבות עם עבודה עדכנית של Microsoft המקשרת שימוש ב-AI בחינוך להכנסה נמוכה יותר לנפש, ושימוש ב-AI לפנאי להכנסות גבוהות יותר. השותפות האחרונה שלנו עם ממשלת רואנדה ו-ALX, ספקית הכשרה טכנולוגית, תוכננה מתוך מחשבה זו: המשתתפים מתחילים בפיתוח אוריינות AI, ואנו משיקים תוכנית פיילוט למתן גישה לשנה ל-Claude Pro לחלק מהבוגרים, בתמיכה במעבר משימוש חינוכי למגוון רחב יותר של יישומים.

מקצועות

היקף כיסוי

בדו"ח הראשון שלנו, עם נתונים מינואר 2025, מצאנו כי ב-36% מהמשרות במדגם שלנו נעשה שימוש ב-Claude עבור לפחות רבע מהמשימות. איגום נתונים מדו"חות שונים מראה כי נתון זה עלה ל-49%. אך ברגע שאנו לוקחים בחשבון את שיעור ההצלחה של Claude (אשר אנו משקללים לפי תדירות ביצוע המשימה על ידי עובדים ומשך זמן המשימה), אנו מקבלים תמונה שונה לגבי המשרות המושפעות ביותר משימוש ב-AI.

בגרף (לא מוצג), אנו מתארים את המדד הקודם של כיסוי משימות במקצועות לאורך ציר ה-X, ואת המדד החדש והמותאם שלנו לאורך ציר ה-Y. למרות שהשניים בהחלט קשורים, אנו מוצאים כעת שמקצועות מסוימים (כמו קלדני הזנת נתונים ורדיולוגים) מושפעים הרבה יותר מ-AI מכפי שכיסוי המשימות לבדו היה מרמז, בעוד שאחרים (כמו מורים ומפתחי תוכנה) מושפעים פחות יחסית.

עם זאת, גם ההערכה המתוקנת שלנו עדיין מוגבלת: אנו מעריכים רק משימות המבוצעות ב-Claude.ai, ולא תמיד ברור כיצד שיחות אלו עשויות להשתקף בשינויים בעולם האמיתי. זהו תחום שאנו מתכננים לבחון לעומק בדו"חות עתידיים.

תוכן משימה

שאלה נוספת ששאלנו היא האם המשימות ש-AI מכסה מייצגות את הרכיבים בעלי המיומנות הגבוהה או הנמוכה יותר במקצוע נתון. באמצעות הערכה שיצרנו לרמת המיומנות הנדרשת לכל משימה, אנו מוצאים ש-Claude נוטה יותר לכסות משימות הדורשות רמות השכלה גבוהות יותר – ספציפית, משימות הדורשות ממוצע של 14.4 שנות לימוד (שווה ערך לתואר Associate בארה"ב), יחסית לממוצע הכלכלי של 13.2 (לא מוצג). זה מתיישב עם ממצא קודם שלנו ש-Claude משמש לעיתים קרובות יותר על ידי עובדי צווארון לבן.

במסגרת ניסוי, הערכנו כיצד הסרת משימות אלו, המכוסות על ידי Claude, תשנה את הרכב המשימות במשרות של אנשים. כאפקט מסדר ראשון, הדבר יוביל להפחתת מיומנויות בממוצע, שכן הוא יסיר את אותן משימות הדורשות השכלה גבוהה יותר. מקצועות כמו כותבים טכניים, סוכני נסיעות ומורים יושפעו (כפי שאנו דנים בהרחבה בדו"ח), אם כי מספר מצומצם יותר של מקצועות (כמו מנהלי נדל"ן) יראו השפעות בכיוון ההפוך.

איננו בהכרח חוזים שהפחתת המיומנויות הזו אכן תתרחש: ייתכן שגם אם AI יבצע אוטומציה מלאה למשימות שהוא תומך בהן כיום, שוק העבודה יתאים את עצמו באופן דינמי בדרכים שהניתוח הזה אינו לוקח בחשבון. (וכמובן, ככל שהמודלים ישתפרו, גם הרכב המשימות ש-AI מכסה ישתנה). עם זאת, אנו סבורים שזה מציע איתות שימושי לגבי ההשפעות המיידיות ביותר שעשויות להיות ל-AI על מקצועות בעתיד הקרוב.

השפעה כוללת

במחקר קודם שלנו, הערכנו כי אימוץ נרחב של AI יכול להגדיל את צמיחת פריון העבודה בארה"ב ב-1.8 נקודות אחוז בשנה במהלך עשר השנים הבאות – בערך כפול מהקצב המגמתי. אבני היסוד החדשות שלנו מאפשרות לנו לבחון מחדש ניתוח זה.

בהתבסס על הערכותינו להאצת משימות בלבד, שיחזרנו את הממצא הקודם שלנו של עלייה של 1.8 נקודות אחוז (אפילו כשכללנו את נתוני ה-API שלנו). אך כאשר אנו לוקחים בחשבון את אמינות המשימה – כלומר, כשאנו מתאימים את הערכתנו לחיסכון בזמן ברמת המשימה לפי ההסתברות שהמשימה מוצלחת – הערכתנו יורדת בכשליש עבור משימות שהושלמו ב-Claude.ai (ל-1.2 נקודות אחוז בשנה), ובמעט יותר (ל-1.0 נקודות אחוז) עבור המשימות המאתגרות יותר המבוצעות ב-API שלנו.

אפילו עלייה של נקודת אחוז אחת בצמיחת פריון העבודה השנתית עדיין תהיה משמעותית: היא תחזיר את צמיחת הפריון בארה"ב לרמות של סוף שנות ה-90 ותחילת שנות ה-2000. וכפי שציינו במחקר קודם שלנו, הערכה כוללת זו אינה לוקחת בחשבון את האפשרויות שמודלי AI יהפכו לחזקים בהרבה, או ששימוש ב-AI בעבודה יהפוך למתוחכם הרבה יותר – מה שעשוי לדחוף את המספר גבוה יותר. אכן, מאז הסקר שלנו, Claude הפך לחזק משמעותית, עם השקת Claude Opus 4.5.

עדכונים למדדים קודמים

בנוסף לאבני היסוד החדשות, אספנו סבב נתונים חדש לגבי המדדים שאנו עוקבים אחריהם בדו"חות קודמים. זה מאפשר לנו לזהות מגמות בשימוש ב-AI לאורך שנת 2025, מינואר עד נובמבר. כאן, אנו מוצאים בעיקר התפתחויות קטנות מהתוצאות של ניתוחים קודמים, אשר הצביעו על התפלגות לא אחידה של השימוש ב-Claude.

ראשית, אנו מוצאים כי השימוש ב-Claude נותר מרוכז מאוד במשימות מסוימות: למרות שהמדגם שלנו כולל 3,000 משימות עבודה ייחודיות ב-Claude.ai, עשר המשימות המובילות מהוות 24% מהסט, נתון שעלה בהתמדה מ-21% בינואר 2025. באופן ספציפי יותר, משימות מחשוב ומתמטיקה ממשיכות לשלוט בשימוש ב-Claude: הן מהוות כשליש מכלל השיחות ב-Claude.ai, וכמעט מחצית מתעבורת ה-API שלנו.

שנית, הדו"ח החדש שלנו מגלה כי הרחבת יכולות (augmentation), המהווה 52% מהשיחות, עברה את האוטומציה (45%) כדפוס האינטראקציה הפופולרי ביותר עם Claude ב-Claude.ai. זוהי היפוך מגמה ממה שראינו במדגם אוגוסט (כאשר אוטומציה הובילה ביחס של 49% ל-47%), אך כאשר אנו בוחנים שאלה זו בטווח זמן ארוך יותר, אנו עדיין רואים עלייה איטית בחלקה של אוטומציה במשימות: הרחבה הובילה ביחס של 55% ל-41% בינואר של השנה שעברה, וביחס של 55% ל-42% במרץ.

שלישית, הניתוח האחרון שלנו מראה כי הריכוז הגיאוגרפי של השימוש ב-AI (כפי שדנו בפעם הקודמת) עדיין ניכר. ארה"ב, הודו, יפן, בריטניה ודרום קוריאה עדיין מובילות בשימוש הכולל ב-Claude.ai, ואימוץ ה-AI עדיין מוסבר היטב על ידי התמ"ג לנפש. עם זאת, בארה"ב, צפינו בשינויים גדולים יותר: השימוש ב-Claude הפך להיות מפוזר באופן בולט יותר באופן שווה בין מדינות ארה"ב. למעשה, אם מגמה זו תימשך, המודל שלנו צופה כי השימוש ב-Claude יתאזן ברחבי המדינה תוך שנתיים עד חמש שנים. אנו דנים במודל זה בפירוט רב יותר בדו"ח.

מסקנות

המסקנה המיידית ביותר מדו"ח 'המדד הכלכלי' האחרון שלנו היא שהשפעת ה-AI על כוח העבודה העולמי נותרה לא אחידה במיוחד: השימוש ב-AI נשאר מרוכז במדינות ובמקצועות ספציפיים, והוא משפיע על מקצועות מסוימים באופן שונה מאוד מאחרים, כפי שמעידות הראיות לגבי כיסוי משימות.

באופן כללי יותר, דו"ח זה העניק לנו קו בסיס חדש להשוואה עבור הסקרים העתידיים שלנו. ככל ש-Claude ישתפר, אנו מצפים שיתבקש לקחת על עצמו משימות קשות יותר, וכי ימצא הצלחה גדולה יותר. אנו גם מצפים שמשימות עשויות לעבור מ-Claude.ai ל-API (כלומר, מצרכנים בעיקר לעסקים בעיקר) ככל שהן יהפכו לאמינות יותר – ואם זה יקרה, זה ייתן לנו אינדיקציה אפשרית נוספת להשפעות כלכליות עתידיות, בהתחשב בחשיבות אימוץ ה-AI על ידי עסקים להשפעת ה-AI על הפריון. באמצעות אבני היסוד שלנו, נוכל למדוד כיצד שינויים כאלה מתחילים להשפיע על תוצאות בעולם האמיתי, כולל אופי עבודתם של אנשים, ואילו אנשים (והיכן) צפויים להיות מושפעים ביותר במהלך תקופה זו של מעבר טכנולוגי מהיר.

בינתיים, חוקרים, עיתונאים והציבור הרחב יכולים להשתמש בנתונים שלנו כדי לתדלק את המחקר והחשיבה שלהם, ולספק בסיס אמפירי לתגובות מדיניות פוטנציאליות שנזדקק להן. לפרטים נוספים על כל אחד מהתחומים שדנו בהם לעיל, ראו את הדו"ח המלא שלנו.