Anthropic مدل Opus 4.5 را با ادغام‌های جدید کروم و اکسل منتشر کرد

روز دوشنبه، Anthropic مدل Opus 4.5، آخرین نسخه از مدل پرچمدار خود را معرفی کرد. این آخرین مدل از سری 4.5 مدل‌های Anthropic است که پس از عرضه Sonnet 4.5 در سپتامبر و Haiku 4.5 در اکتبر منتشر می‌شود.

همانطور که انتظار می‌رفت، نسخه جدید Opus عملکرد پیشرفته‌ای در طیف وسیعی از بنچمارک‌ها، از جمله بنچمارک‌های کدنویسی (SWE-Bench و Terminal-bench)، استفاده از ابزار (tau2-bench و MCP Atlas) و حل مسئله عمومی (ARC-AGI 2, GPQA Diamond) دارد.

قابل توجه است که Opus 4.5 اولین مدلی است که در SWE-Bench verified، یک بنچمارک معتبر کدنویسی، امتیاز بالای 80 درصد را کسب کرده است.

Anthropic همچنین بر قابلیت‌های استفاده از کامپیوتر و صفحات گسترده Opus تأکید کرد و تعدادی محصول موازی را برای نمایش نحوه عملکرد مدل در این محیط‌ها راه‌اندازی کرد. همراه با Opus 4.5، Anthropic محصولات Claude for Chrome و Claude for Excel خود را که قبلاً در مرحله آزمایشی بودند، به طور گسترده‌تری در دسترس قرار خواهد داد. افزونه کروم برای همه کاربران Max در دسترس خواهد بود، در حالی که مدل متمرکز بر اکسل برای کاربران Max، Team و Enterprise در دسترس خواهد بود.

Opus 4.5 همچنین با بهبودهایی در حافظه برای عملیات با زمینه طولانی عرضه می‌شود که نیازمند تغییرات قابل توجهی در نحوه مدیریت حافظه توسط مدل بود.

دین پِن، مدیر محصول تحقیقاتی Anthropic، به TechCrunch گفت: "بهبودهایی در کیفیت کلی زمینه طولانی در آموزش با Opus 4.5 ایجاد کرده‌ایم، اما پنجره‌های زمینه به تنهایی کافی نخواهند بود." "دانستن جزئیات مناسب برای به خاطر سپردن در کنار داشتن یک پنجره زمینه طولانی‌تر بسیار مهم است."

این تغییرات همچنین قابلیت "چت بی‌پایان" را که مدت‌ها مورد درخواست کاربران پولی Claude بود، فعال کرده است. این قابلیت به چت‌ها اجازه می‌دهد بدون وقفه ادامه یابند، حتی زمانی که مدل به پنجره زمینه خود می‌رسد. در عوض، مدل حافظه زمینه خود را فشرده می‌کند بدون اینکه به کاربر اطلاع دهد.

بسیاری از ارتقاءها با نگاهی به موارد استفاده عامل‌محور (agentic use cases) انجام شده‌اند، به ویژه سناریوهایی که Opus به عنوان یک عامل اصلی فرماندهی گروهی از زیرعامل‌های مبتنی بر Haiku عمل می‌کند. مدیریت این وظایف نیازمند تسلط قوی بر حافظه کاری است، جایی که بهبودهای حافظه که توسط پن توضیح داده شد، ارزش واقعی خود را نشان می‌دهند.

پن می‌گوید: "اینجاست که اصول اساسی مانند حافظه واقعاً مهم می‌شوند، زیرا Claude باید بتواند پایگاه‌های کد و اسناد بزرگ را کاوش کند و همچنین بداند چه زمانی عقب‌نشینی کند و چیزی را دوباره بررسی کند."

Opus 4.5 با رقابت شدیدی از سوی سایر مدل‌های پیشرفته که اخیراً منتشر شده‌اند، روبرو خواهد شد، به ویژه GPT 5.1 OpenAI (منتشر شده در 12 نوامبر) و Gemini 3 گوگل (منتشر شده در 18 نوامبر).