Anthropic مدل Opus 4.5 را با ادغامهای جدید کروم و اکسل منتشر کرد

- Claude برای کروم و اکسل رو هم اضافه کرده که کاربردهای عملی هوش مصنوعی رو بهتر میکنه.
- قابلیت حافظه طولانیمدت پیشرفتهای رو معرفی کرده که گردش کارهای عاملمحور رو روانتر میکنه.
روز دوشنبه، Anthropic مدل Opus 4.5، آخرین نسخه از مدل پرچمدار خود را معرفی کرد. این آخرین مدل از سری 4.5 مدلهای Anthropic است که پس از عرضه Sonnet 4.5 در سپتامبر و Haiku 4.5 در اکتبر منتشر میشود.
همانطور که انتظار میرفت، نسخه جدید Opus عملکرد پیشرفتهای در طیف وسیعی از بنچمارکها، از جمله بنچمارکهای کدنویسی (SWE-Bench و Terminal-bench)، استفاده از ابزار (tau2-bench و MCP Atlas) و حل مسئله عمومی (ARC-AGI 2, GPQA Diamond) دارد.
قابل توجه است که Opus 4.5 اولین مدلی است که در SWE-Bench verified، یک بنچمارک معتبر کدنویسی، امتیاز بالای 80 درصد را کسب کرده است.
Anthropic همچنین بر قابلیتهای استفاده از کامپیوتر و صفحات گسترده Opus تأکید کرد و تعدادی محصول موازی را برای نمایش نحوه عملکرد مدل در این محیطها راهاندازی کرد. همراه با Opus 4.5، Anthropic محصولات Claude for Chrome و Claude for Excel خود را که قبلاً در مرحله آزمایشی بودند، به طور گستردهتری در دسترس قرار خواهد داد. افزونه کروم برای همه کاربران Max در دسترس خواهد بود، در حالی که مدل متمرکز بر اکسل برای کاربران Max، Team و Enterprise در دسترس خواهد بود.
Opus 4.5 همچنین با بهبودهایی در حافظه برای عملیات با زمینه طولانی عرضه میشود که نیازمند تغییرات قابل توجهی در نحوه مدیریت حافظه توسط مدل بود.
دین پِن، مدیر محصول تحقیقاتی Anthropic، به TechCrunch گفت: "بهبودهایی در کیفیت کلی زمینه طولانی در آموزش با Opus 4.5 ایجاد کردهایم، اما پنجرههای زمینه به تنهایی کافی نخواهند بود." "دانستن جزئیات مناسب برای به خاطر سپردن در کنار داشتن یک پنجره زمینه طولانیتر بسیار مهم است."
این تغییرات همچنین قابلیت "چت بیپایان" را که مدتها مورد درخواست کاربران پولی Claude بود، فعال کرده است. این قابلیت به چتها اجازه میدهد بدون وقفه ادامه یابند، حتی زمانی که مدل به پنجره زمینه خود میرسد. در عوض، مدل حافظه زمینه خود را فشرده میکند بدون اینکه به کاربر اطلاع دهد.
بسیاری از ارتقاءها با نگاهی به موارد استفاده عاملمحور (agentic use cases) انجام شدهاند، به ویژه سناریوهایی که Opus به عنوان یک عامل اصلی فرماندهی گروهی از زیرعاملهای مبتنی بر Haiku عمل میکند. مدیریت این وظایف نیازمند تسلط قوی بر حافظه کاری است، جایی که بهبودهای حافظه که توسط پن توضیح داده شد، ارزش واقعی خود را نشان میدهند.
پن میگوید: "اینجاست که اصول اساسی مانند حافظه واقعاً مهم میشوند، زیرا Claude باید بتواند پایگاههای کد و اسناد بزرگ را کاوش کند و همچنین بداند چه زمانی عقبنشینی کند و چیزی را دوباره بررسی کند."
Opus 4.5 با رقابت شدیدی از سوی سایر مدلهای پیشرفته که اخیراً منتشر شدهاند، روبرو خواهد شد، به ویژه GPT 5.1 OpenAI (منتشر شده در 12 نوامبر) و Gemini 3 گوگل (منتشر شده در 18 نوامبر).
این مقاله توسط هوش مصنوعی ترجمه شده است و ممکن است دارای اشکالاتی باشد. برای دقت بیشتر، میتوانید منبع اصلی را مطالعه کنید.



