عامل SIMA 2 گوگل از جمنای برای استدلال و اقدام در دنیاهای مجازی استفاده میکند

- این پیشرفت در هوش مصنوعی عمومی (AGI)*- به عاملها اجازه میدهد تا از طریق بازخورد مبتنی بر هوش مصنوعی یاد بگیرند و خود را بهبود بخشند، که راه را برای رباتهای همهکارهتر هموار میکند.
- سایما ۲ فراتر از بازی، جهشی را در درک و اجرای دستورالعملهای ظریف و واقعی نشان میدهد.
گوگل دیپمایند روز پنجشنبه پیشنمایش تحقیقاتی SIMA 2 را منتشر کرد، نسل بعدی عامل هوش مصنوعی عمومی آن که قدرت زبان و استدلال جمنای، مدل زبان بزرگ گوگل را ادغام میکند تا فراتر از صرفاً دنبال کردن دستورالعملها، به درک و تعامل با محیط خود بپردازد.
مانند بسیاری از پروژههای دیپمایند، از جمله AlphaFold، نسخه اول SIMA بر روی صدها ساعت داده بازی ویدیویی آموزش داده شد تا یاد بگیرد چگونه بازیهای سهبعدی متعدد را مانند انسان انجام دهد، حتی برخی بازیهایی که روی آنها آموزش ندیده بود. SIMA 1، که در مارس ۲۰۲۴ معرفی شد، میتوانست دستورالعملهای اولیه را در طیف وسیعی از محیطهای مجازی دنبال کند، اما تنها با نرخ موفقیت ۳۱٪ وظایف پیچیده را تکمیل میکرد، در مقایسه با ۷۱٪ برای انسانها.
جو مارینو، دانشمند ارشد تحقیقاتی در دیپمایند، در یک جلسه مطبوعاتی گفت: «SIMA 2 یک تغییر گام به گام و بهبود در قابلیتها نسبت به SIMA 1 است. این یک عامل عمومیتر است. این عامل میتواند وظایف پیچیده را در محیطهای جدید و دیده نشده انجام دهد. و یک عامل خودبهبوددهنده است. بنابراین میتواند بر اساس تجربه خود خود را بهبود بخشد، که گامی به سوی رباتهای کاربرد عمومیتر و سیستمهای AGI به طور کلی است.»

SIMA 2 با مدل Gemini 2.5 flash-lite کار میکند و AGI به هوش عمومی مصنوعی اشاره دارد، که دیپمایند آن را سیستمی قادر به انجام طیف وسیعی از وظایف فکری با توانایی یادگیری مهارتهای جدید و تعمیم دانش در حوزههای مختلف تعریف میکند.
محققان دیپمایند میگویند کار با آنچه "عاملهای تجسمیافته" نامیده میشود، برای هوش تعمیمیافته حیاتی است. مارینو توضیح داد که یک عامل تجسمیافته از طریق یک بدن با دنیای فیزیکی یا مجازی تعامل میکند - ورودیها را مشاهده کرده و اقداماتی را درست مانند یک ربات یا انسان انجام میدهد - در حالی که یک عامل غیرتجسمیافته ممکن است با تقویم شما تعامل داشته باشد، یادداشت بردارد یا کد را اجرا کند.
جین وانگ، دانشمند ارشد تحقیقاتی در دیپمایند با سابقه در علوم اعصاب، به تککرانچ گفت که SIMA 2 بسیار فراتر از گیمپلی است.
وانگ گفت: «ما از آن میخواهیم که واقعاً بفهمد چه اتفاقی میافتد، بفهمد کاربر از آن چه میخواهد، و سپس بتواند به روشی منطقی و مبتنی بر عقل سلیم پاسخ دهد که در واقع بسیار دشوار است.»
با ادغام جمنای، SIMA 2 عملکرد پیشین خود را دو برابر کرد و تواناییهای پیشرفته زبان و استدلال جمنای را با مهارتهای تجسمیافته توسعهیافته از طریق آموزش ترکیب کرد.

مارینو SIMA 2 را در بازی "No Man’s Sky" نمایش داد، جایی که عامل محیط اطراف خود - سطح یک سیاره سنگی - را توصیف کرد و با تشخیص و تعامل با یک فانوس دریایی اضطراری، گامهای بعدی خود را تعیین کرد. SIMA 2 همچنین از جمنای برای استدلال داخلی استفاده میکند. در بازی دیگری، وقتی از آن خواسته شد به خانهای که رنگ گوجهفرنگی رسیده است برود، عامل تفکر خود را نشان داد - گوجهفرنگی رسیده قرمز است، بنابراین من باید به خانه قرمز بروم - سپس آن را پیدا کرد و به سمت آن رفت.
مارینو گفت که مجهز بودن به جمنای همچنین به این معنی است که SIMA 2 دستورالعملها را بر اساس ایموجیها دنبال میکند: "شما به آن 🪓🌲 دستور میدهید، و آن درخت را قطع میکند."
مارینو همچنین نشان داد که چگونه SIMA 2 میتواند در دنیاهای جدید و واقعگرایانه تولید شده توسط Genie، مدل دنیای دیپمایند، حرکت کند و اشیایی مانند نیمکتها، درختان و پروانهها را به درستی شناسایی و با آنها تعامل کند.

مارینو افزود که جمنای همچنین امکان خودبهبودبخشی را بدون نیاز به دادههای زیاد انسانی فراهم میکند. در حالی که SIMA 1 به طور کامل بر روی گیمپلی انسانی آموزش دیده بود، SIMA 2 از آن به عنوان یک پایه برای ارائه یک مدل اولیه قوی استفاده میکند. هنگامی که تیم عامل را در یک محیط جدید قرار میدهد، از مدل جمنای دیگری میخواهد تا وظایف جدیدی ایجاد کند و یک مدل پاداش جداگانه برای امتیازدهی به تلاشهای عامل. با استفاده از این تجربیات خودساخته به عنوان دادههای آموزشی، عامل از اشتباهات خود درس میگیرد و به تدریج عملکرد بهتری پیدا میکند، اساساً رفتارهای جدید را از طریق آزمون و خطا مانند انسان، با راهنمایی بازخورد مبتنی بر هوش مصنوعی به جای انسانها، به خود میآموزد.
دیپمایند SIMA 2 را گامی به سوی باز کردن قفل رباتهای کاربرد عمومیتر میبیند.
فردریک بس، مهندس ارشد تحقیقاتی در دیپمایند، در یک جلسه مطبوعاتی گفت: «اگر به آنچه یک سیستم برای انجام وظایف در دنیای واقعی، مانند یک ربات، نیاز دارد فکر کنیم، فکر میکنم دو جزء دارد. اول، درک سطح بالا از دنیای واقعی و آنچه باید انجام شود، و همچنین مقداری استدلال وجود دارد.»
اگر از یک ربات انساننما در خانه خود بخواهید بررسی کند که چند قوطی لوبیا در کمد دارید، سیستم باید تمام مفاهیم مختلف - لوبیا چیست، کمد چیست - را درک کند و به آن مکان برود. بس میگوید SIMA 2 بیشتر به این رفتار سطح بالا میپردازد تا به اقدامات سطح پایینتر، که او آن را کنترل چیزهایی مانند مفاصل فیزیکی و چرخها مینامد.
این تیم از ارائه یک جدول زمانی مشخص برای پیادهسازی SIMA 2 در سیستمهای رباتیک فیزیکی خودداری کرد. بس به تککرانچ گفت که مدلهای پایه رباتیک دیپمایند که اخیراً معرفی شدهاند - که همچنین میتوانند در مورد دنیای فیزیکی استدلال کرده و برنامههای چند مرحلهای برای تکمیل یک مأموریت ایجاد کنند - به طور متفاوتی و جدا از SIMA آموزش دیدهاند.
در حالی که هیچ جدول زمانی برای انتشار بیش از یک پیشنمایش از SIMA 2 وجود ندارد، وانگ به تککرانچ گفت که هدف این است که به دنیا نشان دهیم دیپمایند روی چه چیزی کار کرده است و ببینیم چه نوع همکاریها و کاربردهای بالقوهای امکانپذیر است.
این مقاله توسط هوش مصنوعی ترجمه شده است و ممکن است دارای اشکالاتی باشد. برای دقت بیشتر، میتوانید منبع اصلی را مطالعه کنید.



