AI

عامل SIMA 2 گوگل از جمنای برای استدلال و اقدام در دنیاهای مجازی استفاده می‌کند

5 دقیقه مطالعه
منبع
عامل SIMA 2 گوگل از جمنای برای استدلال و اقدام در دنیاهای مجازی استفاده می‌کند
چکیده کوتاه
- سایما ۲ (SIMA 2)، هوش زبانی و استدلالی جمینای (Gemini)*- را با هوش مصنوعی تجسم‌یافته (embodied AI) ترکیب می‌کند و امکان تکمیل وظایف پیچیده را در محیط‌های سه‌بعدی جدید فراهم می‌آورد.
- این پیشرفت در هوش مصنوعی عمومی (AGI)*- به عامل‌ها اجازه می‌دهد تا از طریق بازخورد مبتنی بر هوش مصنوعی یاد بگیرند و خود را بهبود بخشند، که راه را برای ربات‌های همه‌کاره‌تر هموار می‌کند.
- سایما ۲ فراتر از بازی، جهشی را در درک و اجرای دستورالعمل‌های ظریف و واقعی نشان می‌دهد.

گوگل دیپ‌مایند روز پنجشنبه پیش‌نمایش تحقیقاتی SIMA 2 را منتشر کرد، نسل بعدی عامل هوش مصنوعی عمومی آن که قدرت زبان و استدلال جمنای، مدل زبان بزرگ گوگل را ادغام می‌کند تا فراتر از صرفاً دنبال کردن دستورالعمل‌ها، به درک و تعامل با محیط خود بپردازد.

مانند بسیاری از پروژه‌های دیپ‌مایند، از جمله AlphaFold، نسخه اول SIMA بر روی صدها ساعت داده بازی ویدیویی آموزش داده شد تا یاد بگیرد چگونه بازی‌های سه‌بعدی متعدد را مانند انسان انجام دهد، حتی برخی بازی‌هایی که روی آن‌ها آموزش ندیده بود. SIMA 1، که در مارس ۲۰۲۴ معرفی شد، می‌توانست دستورالعمل‌های اولیه را در طیف وسیعی از محیط‌های مجازی دنبال کند، اما تنها با نرخ موفقیت ۳۱٪ وظایف پیچیده را تکمیل می‌کرد، در مقایسه با ۷۱٪ برای انسان‌ها.

جو مارینو، دانشمند ارشد تحقیقاتی در دیپ‌مایند، در یک جلسه مطبوعاتی گفت: «SIMA 2 یک تغییر گام به گام و بهبود در قابلیت‌ها نسبت به SIMA 1 است. این یک عامل عمومی‌تر است. این عامل می‌تواند وظایف پیچیده را در محیط‌های جدید و دیده نشده انجام دهد. و یک عامل خودبهبوددهنده است. بنابراین می‌تواند بر اساس تجربه خود خود را بهبود بخشد، که گامی به سوی ربات‌های کاربرد عمومی‌تر و سیستم‌های AGI به طور کلی است.»

SIMA 2 با مدل Gemini 2.5 flash-lite کار می‌کند و AGI به هوش عمومی مصنوعی اشاره دارد، که دیپ‌مایند آن را سیستمی قادر به انجام طیف وسیعی از وظایف فکری با توانایی یادگیری مهارت‌های جدید و تعمیم دانش در حوزه‌های مختلف تعریف می‌کند.

محققان دیپ‌مایند می‌گویند کار با آنچه "عامل‌های تجسم‌یافته" نامیده می‌شود، برای هوش تعمیم‌یافته حیاتی است. مارینو توضیح داد که یک عامل تجسم‌یافته از طریق یک بدن با دنیای فیزیکی یا مجازی تعامل می‌کند - ورودی‌ها را مشاهده کرده و اقداماتی را درست مانند یک ربات یا انسان انجام می‌دهد - در حالی که یک عامل غیرتجسم‌یافته ممکن است با تقویم شما تعامل داشته باشد، یادداشت بردارد یا کد را اجرا کند.

جین وانگ، دانشمند ارشد تحقیقاتی در دیپ‌مایند با سابقه در علوم اعصاب، به تک‌کرانچ گفت که SIMA 2 بسیار فراتر از گیم‌پلی است.

وانگ گفت: «ما از آن می‌خواهیم که واقعاً بفهمد چه اتفاقی می‌افتد، بفهمد کاربر از آن چه می‌خواهد، و سپس بتواند به روشی منطقی و مبتنی بر عقل سلیم پاسخ دهد که در واقع بسیار دشوار است.»

با ادغام جمنای، SIMA 2 عملکرد پیشین خود را دو برابر کرد و توانایی‌های پیشرفته زبان و استدلال جمنای را با مهارت‌های تجسم‌یافته توسعه‌یافته از طریق آموزش ترکیب کرد.

مارینو SIMA 2 را در بازی "No Man’s Sky" نمایش داد، جایی که عامل محیط اطراف خود - سطح یک سیاره سنگی - را توصیف کرد و با تشخیص و تعامل با یک فانوس دریایی اضطراری، گام‌های بعدی خود را تعیین کرد. SIMA 2 همچنین از جمنای برای استدلال داخلی استفاده می‌کند. در بازی دیگری، وقتی از آن خواسته شد به خانه‌ای که رنگ گوجه‌فرنگی رسیده است برود، عامل تفکر خود را نشان داد - گوجه‌فرنگی رسیده قرمز است، بنابراین من باید به خانه قرمز بروم - سپس آن را پیدا کرد و به سمت آن رفت.

مارینو گفت که مجهز بودن به جمنای همچنین به این معنی است که SIMA 2 دستورالعمل‌ها را بر اساس ایموجی‌ها دنبال می‌کند: "شما به آن 🪓🌲 دستور می‌دهید، و آن درخت را قطع می‌کند."

مارینو همچنین نشان داد که چگونه SIMA 2 می‌تواند در دنیاهای جدید و واقع‌گرایانه تولید شده توسط Genie، مدل دنیای دیپ‌مایند، حرکت کند و اشیایی مانند نیمکت‌ها، درختان و پروانه‌ها را به درستی شناسایی و با آن‌ها تعامل کند.

مارینو افزود که جمنای همچنین امکان خودبهبودبخشی را بدون نیاز به داده‌های زیاد انسانی فراهم می‌کند. در حالی که SIMA 1 به طور کامل بر روی گیم‌پلی انسانی آموزش دیده بود، SIMA 2 از آن به عنوان یک پایه برای ارائه یک مدل اولیه قوی استفاده می‌کند. هنگامی که تیم عامل را در یک محیط جدید قرار می‌دهد، از مدل جمنای دیگری می‌خواهد تا وظایف جدیدی ایجاد کند و یک مدل پاداش جداگانه برای امتیازدهی به تلاش‌های عامل. با استفاده از این تجربیات خودساخته به عنوان داده‌های آموزشی، عامل از اشتباهات خود درس می‌گیرد و به تدریج عملکرد بهتری پیدا می‌کند، اساساً رفتارهای جدید را از طریق آزمون و خطا مانند انسان، با راهنمایی بازخورد مبتنی بر هوش مصنوعی به جای انسان‌ها، به خود می‌آموزد.

دیپ‌مایند SIMA 2 را گامی به سوی باز کردن قفل ربات‌های کاربرد عمومی‌تر می‌بیند.

فردریک بس، مهندس ارشد تحقیقاتی در دیپ‌مایند، در یک جلسه مطبوعاتی گفت: «اگر به آنچه یک سیستم برای انجام وظایف در دنیای واقعی، مانند یک ربات، نیاز دارد فکر کنیم، فکر می‌کنم دو جزء دارد. اول، درک سطح بالا از دنیای واقعی و آنچه باید انجام شود، و همچنین مقداری استدلال وجود دارد.»

اگر از یک ربات انسان‌نما در خانه خود بخواهید بررسی کند که چند قوطی لوبیا در کمد دارید، سیستم باید تمام مفاهیم مختلف - لوبیا چیست، کمد چیست - را درک کند و به آن مکان برود. بس می‌گوید SIMA 2 بیشتر به این رفتار سطح بالا می‌پردازد تا به اقدامات سطح پایین‌تر، که او آن را کنترل چیزهایی مانند مفاصل فیزیکی و چرخ‌ها می‌نامد.

این تیم از ارائه یک جدول زمانی مشخص برای پیاده‌سازی SIMA 2 در سیستم‌های رباتیک فیزیکی خودداری کرد. بس به تک‌کرانچ گفت که مدل‌های پایه رباتیک دیپ‌مایند که اخیراً معرفی شده‌اند - که همچنین می‌توانند در مورد دنیای فیزیکی استدلال کرده و برنامه‌های چند مرحله‌ای برای تکمیل یک مأموریت ایجاد کنند - به طور متفاوتی و جدا از SIMA آموزش دیده‌اند.

در حالی که هیچ جدول زمانی برای انتشار بیش از یک پیش‌نمایش از SIMA 2 وجود ندارد، وانگ به تک‌کرانچ گفت که هدف این است که به دنیا نشان دهیم دیپ‌مایند روی چه چیزی کار کرده است و ببینیم چه نوع همکاری‌ها و کاربردهای بالقوه‌ای امکان‌پذیر است.

این مقاله توسط هوش مصنوعی ترجمه شده است و ممکن است دارای اشکالاتی باشد. برای دقت بیشتر، می‌توانید منبع اصلی را مطالعه کنید.