AI

Mixup، اپلیکیشن جدیدی به سبک Mad Libs برای ساخت تصاویر هوش مصنوعی از عکس‌ها، متن و نقاشی‌های دستی

5 دقیقه مطالعه
منبع
Mixup، اپلیکیشن جدیدی به سبک Mad Libs برای ساخت تصاویر هوش مصنوعی از عکس‌ها، متن و نقاشی‌های دستی
چکیده کوتاه
- Mixup با سیستم "دستور پخت" خود، ساخت تصاویر هوش مصنوعی را دموکراتیزه می‌کند و پرامپت‌های پیچیده را به تجربه‌ای ساده و پر از جای خالی تبدیل می‌کند تا کاربران بیشتری را درگیر کند.
- پرامپت‌های قابل اشتراک‌گذاری و "میکس‌شدنی‌ها" تجربه‌ای مشارکتی و شبیه به مهمانی را ترویج می‌دهند، که به عدم قطعیت هوش مصنوعی رسیدگی کرده و به کاربران قدرت کنترل خلاقانه را می‌دهد.

تیم سابق گوگل که پشت اپلیکیشن طراحی سه‌بعدی Rooms از Things, Inc. قرار دارد، با جدیدترین پروژه خود یعنی یک ویرایشگر عکس هوش مصنوعی به نام Mixup از راه رسیده است. این اپلیکیشن که فقط برای iOS عرضه شده، به هر کسی اجازه می‌دهد تا با استفاده از "دستورالعمل‌ها" (recipes) که شبیه به پر کردن جاهای خالی در سبک Mad Libs برای عکس‌ها، متن‌ها یا طرح‌های شما هستند، عکس‌های جدیدی با هوش مصنوعی بسازد.

به عنوان مثال، می‌توانید از Mixup بخواهید که طرح خط‌خطی شما را به یک نقاشی زیبای رنسانس تبدیل کند، یا حیوان خانگی شما را با یک لباس خنده‌دار هالووین بازسازی کند. می‌توانید از یک سلفی استفاده کنید تا ببینید با مدل موی متفاوت چگونه به نظر می‌رسید، یا چیزی حتی مسخره‌تر بسازید - مانند تصور دوستتان که به شکل Italian brainrot تبدیل شده است.

این اپلیکیشن بر پایه Nano Banana گوگل ساخته شده است، اما فرمت "دستورالعمل" راه جدیدی برای تعامل با مدل باز می‌کند و ابزار تولیدکننده را به یک بازی پارتی آنلاین تبدیل می‌کند.

جیسون تاف (Jason Toff)، بنیان‌گذار و مدیرعامل Things, Inc. که سابقه کار روی اپلیکیشن‌های آزمایشی در شرکت‌های بزرگ فناوری مانند گوگل و متا را دارد و همچنین مدتی مدیر محصول در توییتر بوده، می‌گوید: "چیزی که [Nano Banana] انجام داد و هیچ مدلی قبلاً انجام نداده بود، این بود که می‌توانست تصویر شما را بگیرد و آن را به شکلی قانع‌کننده حفظ کند که ترسناک نبود."

اما چیزی که استفاده از Mixup را به خصوص سرگرم‌کننده می‌کند این است که "دستورالعمل‌های" اپلیکیشن - یعنی پرامپت‌های تولید شده توسط کاربر - قابل اشتراک‌گذاری هستند.

تاف در مورد کاستی‌هایی که تیمش در چشم‌انداز فعلی هوش مصنوعی مشاهده کرده بود، می‌گوید: "هوش مصنوعی مولد بسیار قدرتمند است، و با این حال بیشتر اوقات شما به این ابزارها مراجعه می‌کنید و انگار می‌گوید، این جعبه متن شماست - چیزی خلاقانه پیدا کن. و شما چه می‌نویسید؟"

او ادامه می‌دهد: "و بنابراین، به جای اینکه مجبور باشید خلاق باشید و به این فکر کنید که چه چیزی بسازید، چیزی را می‌بینید که کار کرده است و می‌توانید فقط جاهای خالی را پر کنید."

پس از اینکه کاربران یک پرامپت جدید در Mixup ایجاد می‌کنند، می‌توانند آن را به همراه تصویر حاصله در یک فید عمومی منتشر کنند یا فقط برای استفاده شخصی دانلود کنند. از فید، کاربران دیگر می‌توانند تصویر را مشاهده کرده و روی دکمه کنار آن ضربه بزنند تا "دستورالعمل را امتحان کنند". این به هر کسی در اپلیکیشن اجازه می‌دهد تا از دستورالعمل برای تولید تصویری با استفاده از عکس، متن یا نقاشی‌های دستی خود استفاده کند. (نقاشی‌های دستی را می‌توان از طریق یک ویژگی ساده نقاشی درون‌برنامه‌ای ایجاد کرد.)

این تیم معتقد است که دیدن یک عکس در کنار دستورالعملی که آن را ایجاد کرده است، می‌تواند به حل ماهیت غیرقابل پیش‌بینی تصاویر هوش مصنوعی مولد کمک کند.

تاف توضیح می‌دهد: "مشکل دیگر [با هوش مصنوعی مولد] چیزی بود که ما در داخل به آن مشکل 'دستگاه اسلات' می‌گفتیم، جایی که دکمه را فشار می‌دهید، چیزی بیرون می‌آید، دوباره فشار می‌دهید، چیز دیگری بیرون می‌آید، و شما احساس نمی‌کنید که کنترلی بر خروجی دارید."

با این حال، در Mixup، کاربران می‌توانند هم عکس و هم پرامپتی که آن را ایجاد کرده است را در یک مکان ببینند و ایده‌ای از ظاهر خروجی خود به دست آورند. آن‌ها همچنین می‌توانند دکمه‌ای را برای دیدن تصویر قبل و بعد تغییر دهند، اگر خالق آن گزینه را فعال کرده باشد.

علاوه بر این، مشابه اپلیکیشن ویدیوی هوش مصنوعی Sora از OpenAI، کاربران می‌توانند عکس‌های خود را در Mixup آپلود کنند تا در تصاویر هوش مصنوعی خود استفاده کنند. اگر این کار را انجام دهید، هر کسی که در اپلیکیشن دنبال می‌کنید نیز می‌تواند با شباهت شما تصاویر هوش مصنوعی بسازد - قابلیتی که آن را "mixables" می‌نامند.

این شرکت تصور می‌کند که گروه‌هایی از دوستان یکدیگر را دنبال کنند تا از این ویژگی بهره‌مند شوند، اما یک طبقه خالق نیز می‌تواند در این پلتفرم ظهور کند - اگر از دیدن خودشان در ترکیب‌های عجیب و غریب باکی نداشته باشند. (البته، اگر نمی‌خواهید تصویر شما در دسترس باشد، یا آن را آپلود نکنید یا کسی را دنبال نکنید.)

این اپلیکیشن همچنین از فناوری OpenAI برای رسیدگی به برخی از نگرانی‌های مورد انتظار مربوط به تصاویر هوش مصنوعی استفاده می‌کند، اما تاف اذعان می‌کند که Mixup به شدت به کنترل‌های داخلی گوگل در مدل تصویر آن برای محدود کردن مواردی مانند محتوای جنسی یا خشونت متکی است.

در زمان عرضه، Mixup برای iOS 26 بهینه شده است اما از iOS 18 به بالا پشتیبانی می‌شود. اگر مورد استقبال قرار گیرد، ممکن است نسخه وب یا اپلیکیشن اندروید در آینده اضافه شود.

کاربران رایگان 100 اعتبار دریافت می‌کنند که معادل 4 دلار است. در همین حال، تولید هر تصویر تقریباً 4 سنت هزینه دارد. هنگامی که اعتبار تمام شود، کاربران می‌توانند در سطوح مختلف با 100، 250 یا 500 اعتبار در ماه مشترک شوند.

این اپلیکیشن در نیمه‌شب 21 نوامبر در اپ استور در سراسر جهان عرضه می‌شود، اما برای ورود به آن نیاز به دعوت‌نامه خواهید داشت. خوانندگان TechCrunch می‌توانند از کد TCHCRH (تا زمانی که تمام شود) برای ورود استفاده کنند. Mixup برای پیش‌خرید قبل از عرضه در دسترس است.

این پست پس از انتشار به‌روزرسانی شد تا اعلام شود که اپلیکیشن در تاریخ 21 نوامبر عرضه می‌شود، نه 20 نوامبر همانطور که قبلاً ذکر شده بود.

این مقاله توسط هوش مصنوعی ترجمه شده است و ممکن است دارای اشکالاتی باشد. برای دقت بیشتر، می‌توانید منبع اصلی را مطالعه کنید.