AI

میسترال با مدل‌های مرزی جدید و مدل‌های کوچک "اوپن‌ویت" به رقبای بزرگ هوش مصنوعی نزدیک می‌شود

6 دقیقه مطالعه
منبع
میسترال با مدل‌های مرزی جدید و مدل‌های کوچک "اوپن‌ویت" به رقبای بزرگ هوش مصنوعی نزدیک می‌شود
چکیده کوتاه
- Mistral AI با مدل‌های جدید Mistral 3، غول‌های فناوری را به چالش می‌کشد و دسترسی openweight و کارایی را برای کسب‌وکارها بر مدل‌های اختصاصی و بزرگ هوش مصنوعی ترجیح می‌دهد.
- تمرکز بر مدل‌های کوچک‌تر و قابل سفارشی‌سازی برای استفاده سازمانی، با این استدلال که برخلاف مدل‌های بسته و پرهزینه، در صورت تنظیم دقیق (finetuning)، مقرون‌به‌صرفه‌تر و کارآمدتر هستند.
- تأکید بر استقرار روی دستگاه (ondevice deployment)*- و هوش مصنوعی برای همه، با هدف دموکراتیزه کردن قابلیت‌های پیشرفته هوش مصنوعی فراتر از آزمایشگاه‌های بزرگ فناوری و APIهای ابری.

استارتاپ فرانسوی هوش مصنوعی Mistral روز سه‌شنبه خانواده جدید مدل‌های اوپن‌ویت خود به نام Mistral 3 را عرضه کرد؛ عرضه‌ای که هدفش اثبات توانایی رهبری در دسترس‌پذیر کردن عمومی هوش مصنوعی و خدمت‌رسانی بهتر به مشتریان تجاری نسبت به رقبای بزرگ فناوری است.

این عرضه شامل ۱۰ مدل است که یک مدل مرزی بزرگ با قابلیت‌های چندوجهی و چندزبانه و نه مدل کوچک‌تر با قابلیت آفلاین و کاملاً قابل سفارشی‌سازی را در بر می‌گیرد.

این عرضه در حالی صورت می‌گیرد که میسترال، که مدل‌های زبان اوپن‌ویت و چت‌بات هوش مصنوعی متمرکز بر اروپا به نام Le Chat را توسعه می‌دهد، به نظر می‌رسد در حال تعقیب مدل‌های مرزی متن‌بسته‌ی برخی از شرکت‌های دره سیلیکون بوده است. مدل‌های اوپن‌ویت وزن‌های مدل خود را به صورت عمومی منتشر می‌کنند تا هر کسی بتواند آن‌ها را دانلود و اجرا کند. در مقابل، مدل‌های متن‌بست، مانند ChatGPT اوپن‌ای‌آی، وزن‌های خود را اختصاصی نگه می‌دارند و فقط از طریق APIها یا رابط‌های کنترل‌شده دسترسی را فراهم می‌کنند.

این استارتاپ دو ساله که توسط محققان سابق DeepMind و Meta تأسیس شده، تا به امروز حدود ۲.۷ میلیارد دلار با ارزش‌گذاری ۱۳.۷ میلیارد دلار جمع‌آوری کرده است – که در مقایسه با اعداد و ارقام رقبایی مانند OpenAI (۵۷ میلیارد دلار جمع‌آوری شده با ارزش‌گذاری ۵۰۰ میلیارد دلار) و Anthropic (۴۵ میلیارد دلار جمع‌آوری شده با ارزش‌گذاری ۳۵۰ میلیارد دلار) ناچیز است.

اما میسترال در تلاش است تا ثابت کند که بزرگ‌تر همیشه بهتر نیست – به خصوص برای موارد استفاده سازمانی.

گیوم لمپل، هم‌بنیان‌گذار و دانشمند ارشد میسترال، در مصاحبه با TechCrunch گفت: «مشتریان ما گاهی اوقات از شروع با یک مدل [بسته‌] بسیار بزرگ که نیازی به تنظیم دقیق ندارند، خوشحال می‌شوند… اما وقتی آن را مستقر می‌کنند، متوجه می‌شوند که گران است و کند است.» «سپس آن‌ها به سراغ ما می‌آیند تا مدل‌های کوچک را برای رسیدگی به مورد استفاده [به طور کارآمدتر] تنظیم دقیق کنند.»

لمپل ادامه داد: «در عمل، اکثریت قریب به اتفاق موارد استفاده سازمانی چیزهایی هستند که می‌توانند توسط مدل‌های کوچک، به خصوص اگر آن‌ها را تنظیم دقیق کنید، حل شوند.»

مقایسه‌های اولیه بنچمارک که مدل‌های کوچک‌تر میسترال را بسیار عقب‌تر از رقبای متن‌بست خود قرار می‌دهند، می‌تواند گمراه‌کننده باشد، لمپل گفت. مدل‌های بزرگ متن‌بست ممکن است خارج از جعبه عملکرد بهتری داشته باشند، اما سود واقعی زمانی اتفاق می‌افتد که شما سفارشی‌سازی می‌کنید.

او گفت: «در بسیاری از موارد، شما در واقع می‌توانید با مدل‌های متن‌بست رقابت کنید یا حتی از آن‌ها بهتر عمل کنید.»

فرانسوی‌ها در حال پخت و پز هستند 👀

Ministral 3 8B 2512, Vision, Apache 2.0 pic.twitter.com/kUAvgSGoqX

— Xeophon @ NeurIPS 🇺🇸 (@xeophon_) November 30, 2025

مدل مرزی بزرگ میسترال، با نام Mistral Large 3، برخی از قابلیت‌های مهم مدل‌های هوش مصنوعی بزرگ متن‌بست مانند GPT-4o اوپن‌ای‌آی و Gemini 2 گوگل را پوشش می‌دهد، در حالی که با چندین رقیب اوپن‌ویت نیز رقابت می‌کند. Large 3 یکی از اولین مدل‌های مرزی باز با قابلیت‌های چندوجهی و چندزبانه در یک بسته است و آن را هم‌سطح Llama 3 متا و Qwen3-Omni علی‌بابا قرار می‌دهد. بسیاری از شرکت‌های دیگر در حال حاضر مدل‌های زبان بزرگ چشمگیر را با مدل‌های کوچک‌تر چندوجهی جداگانه جفت می‌کنند، کاری که میسترال قبلاً با مدل‌هایی مانند Pixtral و Mistral Small 3.1 انجام داده بود.

Large 3 همچنین دارای معماری "Mixture of Experts دانه‌ریز" با ۴۱ میلیارد پارامتر فعال و ۶۷۵ میلیارد پارامتر کل است که استدلال کارآمد را در پنجره زمینه ۲۵۶,۰۰۰ فراهم می‌کند. این طراحی هم سرعت و هم قابلیت را ارائه می‌دهد و به آن اجازه می‌دهد اسناد طولانی را پردازش کند و به عنوان یک دستیار عامل برای وظایف پیچیده سازمانی عمل کند. میسترال Large 3 را برای تجزیه و تحلیل اسناد، کدنویسی، تولید محتوا، دستیاران هوش مصنوعی و اتوماسیون گردش کار مناسب می‌داند.

با خانواده جدید مدل‌های کوچک خود، به نام Ministral 3، این شرکت ادعای جسورانه‌ای دارد که مدل‌های کوچک نه تنها کافی هستند – بلکه برتر هستند.

این مجموعه شامل نه مدل متراکم با کارایی بالا در سه اندازه (۱۴ میلیارد، ۸ میلیارد و ۳ میلیارد پارامتر) و سه نوع است: Base (مدل پایه از پیش آموزش‌دیده)، Instruct (بهینه‌شده برای چت و گردش کار سبک دستیار) و Reasoning (بهینه‌شده برای منطق پیچیده و وظایف تحلیلی).

میسترال می‌گوید این طیف به توسعه‌دهندگان و کسب‌وکارها انعطاف‌پذیری می‌دهد تا مدل‌ها را با عملکرد دقیق خود مطابقت دهند، چه به دنبال عملکرد خام، کارایی هزینه یا قابلیت‌های تخصصی باشند. این شرکت ادعا می‌کند که Ministral 3 در امتیازدهی هم‌سطح یا بهتر از سایر رهبران اوپن‌ویت عمل می‌کند و در عین حال کارآمدتر است و توکن‌های کمتری برای وظایف معادل تولید می‌کند. همه انواع از دید پشتیبانی می‌کنند، پنجره‌های زمینه ۱۲۸,۰۰۰-۲۵۶,۰۰۰ را مدیریت می‌کنند و در زبان‌های مختلف کار می‌کنند.

بخش بزرگی از این پیشنهاد، عملی بودن است. لمپل تاکید می‌کند که Ministral 3 می‌تواند روی یک GPU اجرا شود و آن را روی سخت‌افزار مقرون به صرفه قابل استقرار می‌کند – از سرورهای داخلی گرفته تا لپ‌تاپ‌ها، ربات‌ها و سایر دستگاه‌های لبه که ممکن است اتصال محدودی داشته باشند. این نه تنها برای سازمان‌هایی که داده‌ها را در داخل نگه می‌دارند، بلکه برای دانشجویانی که به دنبال بازخورد آفلاین هستند یا تیم‌های رباتیک که در محیط‌های دورافتاده فعالیت می‌کنند، اهمیت دارد. لمپل استدلال می‌کند که کارایی بیشتر مستقیماً به دسترسی گسترده‌تر ترجمه می‌شود.

او گفت: «بخشی از مأموریت ما این است که اطمینان حاصل کنیم هوش مصنوعی برای همه، به خصوص افرادی که دسترسی به اینترنت ندارند، قابل دسترس است.» «ما نمی‌خواهیم هوش مصنوعی فقط توسط چند آزمایشگاه بزرگ کنترل شود.»

برخی دیگر از شرکت‌ها نیز در حال پیگیری بده‌بستان‌های مشابهی در زمینه کارایی هستند: آخرین مدل سازمانی Cohere، Command A، نیز فقط روی دو GPU اجرا می‌شود و پلتفرم عامل هوش مصنوعی آن North می‌تواند فقط روی یک GPU اجرا شود.

این نوع دسترسی، تمرکز فیزیکی رو به رشد میسترال بر هوش مصنوعی را هدایت می‌کند. اوایل سال جاری، این شرکت شروع به کار بر روی ادغام مدل‌های کوچک‌تر خود در ربات‌ها، پهپادها و وسایل نقلیه کرد. میسترال با آژانس علوم و فناوری تیم خانگی سنگاپور (HTX) برای مدل‌های تخصصی برای ربات‌ها، سیستم‌های امنیت سایبری و ایمنی آتش‌نشانی؛ با استارتاپ فناوری دفاعی آلمانی Helsing برای مدل‌های بینایی-زبان-عمل برای پهپادها؛ و با خودروساز Stellantis برای یک دستیار هوش مصنوعی در خودرو همکاری می‌کند.

برای میسترال، قابلیت اطمینان و استقلال به اندازه عملکرد حیاتی هستند.

لمپل گفت: «استفاده از API رقبای ما که هر دو هفته نیم ساعت از کار می‌افتد – اگر شرکت بزرگی هستید، نمی‌توانید این را تحمل کنید.»

این مقاله توسط هوش مصنوعی ترجمه شده است و ممکن است دارای اشکالاتی باشد. برای دقت بیشتر، می‌توانید منبع اصلی را مطالعه کنید.