میسترال با مدلهای مرزی جدید و مدلهای کوچک "اوپنویت" به رقبای بزرگ هوش مصنوعی نزدیک میشود

- تمرکز بر مدلهای کوچکتر و قابل سفارشیسازی برای استفاده سازمانی، با این استدلال که برخلاف مدلهای بسته و پرهزینه، در صورت تنظیم دقیق (finetuning)، مقرونبهصرفهتر و کارآمدتر هستند.
- تأکید بر استقرار روی دستگاه (ondevice deployment)*- و هوش مصنوعی برای همه، با هدف دموکراتیزه کردن قابلیتهای پیشرفته هوش مصنوعی فراتر از آزمایشگاههای بزرگ فناوری و APIهای ابری.
استارتاپ فرانسوی هوش مصنوعی Mistral روز سهشنبه خانواده جدید مدلهای اوپنویت خود به نام Mistral 3 را عرضه کرد؛ عرضهای که هدفش اثبات توانایی رهبری در دسترسپذیر کردن عمومی هوش مصنوعی و خدمترسانی بهتر به مشتریان تجاری نسبت به رقبای بزرگ فناوری است.
این عرضه شامل ۱۰ مدل است که یک مدل مرزی بزرگ با قابلیتهای چندوجهی و چندزبانه و نه مدل کوچکتر با قابلیت آفلاین و کاملاً قابل سفارشیسازی را در بر میگیرد.
این عرضه در حالی صورت میگیرد که میسترال، که مدلهای زبان اوپنویت و چتبات هوش مصنوعی متمرکز بر اروپا به نام Le Chat را توسعه میدهد، به نظر میرسد در حال تعقیب مدلهای مرزی متنبستهی برخی از شرکتهای دره سیلیکون بوده است. مدلهای اوپنویت وزنهای مدل خود را به صورت عمومی منتشر میکنند تا هر کسی بتواند آنها را دانلود و اجرا کند. در مقابل، مدلهای متنبست، مانند ChatGPT اوپنایآی، وزنهای خود را اختصاصی نگه میدارند و فقط از طریق APIها یا رابطهای کنترلشده دسترسی را فراهم میکنند.
این استارتاپ دو ساله که توسط محققان سابق DeepMind و Meta تأسیس شده، تا به امروز حدود ۲.۷ میلیارد دلار با ارزشگذاری ۱۳.۷ میلیارد دلار جمعآوری کرده است – که در مقایسه با اعداد و ارقام رقبایی مانند OpenAI (۵۷ میلیارد دلار جمعآوری شده با ارزشگذاری ۵۰۰ میلیارد دلار) و Anthropic (۴۵ میلیارد دلار جمعآوری شده با ارزشگذاری ۳۵۰ میلیارد دلار) ناچیز است.
اما میسترال در تلاش است تا ثابت کند که بزرگتر همیشه بهتر نیست – به خصوص برای موارد استفاده سازمانی.
گیوم لمپل، همبنیانگذار و دانشمند ارشد میسترال، در مصاحبه با TechCrunch گفت: «مشتریان ما گاهی اوقات از شروع با یک مدل [بسته] بسیار بزرگ که نیازی به تنظیم دقیق ندارند، خوشحال میشوند… اما وقتی آن را مستقر میکنند، متوجه میشوند که گران است و کند است.» «سپس آنها به سراغ ما میآیند تا مدلهای کوچک را برای رسیدگی به مورد استفاده [به طور کارآمدتر] تنظیم دقیق کنند.»
لمپل ادامه داد: «در عمل، اکثریت قریب به اتفاق موارد استفاده سازمانی چیزهایی هستند که میتوانند توسط مدلهای کوچک، به خصوص اگر آنها را تنظیم دقیق کنید، حل شوند.»
مقایسههای اولیه بنچمارک که مدلهای کوچکتر میسترال را بسیار عقبتر از رقبای متنبست خود قرار میدهند، میتواند گمراهکننده باشد، لمپل گفت. مدلهای بزرگ متنبست ممکن است خارج از جعبه عملکرد بهتری داشته باشند، اما سود واقعی زمانی اتفاق میافتد که شما سفارشیسازی میکنید.
او گفت: «در بسیاری از موارد، شما در واقع میتوانید با مدلهای متنبست رقابت کنید یا حتی از آنها بهتر عمل کنید.»
فرانسویها در حال پخت و پز هستند 👀
Ministral 3 8B 2512, Vision, Apache 2.0 pic.twitter.com/kUAvgSGoqX
— Xeophon @ NeurIPS 🇺🇸 (@xeophon_) November 30, 2025
مدل مرزی بزرگ میسترال، با نام Mistral Large 3، برخی از قابلیتهای مهم مدلهای هوش مصنوعی بزرگ متنبست مانند GPT-4o اوپنایآی و Gemini 2 گوگل را پوشش میدهد، در حالی که با چندین رقیب اوپنویت نیز رقابت میکند. Large 3 یکی از اولین مدلهای مرزی باز با قابلیتهای چندوجهی و چندزبانه در یک بسته است و آن را همسطح Llama 3 متا و Qwen3-Omni علیبابا قرار میدهد. بسیاری از شرکتهای دیگر در حال حاضر مدلهای زبان بزرگ چشمگیر را با مدلهای کوچکتر چندوجهی جداگانه جفت میکنند، کاری که میسترال قبلاً با مدلهایی مانند Pixtral و Mistral Small 3.1 انجام داده بود.
Large 3 همچنین دارای معماری "Mixture of Experts دانهریز" با ۴۱ میلیارد پارامتر فعال و ۶۷۵ میلیارد پارامتر کل است که استدلال کارآمد را در پنجره زمینه ۲۵۶,۰۰۰ فراهم میکند. این طراحی هم سرعت و هم قابلیت را ارائه میدهد و به آن اجازه میدهد اسناد طولانی را پردازش کند و به عنوان یک دستیار عامل برای وظایف پیچیده سازمانی عمل کند. میسترال Large 3 را برای تجزیه و تحلیل اسناد، کدنویسی، تولید محتوا، دستیاران هوش مصنوعی و اتوماسیون گردش کار مناسب میداند.
با خانواده جدید مدلهای کوچک خود، به نام Ministral 3، این شرکت ادعای جسورانهای دارد که مدلهای کوچک نه تنها کافی هستند – بلکه برتر هستند.
این مجموعه شامل نه مدل متراکم با کارایی بالا در سه اندازه (۱۴ میلیارد، ۸ میلیارد و ۳ میلیارد پارامتر) و سه نوع است: Base (مدل پایه از پیش آموزشدیده)، Instruct (بهینهشده برای چت و گردش کار سبک دستیار) و Reasoning (بهینهشده برای منطق پیچیده و وظایف تحلیلی).
میسترال میگوید این طیف به توسعهدهندگان و کسبوکارها انعطافپذیری میدهد تا مدلها را با عملکرد دقیق خود مطابقت دهند، چه به دنبال عملکرد خام، کارایی هزینه یا قابلیتهای تخصصی باشند. این شرکت ادعا میکند که Ministral 3 در امتیازدهی همسطح یا بهتر از سایر رهبران اوپنویت عمل میکند و در عین حال کارآمدتر است و توکنهای کمتری برای وظایف معادل تولید میکند. همه انواع از دید پشتیبانی میکنند، پنجرههای زمینه ۱۲۸,۰۰۰-۲۵۶,۰۰۰ را مدیریت میکنند و در زبانهای مختلف کار میکنند.
بخش بزرگی از این پیشنهاد، عملی بودن است. لمپل تاکید میکند که Ministral 3 میتواند روی یک GPU اجرا شود و آن را روی سختافزار مقرون به صرفه قابل استقرار میکند – از سرورهای داخلی گرفته تا لپتاپها، رباتها و سایر دستگاههای لبه که ممکن است اتصال محدودی داشته باشند. این نه تنها برای سازمانهایی که دادهها را در داخل نگه میدارند، بلکه برای دانشجویانی که به دنبال بازخورد آفلاین هستند یا تیمهای رباتیک که در محیطهای دورافتاده فعالیت میکنند، اهمیت دارد. لمپل استدلال میکند که کارایی بیشتر مستقیماً به دسترسی گستردهتر ترجمه میشود.
او گفت: «بخشی از مأموریت ما این است که اطمینان حاصل کنیم هوش مصنوعی برای همه، به خصوص افرادی که دسترسی به اینترنت ندارند، قابل دسترس است.» «ما نمیخواهیم هوش مصنوعی فقط توسط چند آزمایشگاه بزرگ کنترل شود.»
برخی دیگر از شرکتها نیز در حال پیگیری بدهبستانهای مشابهی در زمینه کارایی هستند: آخرین مدل سازمانی Cohere، Command A، نیز فقط روی دو GPU اجرا میشود و پلتفرم عامل هوش مصنوعی آن North میتواند فقط روی یک GPU اجرا شود.
این نوع دسترسی، تمرکز فیزیکی رو به رشد میسترال بر هوش مصنوعی را هدایت میکند. اوایل سال جاری، این شرکت شروع به کار بر روی ادغام مدلهای کوچکتر خود در رباتها، پهپادها و وسایل نقلیه کرد. میسترال با آژانس علوم و فناوری تیم خانگی سنگاپور (HTX) برای مدلهای تخصصی برای رباتها، سیستمهای امنیت سایبری و ایمنی آتشنشانی؛ با استارتاپ فناوری دفاعی آلمانی Helsing برای مدلهای بینایی-زبان-عمل برای پهپادها؛ و با خودروساز Stellantis برای یک دستیار هوش مصنوعی در خودرو همکاری میکند.
برای میسترال، قابلیت اطمینان و استقلال به اندازه عملکرد حیاتی هستند.
لمپل گفت: «استفاده از API رقبای ما که هر دو هفته نیم ساعت از کار میافتد – اگر شرکت بزرگی هستید، نمیتوانید این را تحمل کنید.»
این مقاله توسط هوش مصنوعی ترجمه شده است و ممکن است دارای اشکالاتی باشد. برای دقت بیشتر، میتوانید منبع اصلی را مطالعه کنید.



