شیائومی از پیشرفته‌ترین مدل زبانی خود رونمایی کرد؛ رقیبی سریع و ارزان برای Claude و DeepSeek

دیجیاتو پنج شنبه 27 آذر 1404 - 13:34

این مدل بر سرعت پردازش، معماری بهینه و توانمندی بالا در استدلال و تولید کد تمرکز دارد. The post شیائومی از پیشرفته‌ترین مدل زبانی خود رونمایی کرد؛ رقیبی سریع و ارزان برای Claude و DeepSeek appeared first on دیجیاتو.

شیائومی از پیشرفته‌ترین مدل زبانی متن‌باز خود با نام MiMo-V2-Flash رونمایی کرد. این مدل که بخشی از سرمایه‌گذاری جدی این شرکت در حوزه هوش مصنوعی محسوب می‌شود، بر سرعت پردازش، معماری بهینه و توانمندی بالا در استدلال و تولید کد تمرکز دارد. این ویژگی‌ها MiMo-V2-Flash را به رقیب جدی برای مدل‌هایی مانند DeepSeek V3.2 و Claude 4.5 Sonnet تبدیل می‌کند.

MiMo-V2-Flash یک مدل با معماری Mixture-of-Experts (MoE به معنای ترکیب متخصصان) است که از 309 میلیارد پارامتر کلی و 15 میلیارد پارامتر فعال پشتیبانی می‌کند. این مدل به‌طور خاص برای سناریوهای مبتنی بر ایجنت هوش مصنوعی و تعاملات چندمرحله‌ای طراحی شده که سرعت استنتاج نقش کلیدی در آنها دارد.

به‌گفته شیائومی، این طراحی باعث حفظ بهره‌وری بالا در وظایف با موضوعات طولانی شده و درعین‌حال هزینه عملیاتی را کاهش می‌دهد. ادعای شرکت این است که MiMo-V2-Flash در بسیاری از سناریوها سریع‌تر از DeepSeek و Claude خروجی تولید می‌کند.

عملکرد مدل شیائومی در بنچمارک‌ها

نتایج بنچمارک‌ها نشان می‌دهد MiMo-V2-Flash در سطح بالایی از مدل‌های متن‌باز قرار دارد. این مدل در آزمون‌های استدلالی مانند AIME 2025 و GPQA-Diamond جزو دو مدل برتر متن‌باز بوده است.

در بنچمارک‌های مهندسی نرم‌افزار مثل SWE-Bench Verified و SWE-Bench Multilingual هم عملکرد MiMo-V2-Flash از سایر مدل‌های متن‌باز بهتر بوده و به سطح مدل‌هایی مانند GPT-5 و Claude 4.5 Sonnet نزدیک شده است.

قیمت API این مدل برابر با 0.1 دلار به ازای هر یک میلیون توکن ورودی و 0.3 دلار به ازای هر یک میلیون توکن خروجی تعیین شده و در‌حال‌حاضر برای مدت محدود به‌صورت رایگان در دسترس است. طبق اعلام شیائومی، سرعت تولید پاسخ این مدل به 150 توکن در ثانیه می‌رسد، درحالی که تنها 2.5 درصد از هزینه استنتاج Claude را دارد.

نوآوری‌های فنی شیائومی MiMo-V2-Flash

یکی از نوآوری‌های کلیدی MiMo-V2-Flash استفاده از فناوری Multi-Token Prediction (MTP) است که امکان تولید همزمان چند توکن و بررسی آنها پیش از نمایش خروجی نهایی را فراهم می‌کند. همچنین شیائومی روش جدیدی به‌نام Multi-Teacher Online Policy Distillation (MOPD) را معرفی کرده که با استفاده از چند مدل دستیار و پاداش‌دهی در سطح توکن، نیاز به منابع آموزشی سنگین را به‌شدت کاهش می‌دهد.

شیائومی برای استفاده از مدل خود پلتفرمی با نام MiMo Studio را راه‌اندازی کرده که امکان گفتگو مستقیم با مدل، جستجوی وب، اجرای ایجنت‌ها و تولید کد را فراهم می‌کند. این مدل همچنین توانایی تولید صفحات HTML کاربردی را دارد و با ابزارهایی مانند Claude Code و Cursor سازگار است.

مشاهده متن کامل خبر در "دیجیاتو"

شیائومی از پیشرفته‌ترین مدل زبانی خود رونمایی کرد؛ رقیبی سریع و ارزان برای Claude و DeepSeek

عملکرد مدل شیائومی در بنچمارک‌ها

نوآوری‌های فنی شیائومی MiMo-V2-Flash

بیشتر بخوانید