عنوان:

خرابی لاما ۴ متا: آیا یک شرکت فناوری به تقلب در رقابت بنچمارک‌ها روی آورد؟

در جهان فناوری، رقابت بنچمارک‌ها (ارزیابی‌ها) برای پلتفرم‌های مختلف یک موضوع مهم است. اخیراً، شرکت متا با انتشار خانواده جدید از مدل‌های زبان بزرگ، شامل «اسکوت» (Scout)، «ماوریک» (Maverick) و «بهیموث» (Behemoth)، اذهان را به خود جلب کرد. مدل «لاما ۴ ماوریک» (Llama-4-Maverick-03-26-Experimental) از این خانواده، در بنچمارک‌ها عملکردی بسیار قوی نشان داد و پس از «جی‌امینی ۲.۵ پرو» (Gemini 2.5 Pro)، در رتبه دوم قرار گرفت. اما این پیروزی در مدتی کوتاه تغییر کرد.

بحث دور از انتظار و نه چندان خوشاهلی

تقریباً در همین زمان، معلوم شد که مدل ماوریکی که در بنچمارک‌ها استفاده شده بود، از نسخه‌ای که به عموم منتشر شده بود، متفاوت است. کاربران شرکت متا، این تفاوت را یافته و این موضوع، اتهاماتی مبنی بر تقلب را علیه شرکت متا به ارمغان آورد. تعجب‌انگیزتر از این، یک مدیر اجرایی متا در شبکه اجتماعی ایکس (X) در این خصاخت انتقاد شد. وی اعلام کرد که الشركة منّی‌اً عذرخواهی می‌کند و می‌گوید به‌جای در دسترس قرار دادن یک نسخه قالب‌دار، مدل‌ها را بدون خاصیت را به‌صورت کامل به عموم عرضه می‌کند. افزون بر این، پلتفرم ال‌ام‌آرنا (LMArena) رسماً اعلام کرد که متا از سیاست‌های آن پیروی نکرده است.

تصحیح اوضاع با یک درگاه

سخنگوی متا در یک بیانیه، گفت که مدل Llama-4-Maverick-03-26-Experimental صرفاً برای گفتگو (چت) طراحی شده بود. وی اعلام کرد که شرکت متا خوش‌حال است که مدل‌های متن‌بازش را منتشر کرده است. وی همچنین اضافه کرد که پلتفرم‌های مختلف، طرح‌های مختلفی دارند و ممکن است Model‌ (مدل) رفتارهای متفاوتی را پیش ببرد. در آخر، این سخنگوی متا گفت که به تعجب COMPANY happiest است که اوقول می‌تواند مشتریانش با این new Models z کار کنند.

کسان می‌گویند و دیگران بفی عینی ببیندند

کوشیدیم به تناوب آی طرفلا دراین تااخ بر این مدل ببینیم یا برین نظیر ها و برایاند چه می‌نماید?

توسط nastoor.ir