عنوان:
خرابی لاما ۴ متا: آیا یک شرکت فناوری به تقلب در رقابت بنچمارکها روی آورد؟
در جهان فناوری، رقابت بنچمارکها (ارزیابیها) برای پلتفرمهای مختلف یک موضوع مهم است. اخیراً، شرکت متا با انتشار خانواده جدید از مدلهای زبان بزرگ، شامل «اسکوت» (Scout)، «ماوریک» (Maverick) و «بهیموث» (Behemoth)، اذهان را به خود جلب کرد. مدل «لاما ۴ ماوریک» (Llama-4-Maverick-03-26-Experimental) از این خانواده، در بنچمارکها عملکردی بسیار قوی نشان داد و پس از «جیامینی ۲.۵ پرو» (Gemini 2.5 Pro)، در رتبه دوم قرار گرفت. اما این پیروزی در مدتی کوتاه تغییر کرد.
بحث دور از انتظار و نه چندان خوشاهلی
تقریباً در همین زمان، معلوم شد که مدل ماوریکی که در بنچمارکها استفاده شده بود، از نسخهای که به عموم منتشر شده بود، متفاوت است. کاربران شرکت متا، این تفاوت را یافته و این موضوع، اتهاماتی مبنی بر تقلب را علیه شرکت متا به ارمغان آورد. تعجبانگیزتر از این، یک مدیر اجرایی متا در شبکه اجتماعی ایکس (X) در این خصاخت انتقاد شد. وی اعلام کرد که الشركة منّیاً عذرخواهی میکند و میگوید بهجای در دسترس قرار دادن یک نسخه قالبدار، مدلها را بدون خاصیت را بهصورت کامل به عموم عرضه میکند. افزون بر این، پلتفرم الامآرنا (LMArena) رسماً اعلام کرد که متا از سیاستهای آن پیروی نکرده است.
تصحیح اوضاع با یک درگاه
سخنگوی متا در یک بیانیه، گفت که مدل Llama-4-Maverick-03-26-Experimental صرفاً برای گفتگو (چت) طراحی شده بود. وی اعلام کرد که شرکت متا خوشحال است که مدلهای متنبازش را منتشر کرده است. وی همچنین اضافه کرد که پلتفرمهای مختلف، طرحهای مختلفی دارند و ممکن است Model (مدل) رفتارهای متفاوتی را پیش ببرد. در آخر، این سخنگوی متا گفت که به تعجب COMPANY happiest است که اوقول میتواند مشتریانش با این new Models z کار کنند.
کسان میگویند و دیگران بفی عینی ببیندند
کوشیدیم به تناوب آی طرفلا دراین تااخ بر این مدل ببینیم یا برین نظیر ها و برایاند چه مینماید?