امروز، شرکت مایکروسافت به طور رسمی از Phi-4-reasoning، یک مدل استدلال پیشرفته با 14 میلیارد پارامتر رونمایی کرد که ادعا میشود عملکرد قوی در وظایف استدلالی پیچیده ارائه میدهد. این مدل از طریق تنظیم دقیق نظارت شده Phi-4 روی مجموعهای از پرامپتهای گزینش شده که با استفاده از o3-mini تولید شده، آموزش داده شده است. مایکروسافت همچنین Phi-4-reasoning-plus را معرفی کرد، نسخهای 14 میلیارد پارامتری از Phi-4-reasoning که با تولید دنبالههای استدلالی طولانیتر، عملکرد بهتری ارائه میدهد.
Phi-4-reasoning چیست؟
Phi-4-reasoning یک مدل استدلال پیشرفته است که از چندین مدل بزرگتر با وزنهای باز، مانند DeepSeek-R1-Distill-Llama-70B عملکرد بهتری دارد. این مدل همچنین در برخی معیارها با سطح عملکرد مدل کامل DeepSeek-R1 برابری میکند. درحال حاضر، این مدل از Claude 3.7 Sonnet شرکت Anthropic و مدلهای Gemini 2 Flash Thinking گوگل در تمام وظایف به جز GPQA و برنامهریزی تقویم عملکرد بهتری دارد.
همچنین آموزش در Phi-4 از ابزارآلات مختلفی مانند DeepSeek-R1 و LLaMA 70B استفاده کرده است که نشان میدهد این مدل میتواند به خوبی از دانش موجود در دادههای بزرگ، یادگیری تقویتی و استدلال با استفاده از فنون مختلف زبان و مدلهای بیشتر در مورد برآوردن اجرای لحظهای برخی از جنبههای پیچیده بپردازد.
درگامی برای پیشرفت در مدلسازی استدلال و کاهش تعادل در تعامل انسان و کامپیوتر این مدلها گامی مهم در دستیابی به موارد پیشرفتی در این زمینه است. علاوه بر این، حضور کارشناسان زبانها و برنامهنویسان را برای استفاده بهینه از منبع دانش این مدلها حیاتی میکند.
این مدل محدودیتهایی دارد. اولاً، Phi-4 عمدتاً با متن انگلیسی کار میکند و کار کردن با زبانهای دیگر ممکن است نیاز به تنظیمات اضافی داشته باشد. دوماً، این مدل عمدتاً روی پایتون با استفاده از بستههای کدنویسی رایج آموزش دیده است. سوماً، طول متن ورودی آن فقط 32 هزار توکن است.
یاچینگی انجام دادن-task برای تسریع تحقیقات در مورد مدلهای زبانی طراحی شدهاند. انتظار میرود این مدلها برای توسعه کاربردهای هوش مصنوعی در محیطهای با محدودیت حافظه یا محاسبات، سناریوهای محدود به تأخیر، و وظایف با تمرکز بر استدلال مفید باشند. از این به بعد انتظار داریم مدلهای Phi-4 در زمینههای خاص و پیشرفته به روز شود.
راههای ممکن برای ورود به صحنه تشخیص استدلال
* برای آغاز تحقیقات، استفاده از این مدلها در زمینههای مختلف استدلال شامل از زندگی روزمره گرفته تا وظایف آموزشی است. دراین راستا، مهمتر از استفاده از آن، رساندن آن به کل دسترسی بین کارشناسان درمیان جهانی زبانهای مختلف برای آموزش بیشتر و مطمئن، و آنها را در فرایند استدلال پاسخگو کمک به جلو بردن اثرات مثبت آن در این حوزهای در آن خواهد بود.
* فردا، برخی از محدودیتهای Phi-4 محدود به دانش پروگرامنویسی و محدوده فراگیری آن است. برای ابتدا، استفاده از آن به عنوان یک ادبیات خاص رازی برای آن به همه تربیت کنده تا از آن در استفادههای مختلف بهره میبرند.