امروز، شرکت مایکروسافت به طور رسمی از Phi-4-reasoning، یک مدل استدلال پیشرفته با 14 میلیارد پارامتر رونمایی کرد که ادعا می‌شود عملکرد قوی در وظایف استدلالی پیچیده ارائه می‌دهد. این مدل از طریق تنظیم دقیق نظارت شده Phi-4 روی مجموعه‌ای از پرامپت‌های گزینش شده که با استفاده از o3-mini تولید شده، آموزش داده شده است. مایکروسافت همچنین Phi-4-reasoning-plus را معرفی کرد، نسخه‌ای 14 میلیارد پارامتری از Phi-4-reasoning که با تولید دنباله‌های استدلالی طولانی‌تر، عملکرد بهتری ارائه می‌دهد.

Phi-4-reasoning چیست؟
Phi-4-reasoning یک مدل استدلال پیشرفته است که از چندین مدل بزرگتر با وزن‌های باز، مانند DeepSeek-R1-Distill-Llama-70B عملکرد بهتری دارد. این مدل همچنین در برخی معیارها با سطح عملکرد مدل کامل DeepSeek-R1 برابری می‌کند. درحال حاضر، این مدل از Claude 3.7 Sonnet شرکت Anthropic و مدل‌های Gemini 2 Flash Thinking گوگل در تمام وظایف به جز GPQA و برنامه‌ریزی تقویم عملکرد بهتری دارد.

همچنین آموزش در Phi-4 از ابزارآلات مختلفی مانند DeepSeek-R1 و LLaMA 70B استفاده کرده است که نشان می‌دهد این مدل می‌تواند به خوبی از دانش موجود در داده‌های بزرگ، یادگیری تقویتی و استدلال با استفاده از فنون مختلف زبان و مدل‌های بیشتر در مورد برآوردن اجرای لحظه‌ای برخی از جنبه‌های پیچیده بپردازد.

درگامی برای پیشرفت در مدل‌سازی استدلال و کاهش تعادل در تعامل انسان و کامپیوتر این مدل‌ها گامی مهم در دستیابی به موارد پیشرفتی در این زمینه است. علاوه بر این، حضور کارشناسان زبان‌ها و برنامه‌نویسان را برای استفاده بهینه از منبع دانش این مدل‌ها حیاتی می‌کند.

این مدل محدودیت‌هایی دارد. اولاً، Phi-4 عمدتاً با متن انگلیسی کار می‌کند و کار کردن با زبان‌های دیگر ممکن است نیاز به تنظیمات اضافی داشته باشد. دوماً، این مدل عمدتاً روی پایتون با استفاده از بسته‌های کدنویسی رایج آموزش دیده است. سوماً، طول متن ورودی آن فقط 32 هزار توکن است.

یاچینگی انجام دادن-task برای تسریع تحقیقات در مورد مدل‌های زبانی طراحی شده‌اند. انتظار می‌رود این مدل‌ها برای توسعه کاربردهای هوش مصنوعی در محیط‌های با محدودیت حافظه یا محاسبات، سناریوهای محدود به تأخیر، و وظایف با تمرکز بر استدلال مفید باشند. از این به بعد انتظار داریم مدل‌های Phi-4 در زمینه‌های خاص و پیشرفته به روز شود.

راه‌های ممکن برای ورود به صحنه تشخیص استدلال
* برای آغاز تحقیقات، استفاده از این مدل‌ها در زمینه‌های مختلف استدلال شامل از زندگی روزمره گرفته تا وظایف آموزشی است. دراین راستا، مهمتر از استفاده از آن، رساندن آن به کل دسترسی بین کارشناسان درمیان جهانی زبان‌های مختلف برای آموزش بیشتر و مطمئن، و آنها را در فرایند استدلال پاسخگو کمک به جلو بردن اثرات مثبت آن در این حوزه‌ای در آن خواهد بود.
* فردا، برخی از محدودیت‌های Phi-4 محدود به دانش پروگرام‌نویسی و محدوده فراگیری آن است. برای ابتدا، استفاده از آن به عنوان یک ادبیات خاص رازی برای آن به همه تربیت کنده تا از آن در استفاده‌های مختلف بهره می‌برند.

توسط nastoor.ir