مقایسه Gemini و Claude با ۷ پرامپت؛ برنده کدام است؟

در مدت زمان کوتاهی، هوش مصنوعی از یک فناوری‌ حاشیه‌ای به ابزاری تبدیل شده که هر روز توسط میلیون‌ها نفر استفاده می‌شود. بخش عمده‌ای از این استفاده از طریق چت‌بات‌هایی مانند Claude، Gemini و ChatGPT انجام می‌شود. اگرچه ChatGPT از OpenAI بیشترین توجه را به خود جلب می‌کند، اما Gemini از گوگل و Claude از Anthropic هم قابلیت‌ها و عملکردهای چشمگیری دارند. هرکدام از این دو هوش‌ مصنوعی ویژگی‌ها و قابلیت‌های منحصربه‌فردی دارند که در چت جی پی تی یافت نمی‌شود، مانند Artifacts و Gems. در این مقاله می‌خواهیم به مقایسه Gemini و Claude بپردازیم.

ما پیشتر از این یک سری آزمایش بین چت جی پی تی و جمینای، سپس بین چت جی پی تی و کلود انجام داده بودیم که هر بار ChatGPT در آن‌ها برنده شده بود. اکنون تصمیم گرفتیم مقایسه Gemini و Claude را انجام دهیم تا ببینیم برنده کدام است. برای این آزمایش، ۷ پرامپت طراحی کردیم. در طراحی این پرامپت‌ها از همان ساختاری که در مقایسه‌های قبلی استفاده کردیم بهره بردیم و سپس از مدل o1 OpenAI برای ایده‌پردازی استفاده کردیم.

طراحی پرامپت‌ها در مقایسه Gemini و Claude

دسته‌بندی‌های ما در اینجا شامل تولید تصویر، تحلیل تصویر، کدنویسی و نوشتن خلاقانه است. این نوع دسته‌بندی به ما امکان می‌دهد تا طیف کاملی از قابلیت‌های این هوش‌های مصنوعی را در بیشتر موارد استفاده‌ای که دارند، آزمایش کنیم. از آنجا که هوش مصنوعی کلود خود توانایی تولید تصویر ندارد، از او خواستیم تا متنی را برای یک دادن به هوش مصنوعی دیگری برای تولید تصویر برایمان ایجاد کند. همچنین، ویژگی‌های خاصی مانند «پروژه‌ها» در Claude یا “Gems” در هوش مصنوعی جمینای را نادیده گرفتیم تا بتوانیم بر عملکرد مشابه هر کدام از این دو مدل هوش مصنوعی متمرکز شویم. در این مقایسه، از جدیدترین مدل‌ها یعنی Claude Sonnet 3.5 و Google Gemini 2.0 Experimental Advanced استفاده کردیم.

۱. تولید تصویر

مقایسه Gemini و Claude در تولید تصویر

در ابتدا در مقایسه Gemini و Claude، بررسی می‌کنیم که Claude و Gemini چگونه می‌توانند یک متن دقیق را برای تولید یک تصویر ارائه دهند. Gemini به مدل تولید تصویر Imagen 3 دسترسی دارد، اما از آنجا که Claude مدل خاص خود را ندارد، از آن‌ها خواستم متن یک پرامپت را برایمان ایجاد کنند تا ببینیم این دو برنامه هوش مصنوعی چگونه عمل می‌کنند.

پرامپت:
«یک متن پرامپت دقیق و توصیفی برای یک ابزار تولید تصویر با AI ایجاد کن که یک صحنه مهمانی در باغی سایبرپانک و سورئال را به تصویر بکشد. تصویر تولید شده باید شامل موارد زیر باشد: یک گلخانه نئونی در شب با گیاهان عجیب و درخشان؛ ربات‌های انسان‌نما که با انسان‌ها تعامل دارند و آبمیوه‌هایی که در آینده تولید شده‌اند را به انسان‌ها ارائه می‌دهند.

تصویر باید دارای حس ظرافت خیال‌انگیزی باشد که طبیعت را با فناوری پیشرفته ترکیب می‌کند؛ فانوس‌های هولوگرافیک یا گوی‌های شناور که فضا را زیباتر می‌کنند هم باید در تصویر باشند. خروجی نهایی باید متن دقیقی باشد که در ابزار تولید تصویر وارد شود. مطمئن شو که این پرامپت، مواردی از قبیل سبک، نورپردازی، ترکیب‌بندی و هر جزئیات هنری خاص (مانند تمرکز بر رنگ‌های زنده، فوتورئالیسم یا جلوه نقاشی‌گونه) را به ما پیشنهاد دهد.»

مقایسه هوش مصنوعی Gemini و Claude در تولید پرامپت تولید تصویر

پرامپت تولید شده توسط Claude:

«مهمانی در باغ به سبک سایبرپانک و فوتورئالیستیک در گلخانه‌ای شیشه‌ای در شب، گل‌های بیولومینسانس و پیچک‌های نئون تابدار، ربات‌های انسان‌نمای (اندروید) شیک با لباس‌های رسمی که آبمیوه‌های رنگین‌کمانی را به مهمانان انسانی ارائه می‌دهند، فانوس‌های هولوگرافیک شناور که نور منشوری از خود منتشر می‌کنند، سطوح کروم و شیشه‌ای که رنگ‌هایی نظیر بنفش‌های تیره و آبی‌های الکتریکی را منعکس می‌کنند، مه ملایم، نورپردازی سینمایی پیشرفته، عمق میدان کم، بافت‌های تصویری دقیق.»

پرامپت تولید شده توسط Gemini:

«مهمانی در باغ به سبک سایبرپانک سورئال، شب، گلخانه نئون، گیاهان عجیب و فضایی درخشان، ربات‌های انسان‌نمای شیک و انسان‌ها در حال تعامل، آبمیوه‌هایی از آینده، فضایی خیال‌انگیز، فانوس‌های هولوگرافیک شناور، گوی‌های درخشان و پرنور، فوتورئالیستیک، جزئیات پیچیده، نورپردازی نرم، سایه‌های دراماتیک، پالتی از رنگ‌های زنده، شات زاویه باز.»

Claude با متن پرامپت زنده‌تر و دقیق‌تری که عناصر مختلف را به‌خوبی ترکیب کرده و سبک آینده‌نگرانه را به تصویر کشیده بود، برنده شد.

برنده: Claude به دلیل توصیفی‌تر و غنی‌تر بودن متن پرامپت

۲. تحلیل تصویر

مقایسه قدرت این دو هوش مصنوعی در تحلیل تصاویر

در این بخش در مقایسه Gemini و Claude قابلیت‌های تحلیل تصویر هر دو مدل را بررسی کردیم. برای این آزمایش، تصویری از «چیدمان کامل یک میز گیمینگ» که توسط تونی پولانکو ارائه شده بود، در اختیار مدل‌ها قرار گرفت. سپس از آن‌ها خواسته شد تا درباره ارگونومی، مدیریت کابل‌ها، نورپردازی و موارد دیگر نظر بدهند. دستورالعمل از این قرار بود؛

پرامپت:

«یک عکس از یک میز گیمینگ پیشرفته را در نظر بگیرید و موارد زیر را در آن تحلیل کنید: ارگونومی: موقعیت مانیتور، ارتفاع آن و وضعیت صندلی؛ مدیریت کابل‌ها: شناسایی راه‌حل‌ها و مشکلات واضح؛ تنظیمات نورپردازی: بررسی خطرات برای چشم، میزان روشنایی و فضای کلی؛ استفاده از فضا: میزان کارایی در استفاده از فضای میز؛ چیدمان تجهیزات: بررسی خنک‌سازی و دسترسی به تجهیزات جانبی. پیشنهادات دقیق خود برای بهبود وضعیت ارائه دهید، از جمله هزینه‌های تقریبی برای ارتقا یا لوازم پیشنهادی برای خرید.»

نتایج:

Claude در هر دسته‌بندی‌اش، تحلیل‌های مشخصی به ما ارائه داد. پیشنهاداتش واقع‌گرایانه و عملی بودند و طیفی از هزینه‌ها را هم پوشش می‌دادند. Gemini نیز جزئیات کاملی ارائه داد، به‌ویژه درباره ارگونومی و همچنین تحلیلش عمیق‌تر بود اما کمتر ساختارمند بود.

برنده: انتخاب بین آن‌ها سخت بود، اما Claude به دلیل وضوح و تطابق بهتر با دستورالعمل‌ها برنده شد.

۳. کدنویسی در مقایسه Gemini و Claude

مقایسه هوش مصنوعی در کدنویسی

همیشه در این آزمایش‌ها یک پرامپت کدنویسی هم قرار می‌دهیم. برای مقایسه Gemini و Claude در کدنویسی زبان پایتون را انتخاب کردیم چون اجرای آن راحت‌تر است. هدف این بود که یک کد تک‌مرحله‌ای ارائه شود که بدون تغییر دادن بتواند کار کند. در این بخش از آزمایش ما معمولاً کدی برای یک بازی را ترجیح می‌دهیم چون تفاوت‌ها در آن آسان‌تر دیده می‌شوند. دستورالعملی که باید این دو هوش مصنوعی از آن تبعیت کنند به شرح زیر است؛

پرامپت:

«یک کد پایتون کامل برای یک بازی با رابط گرافیکی بنویسید. از tkinter یا pygame استفاده کنید. بازی باید دارای ویژگی‌های زیر باشد: یک صفحه که در آن بازیکن با کلیدهای جهت‌دار یک شخصیت (یا شکل) را کنترل کنند؛ سکه‌هایی که به‌طور تصادفی ظاهر می‌شوند و با جمع‌آوری آن‌ها امتیاز بازیکن افزایش می‌یابد؛ نمایش ساده امتیاز فعلی. توضیحاتی که منطق کد را توضیح می‌دهند را حتما اضافه کنید و مطمئن شوید که کد بدون نیاز به کتابخانه‌های اضافی قابل اجرا باشد.»

کدنویسی بازی نوشته شده توسط هوش مصنوعی Gemini و Claude

نتایج:

هر دو مدل بازی‌هایی ایجاد کردند که می‌توان امتیاز را در آن‌ها دنبال کرد، سکه‌ها را جمع‌آوری کرد و بازی را ادامه داد. با این حال، تفاوت‌های قابل توجهی بین Claude و Gemini وجود داشت. کد Claude رابط کاربری بهتری داشت و در حالت تاریک یا دارک مود لپ‌تاپ هم به خوبی کار می‌کرد، اما نمی‌توان همین موارد را درباره Gemini گفت. بازی Gemini بازی‌ای سرگرم‌کننده‌تر بود چون به شکل یک بازی بی‌پایان طراحی شده بود؛ به این شکل که هر بار که یک سکه جمع می‌کردید، یک سکه دیگر ظاهر می‌شد. با این حال، انتخاب ما برای برنده این بخش Claude است چون کد او بدون نیاز به تغییر حالت نور لپ‌تاپ به‌خوبی اجرا شد. این ویژگی‌ای بود که Claude در مقایسه‌ای که در بخش کدنویسی با چت‌جی‌پی‌تی برگزار کردیم، نداشت.

برنده: Claude به دلیل ارائه کدی کامل و آماده اجرا برنده این بخش شد.

۴. نوشتن خلاقانه

نوشتن خلاقانه در مقایسه Gemini و Claude

نوشتن خلاقانه یکی از حوزه‌هایی است که مدل‌های هوش مصنوعی مدتی است در آن فعالیت می‌کنند، اما اخیراً نوشته‌هایشان جذاب‌تر و خلاقانه‌تر شده‌اند. در این بخش از مقایسه Gemini و Claude، از این دو هوش مصنوعی خواستیم تا درباره یک صحنه علمی-تخیلی کوتاه در مریخ بنویسند که شامل دیالوگ‌های جالب و پایانی هیجان‌انگیز و البته تعلیق‌آمیز باشد. دیالوگ‌ها و پایان هیجان‌انگیز و تعلیق‌آمیز دو بخشی بودند که در قضاوت ما از خروجی‌ها اهمیت زیادی داشتند.

پرامپت:

«یک صحنه علمی-تخیلی کوتاه و مهیج (زیر ۳۰۰ کلمه) بنویسید که در آن دو فضانورد هر دو پدیده عجیبی را در مدار مریخ کشف می‌کنند. یک بخش کوتاه از دیالوگ را به متنتان اضافه کنید که بتواند شگفت‌انگیزبودن آنچه را که کشف کرده‌اند، به تصویر بکشد. با یک پایان مهیج و تعلیق‌آمیز که خواننده را مشتاق ادامه داستان کند، به داستان خود پایان دهید.»

نتایج:

Claude یک پایان تعلیق‌آمیز ارائه داد که تعلیق و هیجان را با یک پایان‌بندی شوم ترکیب کرد. دیالوگ‌ها طبیعی بودند، اما می‌توانستند تأثیرگذارتر باشند. Gemini پایان ضعیف‌تری ارائه داد و نتوانست هیجان لازم را ایجاد کند، اما دیالوگ‌هایش بسیار جذاب‌تر و انسانی‌تر بودند. انتخاب ما در اینجا به عنوان برنده Claude است چون پایان او قوی‌تر بود و توانست تعادل خوبی بین عناصر داستانی اکشن، توصیف و دیالوگ ایجاد کند. اگرچه دیالوگ‌های Gemini خلاقانه‌تر بودند، Claude در مجموع عملکرد بهتری داشت.

برنده: Claude برای پایان تعلیق‌آمیز بهتر.

۵. توانایی حل مساله

توانایی حل مساله در هوش مصنوعی Gemini و Claude

مدل‌های هوش مصنوعی در حل مسأله بسیار ماهر هستند زیرا می‌توانند الگوها را به خوبی شبیه‌سازی کنند. در اینجا در مقایسه Gemini و Claude، مشخصات یک کامپیوتر گیمینگ را به آن‌ها دادیم و گفتیم که یک بازی جدید داریم که دچار مشکل اجرا شده است و از آن‌ها خواستیم که راه‌حلی برای این مشکل پیدا کنند. این یک مشکل واقعی است و بسیاری از کاربران روزانه در سایت‌های مختلف آن را مطرح می‌کنند؛ حالا بیایید ببینیم که Claude و Gemini چگونه این مشکل را حل می‌کنند.

پرامپت:

«من اخیراً یک کامپیوتر گیمینگ با مشخصات NVIDIA RTX 4070، پردازنده Intel Core i7، 16 گیگابایت رم و یک ترابایت SSD برای ذخیره‌سازی آماده کرده‌ام. بازی جدیدی که نصب کرده‌ام هر چند دقیقه یک‌بار هنگ می‌کند، به‌ویژه در زمان بارگذاری تکسچرها. یک راهنمای عیب‌یابی گام به گام برای من ارائه بده که شامل موارد زیر باشد: درایورهای کارت گرافیک، تنظیمات بازی (کیفیت تکسچر، وضوح تصویر و غیره)، مسائل احتمالی دما یا خنک‌سازی، به‌روزرسانی‌های سیستم‌عامل و فرایندهای پس‌زمینه، هرگونه بررسی سخت‌افزاری اضافی یا ارتقاهای پیشنهادی. در نهایت توضیح بده چرا هر گام می‌تواند برای حل این مشکل مفید باشد و در صورت لزوم، هزینه‌های تقریبی هرکدام از ارتقاها را ذکر کن.»

نتایج:

پاسخ Claude کمی فنی و پیچیده بود. دقیق بود اما جزئیات مربوط به تنظیمات بازی را چندان پوشش نداده بود. با این حال، این جزئیات دقیقاً همان چیزی بود که ممکن بود برای حل مشکل نیاز باشد. Gemini توضیحات زیادی داد و تمام بخش‌هایی که از او خواسته بودیم را به‌طور جامع پوشش داد، از جمله نصب درایورها. او پیشنهاد‌های عملی و واقع‌بینانه‌ای ارائه داد، اما برخی بررسی‌های پیشرفته را نادیده گرفت و به جزئیات سخت‌افزاری به‌اندازه Claude نپرداخت. این رقابت تنگاتنگ و نزدیکی بین دو مدل هوش مصنوعی بود. در این بخش از مقایسه Gemini و Claude از نظر ما، Claude راهنمایی جامع‌تری ارائه داد، اما Gemini جزئیات بیشتری درباره تنظیمات بازی ارائه کرد که باعث شد برنده این بخش باشد.

برنده: Gemini به دلیل ارائه جزئیات بیشتر در مورد تنظیمات بازی

۶. توانایی برنامه‌ریزی در مقایسه Gemini و Claude

توان برنامه ریزی در مقایسه Gemini و Claude

مدل‌های هوش مصنوعی در برنامه‌ریزی بسیار خوب عمل می‌کنند. ما در این بخش از مقایسه Gemini و Claude تصمیم گرفتیم ببینیم هر یک از این دو هوش مصنوعی، چگونه می‌توانند آشپزخانه و اتاق نشیمن یک آپارتمان را به فضایی دل‌باز تبدیل کنند؛ همانطوری که اگر از طراحان داخلی خواسته شود، این پلان را طراحی می‌کنند. از این دو هوش مصنوعی خواستیم که نمونه‌هایی از طراحی‌ها و سبک‌ها، مجوزهای لازم، نکات هماهنگی و هزینه‌های تقریبی را ارائه دهند.

پرامپت:

«من می‌خواهم آشپزخانه و اتاق نشیمنم را به یک فضای دل‌باز تبدیل کنم. یک برنامه مفصل ارائه دهید که شامل موارد زیر باشد: بودجه‌بندی: تخمین هزینه‌ها برای تخریب یک دیوار غیر باربر، کف‌سازی جدید و نورپردازی، مشاوره طراحی: چه زمانی باید یک طراح داخلی را درگیر کرد، نمونه‌هایی از سبک‌های ممکن، مجوزها و مقررات: چه مجوزها یا بازرسی‌هایی ممکن است نیاز باشد، زمان‌بندی و پیمانکاران: چگونه باید معاملات مختلف را هماهنگ کرده و یک زمان‌بندی واقع‌بینانه را مدیریت کرد، شرایط زندگی: نکاتی برای کنار آمدن با ساخت‌وساز در حال انجام در خانه.

پس از انجام این‌ها، در دو یا سه جمله، یک پرامپت برای یک هوش مصنوعی مولد تصویر ارائه دهید تا تصویری از فضای آشپزخانه-اتاق نشیمن دلبازی که درخواست داده بودیم و حالا تکمیل‌شده، بسازد؛ تصویری که باید عناصر طراحی اصلی که با مشاوره شما انجام گرفته است را در خود داشته باشد.»

مقایسه دو تصویر تولید شده توسط هوش مصنوعی برای برنامه ریزی

نتایج:

Claude با یک پاسخ ساختارمند و بودجه‌بندی واقع‌بینانه، و یک طرح عملی حتی در زمان ساخت، عمل کرد. Gemini جزئیات بیشتری در هر بخش ارائه داد، از جمله تنوع سبک‌ها و توجه به نیاز به مجوزها. در این مرحله انتخاب ما Gemini است چون پیشنهادات بیشتری از نظر طراحی داشت و به‌خوبی ایده‌های مختلف را بررسی کرد.

برنده: Gemini به دلیل گزینه‌های بیشتر

۷. آموزش

توانایی آموزش در هوش مصنوعی جمینای و کلود

ممکن است شما هم با موضوعی مثل کامپیوترهای کوانتومی مواجه شده باشید و درک آن را سخت یافته باشید؛ هنوز بسیاری وجود دارند که با فهمیدن مفاهیم آن مشکل دارند. بنابراین در این مرحله از مقایسه Gemini و Claude از هر دو مدل خواستیم که مفاهیم این فناوری را به زبانی ساده توضیح دهند و از تشبیهات استفاده کنند تا آن را برای خواننده قابل درک‌تر کنند.

پرامپت:

«تفاوت‌های کامپیوترهای کوانتومی با کامپیوترهای کلاسیک را با استفاده از مثال‌ها یا تشبیهات ساده توضیح دهید و حتما موارد زیر را پوشش دهید: کیوبیت‌ها در مقابل بیت‌ها، سوپراپوزیشن کوانتومی و معنای آن، کاربردهای آن در دنیای واقعی (حال و آینده)، محدودیت‌های سخت‌افزاری فعلی و مقیاس‌پذیری آن، چرا محاسبات کوانتومی برای آینده فناوری مهم هستند. از مثال‌ها یا تشبیهات ساده‌ای استفاده کنید که هر کسی بتواند آن‌ها را درک کند.»

نتایج:

معیارهای ما برای اعلام برنده این مرحله شامل وضوح و سادگی، تشبیهات دقیق و قابل درک، پاسخ جامع و جوابی است که ما را در نهایت درگیر خود کند. Claude تشبیه‌های روشنی از سوپراپوزیشن به‌عنوان یک کتابخانه و یک سکه در حال چرخش برای تجسم بیت‌ها و کیوبیت‌ها ارائه داد. همچنین از مثال‌هایی در زمینه کشف دارو و همچنین بهینه‌سازی ترافیک برای توضیح بیشتر استفاده کرد. با این حال، مثال‌های او محدود بودند و بیشتر بر روی حوزه‌های حرفه‌ای متمرکز بودند و تأثیر AI در این حوزه نادیده گرفته شده بود.

Gemini از مثال یک سوئیچ دیمری یا همان کلید قابل تنظیم برای مقایسه بیت‌ها با کیوبیت‌ها استفاده کرد که تشبیه ملموس‌تری است. همچنین از سکه در حال چرخش برای سوپراپوزیشن استفاده کرد و کاربردهای دنیای واقعی AI و لجستیک را هم برایمان ذکر کرد. این پاسخ کمی طولانی و البته تکراری بود. برای ما Claude برنده بود چون پاسخ آن مستقیم‌تر و برای خوانندگان غیر فنی قابل فهم‌تر بود. Gemini تشبیهات غنی‌تری ارائه داد، اما پاسخ Claude برای مخاطب عمومی قابل درک‌تر بود.

برنده: Claude برای پاسخ قابل درک‌تر

در نگاه اول ممکن است به نظر برسد که Claude برنده‌ای قاطع در این چالش بوده است، اما Gemini در آزمایش‌های متعدد ما بسیار نزدیک به Claude عمل کرده است و این چالش می‌توانست نتیجه‌ای نزدیک‌تر داشته باشد. ناگفته نماند که در چندین مورد انتخاب ما کمی شخصی بود و این به معنی پیروزی قاطعانه از سوی Claude نبود. در این آزمایش ما از نسخه آزمایشی پیشرفته Gemini 2.0 استفاده کردیم که هنوز در حال تست است و تنها چند هفته است که در دسترس قرار گرفته است. سپس آن را در مقابل نسخه Claude Sonnet 3.5 قرار دادیم که به‌تدریج در ماه‌های گذشته بهبود یافته است.

منبع: tomsguide.com

source

توسطnastoor.ir

طراحی پرامپت‌ها در مقایسه Gemini و Claude

۱. تولید تصویر

۲. تحلیل تصویر

۳. کدنویسی در مقایسه Gemini و Claude

۴. نوشتن خلاقانه

۵. توانایی حل مساله

۶. توانایی برنامه‌ریزی در مقایسه Gemini و Claude

۷. آموزش

توسط nastoor.ir

پست های مرتبط

مدارس برخی شهر‌های لرستان غیرحضوری شد

لیست برندگان سیمرغ چهل و سومین جشنواره فیلم فجر + عکس

معرفی بهترین منابع ویژه جمع‌بندی کنکور

You missed

مدارس برخی شهر‌های لرستان غیرحضوری شد

لیست برندگان سیمرغ چهل و سومین جشنواره فیلم فجر + عکس

معرفی بهترین منابع ویژه جمع‌بندی کنکور

وزیر کشور: وزارت کشور تفاوتی بین احزاب و گروه‌های سیاسی قائل نیست