در مدت زمان کوتاهی، هوش مصنوعی از یک فناوری حاشیهای به ابزاری تبدیل شده که هر روز توسط میلیونها نفر استفاده میشود. بخش عمدهای از این استفاده از طریق چتباتهایی مانند Claude، Gemini و ChatGPT انجام میشود. اگرچه ChatGPT از OpenAI بیشترین توجه را به خود جلب میکند، اما Gemini از گوگل و Claude از Anthropic هم قابلیتها و عملکردهای چشمگیری دارند. هرکدام از این دو هوش مصنوعی ویژگیها و قابلیتهای منحصربهفردی دارند که در چت جی پی تی یافت نمیشود، مانند Artifacts و Gems. در این مقاله میخواهیم به مقایسه Gemini و Claude بپردازیم.
ما پیشتر از این یک سری آزمایش بین چت جی پی تی و جمینای، سپس بین چت جی پی تی و کلود انجام داده بودیم که هر بار ChatGPT در آنها برنده شده بود. اکنون تصمیم گرفتیم مقایسه Gemini و Claude را انجام دهیم تا ببینیم برنده کدام است. برای این آزمایش، ۷ پرامپت طراحی کردیم. در طراحی این پرامپتها از همان ساختاری که در مقایسههای قبلی استفاده کردیم بهره بردیم و سپس از مدل o1 OpenAI برای ایدهپردازی استفاده کردیم.
طراحی پرامپتها در مقایسه Gemini و Claude
دستهبندیهای ما در اینجا شامل تولید تصویر، تحلیل تصویر، کدنویسی و نوشتن خلاقانه است. این نوع دستهبندی به ما امکان میدهد تا طیف کاملی از قابلیتهای این هوشهای مصنوعی را در بیشتر موارد استفادهای که دارند، آزمایش کنیم. از آنجا که هوش مصنوعی کلود خود توانایی تولید تصویر ندارد، از او خواستیم تا متنی را برای یک دادن به هوش مصنوعی دیگری برای تولید تصویر برایمان ایجاد کند. همچنین، ویژگیهای خاصی مانند «پروژهها» در Claude یا “Gems” در هوش مصنوعی جمینای را نادیده گرفتیم تا بتوانیم بر عملکرد مشابه هر کدام از این دو مدل هوش مصنوعی متمرکز شویم. در این مقایسه، از جدیدترین مدلها یعنی Claude Sonnet 3.5 و Google Gemini 2.0 Experimental Advanced استفاده کردیم.
۱. تولید تصویر
در ابتدا در مقایسه Gemini و Claude، بررسی میکنیم که Claude و Gemini چگونه میتوانند یک متن دقیق را برای تولید یک تصویر ارائه دهند. Gemini به مدل تولید تصویر Imagen 3 دسترسی دارد، اما از آنجا که Claude مدل خاص خود را ندارد، از آنها خواستم متن یک پرامپت را برایمان ایجاد کنند تا ببینیم این دو برنامه هوش مصنوعی چگونه عمل میکنند.
پرامپت:
«یک متن پرامپت دقیق و توصیفی برای یک ابزار تولید تصویر با AI ایجاد کن که یک صحنه مهمانی در باغی سایبرپانک و سورئال را به تصویر بکشد. تصویر تولید شده باید شامل موارد زیر باشد: یک گلخانه نئونی در شب با گیاهان عجیب و درخشان؛ رباتهای انساننما که با انسانها تعامل دارند و آبمیوههایی که در آینده تولید شدهاند را به انسانها ارائه میدهند.
تصویر باید دارای حس ظرافت خیالانگیزی باشد که طبیعت را با فناوری پیشرفته ترکیب میکند؛ فانوسهای هولوگرافیک یا گویهای شناور که فضا را زیباتر میکنند هم باید در تصویر باشند. خروجی نهایی باید متن دقیقی باشد که در ابزار تولید تصویر وارد شود. مطمئن شو که این پرامپت، مواردی از قبیل سبک، نورپردازی، ترکیببندی و هر جزئیات هنری خاص (مانند تمرکز بر رنگهای زنده، فوتورئالیسم یا جلوه نقاشیگونه) را به ما پیشنهاد دهد.»
پرامپت تولید شده توسط Claude:
«مهمانی در باغ به سبک سایبرپانک و فوتورئالیستیک در گلخانهای شیشهای در شب، گلهای بیولومینسانس و پیچکهای نئون تابدار، رباتهای انساننمای (اندروید) شیک با لباسهای رسمی که آبمیوههای رنگینکمانی را به مهمانان انسانی ارائه میدهند، فانوسهای هولوگرافیک شناور که نور منشوری از خود منتشر میکنند، سطوح کروم و شیشهای که رنگهایی نظیر بنفشهای تیره و آبیهای الکتریکی را منعکس میکنند، مه ملایم، نورپردازی سینمایی پیشرفته، عمق میدان کم، بافتهای تصویری دقیق.»
پرامپت تولید شده توسط Gemini:
«مهمانی در باغ به سبک سایبرپانک سورئال، شب، گلخانه نئون، گیاهان عجیب و فضایی درخشان، رباتهای انساننمای شیک و انسانها در حال تعامل، آبمیوههایی از آینده، فضایی خیالانگیز، فانوسهای هولوگرافیک شناور، گویهای درخشان و پرنور، فوتورئالیستیک، جزئیات پیچیده، نورپردازی نرم، سایههای دراماتیک، پالتی از رنگهای زنده، شات زاویه باز.»
Claude با متن پرامپت زندهتر و دقیقتری که عناصر مختلف را بهخوبی ترکیب کرده و سبک آیندهنگرانه را به تصویر کشیده بود، برنده شد.
برنده: Claude به دلیل توصیفیتر و غنیتر بودن متن پرامپت
۲. تحلیل تصویر
در این بخش در مقایسه Gemini و Claude قابلیتهای تحلیل تصویر هر دو مدل را بررسی کردیم. برای این آزمایش، تصویری از «چیدمان کامل یک میز گیمینگ» که توسط تونی پولانکو ارائه شده بود، در اختیار مدلها قرار گرفت. سپس از آنها خواسته شد تا درباره ارگونومی، مدیریت کابلها، نورپردازی و موارد دیگر نظر بدهند. دستورالعمل از این قرار بود؛
پرامپت:
«یک عکس از یک میز گیمینگ پیشرفته را در نظر بگیرید و موارد زیر را در آن تحلیل کنید: ارگونومی: موقعیت مانیتور، ارتفاع آن و وضعیت صندلی؛ مدیریت کابلها: شناسایی راهحلها و مشکلات واضح؛ تنظیمات نورپردازی: بررسی خطرات برای چشم، میزان روشنایی و فضای کلی؛ استفاده از فضا: میزان کارایی در استفاده از فضای میز؛ چیدمان تجهیزات: بررسی خنکسازی و دسترسی به تجهیزات جانبی. پیشنهادات دقیق خود برای بهبود وضعیت ارائه دهید، از جمله هزینههای تقریبی برای ارتقا یا لوازم پیشنهادی برای خرید.»
نتایج:
Claude در هر دستهبندیاش، تحلیلهای مشخصی به ما ارائه داد. پیشنهاداتش واقعگرایانه و عملی بودند و طیفی از هزینهها را هم پوشش میدادند. Gemini نیز جزئیات کاملی ارائه داد، بهویژه درباره ارگونومی و همچنین تحلیلش عمیقتر بود اما کمتر ساختارمند بود.
برنده: انتخاب بین آنها سخت بود، اما Claude به دلیل وضوح و تطابق بهتر با دستورالعملها برنده شد.
۳. کدنویسی در مقایسه Gemini و Claude
همیشه در این آزمایشها یک پرامپت کدنویسی هم قرار میدهیم. برای مقایسه Gemini و Claude در کدنویسی زبان پایتون را انتخاب کردیم چون اجرای آن راحتتر است. هدف این بود که یک کد تکمرحلهای ارائه شود که بدون تغییر دادن بتواند کار کند. در این بخش از آزمایش ما معمولاً کدی برای یک بازی را ترجیح میدهیم چون تفاوتها در آن آسانتر دیده میشوند. دستورالعملی که باید این دو هوش مصنوعی از آن تبعیت کنند به شرح زیر است؛
پرامپت:
«یک کد پایتون کامل برای یک بازی با رابط گرافیکی بنویسید. از tkinter یا pygame استفاده کنید. بازی باید دارای ویژگیهای زیر باشد: یک صفحه که در آن بازیکن با کلیدهای جهتدار یک شخصیت (یا شکل) را کنترل کنند؛ سکههایی که بهطور تصادفی ظاهر میشوند و با جمعآوری آنها امتیاز بازیکن افزایش مییابد؛ نمایش ساده امتیاز فعلی. توضیحاتی که منطق کد را توضیح میدهند را حتما اضافه کنید و مطمئن شوید که کد بدون نیاز به کتابخانههای اضافی قابل اجرا باشد.»
نتایج:
هر دو مدل بازیهایی ایجاد کردند که میتوان امتیاز را در آنها دنبال کرد، سکهها را جمعآوری کرد و بازی را ادامه داد. با این حال، تفاوتهای قابل توجهی بین Claude و Gemini وجود داشت. کد Claude رابط کاربری بهتری داشت و در حالت تاریک یا دارک مود لپتاپ هم به خوبی کار میکرد، اما نمیتوان همین موارد را درباره Gemini گفت. بازی Gemini بازیای سرگرمکنندهتر بود چون به شکل یک بازی بیپایان طراحی شده بود؛ به این شکل که هر بار که یک سکه جمع میکردید، یک سکه دیگر ظاهر میشد. با این حال، انتخاب ما برای برنده این بخش Claude است چون کد او بدون نیاز به تغییر حالت نور لپتاپ بهخوبی اجرا شد. این ویژگیای بود که Claude در مقایسهای که در بخش کدنویسی با چتجیپیتی برگزار کردیم، نداشت.
برنده: Claude به دلیل ارائه کدی کامل و آماده اجرا برنده این بخش شد.
۴. نوشتن خلاقانه
نوشتن خلاقانه یکی از حوزههایی است که مدلهای هوش مصنوعی مدتی است در آن فعالیت میکنند، اما اخیراً نوشتههایشان جذابتر و خلاقانهتر شدهاند. در این بخش از مقایسه Gemini و Claude، از این دو هوش مصنوعی خواستیم تا درباره یک صحنه علمی-تخیلی کوتاه در مریخ بنویسند که شامل دیالوگهای جالب و پایانی هیجانانگیز و البته تعلیقآمیز باشد. دیالوگها و پایان هیجانانگیز و تعلیقآمیز دو بخشی بودند که در قضاوت ما از خروجیها اهمیت زیادی داشتند.
پرامپت:
«یک صحنه علمی-تخیلی کوتاه و مهیج (زیر ۳۰۰ کلمه) بنویسید که در آن دو فضانورد هر دو پدیده عجیبی را در مدار مریخ کشف میکنند. یک بخش کوتاه از دیالوگ را به متنتان اضافه کنید که بتواند شگفتانگیزبودن آنچه را که کشف کردهاند، به تصویر بکشد. با یک پایان مهیج و تعلیقآمیز که خواننده را مشتاق ادامه داستان کند، به داستان خود پایان دهید.»
نتایج:
Claude یک پایان تعلیقآمیز ارائه داد که تعلیق و هیجان را با یک پایانبندی شوم ترکیب کرد. دیالوگها طبیعی بودند، اما میتوانستند تأثیرگذارتر باشند. Gemini پایان ضعیفتری ارائه داد و نتوانست هیجان لازم را ایجاد کند، اما دیالوگهایش بسیار جذابتر و انسانیتر بودند. انتخاب ما در اینجا به عنوان برنده Claude است چون پایان او قویتر بود و توانست تعادل خوبی بین عناصر داستانی اکشن، توصیف و دیالوگ ایجاد کند. اگرچه دیالوگهای Gemini خلاقانهتر بودند، Claude در مجموع عملکرد بهتری داشت.
برنده: Claude برای پایان تعلیقآمیز بهتر.
۵. توانایی حل مساله
مدلهای هوش مصنوعی در حل مسأله بسیار ماهر هستند زیرا میتوانند الگوها را به خوبی شبیهسازی کنند. در اینجا در مقایسه Gemini و Claude، مشخصات یک کامپیوتر گیمینگ را به آنها دادیم و گفتیم که یک بازی جدید داریم که دچار مشکل اجرا شده است و از آنها خواستیم که راهحلی برای این مشکل پیدا کنند. این یک مشکل واقعی است و بسیاری از کاربران روزانه در سایتهای مختلف آن را مطرح میکنند؛ حالا بیایید ببینیم که Claude و Gemini چگونه این مشکل را حل میکنند.
پرامپت:
«من اخیراً یک کامپیوتر گیمینگ با مشخصات NVIDIA RTX 4070، پردازنده Intel Core i7، 16 گیگابایت رم و یک ترابایت SSD برای ذخیرهسازی آماده کردهام. بازی جدیدی که نصب کردهام هر چند دقیقه یکبار هنگ میکند، بهویژه در زمان بارگذاری تکسچرها. یک راهنمای عیبیابی گام به گام برای من ارائه بده که شامل موارد زیر باشد: درایورهای کارت گرافیک، تنظیمات بازی (کیفیت تکسچر، وضوح تصویر و غیره)، مسائل احتمالی دما یا خنکسازی، بهروزرسانیهای سیستمعامل و فرایندهای پسزمینه، هرگونه بررسی سختافزاری اضافی یا ارتقاهای پیشنهادی. در نهایت توضیح بده چرا هر گام میتواند برای حل این مشکل مفید باشد و در صورت لزوم، هزینههای تقریبی هرکدام از ارتقاها را ذکر کن.»
نتایج:
پاسخ Claude کمی فنی و پیچیده بود. دقیق بود اما جزئیات مربوط به تنظیمات بازی را چندان پوشش نداده بود. با این حال، این جزئیات دقیقاً همان چیزی بود که ممکن بود برای حل مشکل نیاز باشد. Gemini توضیحات زیادی داد و تمام بخشهایی که از او خواسته بودیم را بهطور جامع پوشش داد، از جمله نصب درایورها. او پیشنهادهای عملی و واقعبینانهای ارائه داد، اما برخی بررسیهای پیشرفته را نادیده گرفت و به جزئیات سختافزاری بهاندازه Claude نپرداخت. این رقابت تنگاتنگ و نزدیکی بین دو مدل هوش مصنوعی بود. در این بخش از مقایسه Gemini و Claude از نظر ما، Claude راهنمایی جامعتری ارائه داد، اما Gemini جزئیات بیشتری درباره تنظیمات بازی ارائه کرد که باعث شد برنده این بخش باشد.
برنده: Gemini به دلیل ارائه جزئیات بیشتر در مورد تنظیمات بازی
۶. توانایی برنامهریزی در مقایسه Gemini و Claude
مدلهای هوش مصنوعی در برنامهریزی بسیار خوب عمل میکنند. ما در این بخش از مقایسه Gemini و Claude تصمیم گرفتیم ببینیم هر یک از این دو هوش مصنوعی، چگونه میتوانند آشپزخانه و اتاق نشیمن یک آپارتمان را به فضایی دلباز تبدیل کنند؛ همانطوری که اگر از طراحان داخلی خواسته شود، این پلان را طراحی میکنند. از این دو هوش مصنوعی خواستیم که نمونههایی از طراحیها و سبکها، مجوزهای لازم، نکات هماهنگی و هزینههای تقریبی را ارائه دهند.
پرامپت:
«من میخواهم آشپزخانه و اتاق نشیمنم را به یک فضای دلباز تبدیل کنم. یک برنامه مفصل ارائه دهید که شامل موارد زیر باشد: بودجهبندی: تخمین هزینهها برای تخریب یک دیوار غیر باربر، کفسازی جدید و نورپردازی، مشاوره طراحی: چه زمانی باید یک طراح داخلی را درگیر کرد، نمونههایی از سبکهای ممکن، مجوزها و مقررات: چه مجوزها یا بازرسیهایی ممکن است نیاز باشد، زمانبندی و پیمانکاران: چگونه باید معاملات مختلف را هماهنگ کرده و یک زمانبندی واقعبینانه را مدیریت کرد، شرایط زندگی: نکاتی برای کنار آمدن با ساختوساز در حال انجام در خانه.
پس از انجام اینها، در دو یا سه جمله، یک پرامپت برای یک هوش مصنوعی مولد تصویر ارائه دهید تا تصویری از فضای آشپزخانه-اتاق نشیمن دلبازی که درخواست داده بودیم و حالا تکمیلشده، بسازد؛ تصویری که باید عناصر طراحی اصلی که با مشاوره شما انجام گرفته است را در خود داشته باشد.»
نتایج:
Claude با یک پاسخ ساختارمند و بودجهبندی واقعبینانه، و یک طرح عملی حتی در زمان ساخت، عمل کرد. Gemini جزئیات بیشتری در هر بخش ارائه داد، از جمله تنوع سبکها و توجه به نیاز به مجوزها. در این مرحله انتخاب ما Gemini است چون پیشنهادات بیشتری از نظر طراحی داشت و بهخوبی ایدههای مختلف را بررسی کرد.
برنده: Gemini به دلیل گزینههای بیشتر
۷. آموزش
ممکن است شما هم با موضوعی مثل کامپیوترهای کوانتومی مواجه شده باشید و درک آن را سخت یافته باشید؛ هنوز بسیاری وجود دارند که با فهمیدن مفاهیم آن مشکل دارند. بنابراین در این مرحله از مقایسه Gemini و Claude از هر دو مدل خواستیم که مفاهیم این فناوری را به زبانی ساده توضیح دهند و از تشبیهات استفاده کنند تا آن را برای خواننده قابل درکتر کنند.
پرامپت:
«تفاوتهای کامپیوترهای کوانتومی با کامپیوترهای کلاسیک را با استفاده از مثالها یا تشبیهات ساده توضیح دهید و حتما موارد زیر را پوشش دهید: کیوبیتها در مقابل بیتها، سوپراپوزیشن کوانتومی و معنای آن، کاربردهای آن در دنیای واقعی (حال و آینده)، محدودیتهای سختافزاری فعلی و مقیاسپذیری آن، چرا محاسبات کوانتومی برای آینده فناوری مهم هستند. از مثالها یا تشبیهات سادهای استفاده کنید که هر کسی بتواند آنها را درک کند.»
نتایج:
معیارهای ما برای اعلام برنده این مرحله شامل وضوح و سادگی، تشبیهات دقیق و قابل درک، پاسخ جامع و جوابی است که ما را در نهایت درگیر خود کند. Claude تشبیههای روشنی از سوپراپوزیشن بهعنوان یک کتابخانه و یک سکه در حال چرخش برای تجسم بیتها و کیوبیتها ارائه داد. همچنین از مثالهایی در زمینه کشف دارو و همچنین بهینهسازی ترافیک برای توضیح بیشتر استفاده کرد. با این حال، مثالهای او محدود بودند و بیشتر بر روی حوزههای حرفهای متمرکز بودند و تأثیر AI در این حوزه نادیده گرفته شده بود.
Gemini از مثال یک سوئیچ دیمری یا همان کلید قابل تنظیم برای مقایسه بیتها با کیوبیتها استفاده کرد که تشبیه ملموستری است. همچنین از سکه در حال چرخش برای سوپراپوزیشن استفاده کرد و کاربردهای دنیای واقعی AI و لجستیک را هم برایمان ذکر کرد. این پاسخ کمی طولانی و البته تکراری بود. برای ما Claude برنده بود چون پاسخ آن مستقیمتر و برای خوانندگان غیر فنی قابل فهمتر بود. Gemini تشبیهات غنیتری ارائه داد، اما پاسخ Claude برای مخاطب عمومی قابل درکتر بود.
برنده: Claude برای پاسخ قابل درکتر
در نگاه اول ممکن است به نظر برسد که Claude برندهای قاطع در این چالش بوده است، اما Gemini در آزمایشهای متعدد ما بسیار نزدیک به Claude عمل کرده است و این چالش میتوانست نتیجهای نزدیکتر داشته باشد. ناگفته نماند که در چندین مورد انتخاب ما کمی شخصی بود و این به معنی پیروزی قاطعانه از سوی Claude نبود. در این آزمایش ما از نسخه آزمایشی پیشرفته Gemini 2.0 استفاده کردیم که هنوز در حال تست است و تنها چند هفته است که در دسترس قرار گرفته است. سپس آن را در مقابل نسخه Claude Sonnet 3.5 قرار دادیم که بهتدریج در ماههای گذشته بهبود یافته است.
منبع: tomsguide.com
source