شبکه اطلاعرسانی روابطعمومی ایران (شارا) || در این مقاله، ChatGPT 4o، آخرین مدل زبانی OpenAI، را با Gemini 1.5 Pro، مدل پرچمدار جدید گوگل، مقایسه میکنیم. ما هر دو مدل را در مجموعهای از وظایف، از جمله استدلال عقل سلیم، درک چندوجهی و کدگذاری، آزمایش کردهایم. نتایج نشان میدهد که ChatGPT 4o به طور قابل توجهی از Gemini 1.5 Pro برتر است.
خلاصه یافتهها
استدلال عقل سلیم: ChatGPT 4o در همه تستهای استدلال عقل سلیم که انجام دادیم، از جمله محاسبه زمان خشک شدن حولهها و حل معماهای آسانسور جادویی، به درستی پاسخ داد. Gemini 1.5 Pro در برخی از این تستها مشکل داشت.
درک چندوجهی: ChatGPT 4o وظایف درک چندوجهی، مانند فهمیدن اینکه سیبها در کجا هستند یا کدام یک سنگینتر است (یک کیلو پر یا یک پوند فولاد) را به درستی انجام داد. Gemini 1.5 Pro در این وظایف عملکرد ضعیفتری داشت.
کدگذاری: ChatGPT 4o در عرض چند ثانیه توانست یک بازی پایتون را از ابتدا ایجاد کند. Gemini 1.5 Pro نتوانست کد صحیح را تولید کند.
نتیجه
واضح است که ChatGPT 4o مدل زبانی پیشرفتهتری نسبت به Gemini 1.5 Pro است. این مدل در طیف گستردهای از وظایف عملکرد بهتری دارد و استفاده از آن آسانتر است. اگر به دنبال یک مدل زبانی قدرتمند و همهکاره هستید، ChatGPT 4o انتخاب بهتری است.
نتایج ۵ تست
در زیر، جزئیات بیشتری از نتایج تست ما آمده است:
1. محاسبه زمان خشک شدن
ما از هر دو مدل خواستیم تا محاسبه کنند که چقدر طول میکشد تا 20 حوله زیر نور خورشید خشک شوند، اگر خشک شدن 15 حوله 1 ساعت طول بکشد. ChatGPT 4o پاسخ صحیح را در عرض چند ثانیه محاسبه کرد. Gemini 1.5 Pro وارد محاسبات ریاضی شد و به یک نتیجه اشتباه رسید.
2. تست آسانسور جادویی
در تست آسانسور جادویی، از مدلها خواسته شد تا توضیح دهند که اگر از طبقه اول با آسانسور جادویی که در طبقات زوج به جای طبقات فرد توقف میکند، 3 طبقه بالا بروند و سپس از پلهها 3 طبقه دیگر بالا بروند، در نهایت در کدام طبقه خواهند بود. ChatGPT 4o و Gemini 1.5 Pro هر دو پاسخ صحیح را ارائه کردند.
3. سیب را پیدا کنید
در این تست، یک سبد بدون ته در یک جعبه روی زمین قرار داشت و 3 سیب داخل سبد گذاشته شده بود. از مدلها خواسته شد تا بگویند سیبها کجا هستند. ChatGPT 4o به درستی پاسخ داد که سیبها در جعبه روی زمین هستند. Gemini 1.5 Pro به نظر میرسید که توجهی ندارد و بسیاری از جنبههای کلیدی سوال را نادیده گرفت.
4. کدام سنگینتر است؟
در این تست استدلال عقل سلیم، از مدلها پرسیده شد که چه چیزی سنگینتر است: یک کیلو پر یا یک پوند فولاد. ChatGPT 4o به درستی اشاره کرد که واحدها متفاوت هستند، از این رو، یک کیلوگرم از هر مادهای بیش از یک پوند وزن خواهد داشت. Gemini 1.5 Pro پاسخ اشتباه را داد و گفت که وزن هر دو یکسان است.
5. دستورالعملهای کاربر را دنبال کنید
ما از هر دو مدل خواستیم که 10 جمله با کلمه "انبه" در انتها ایجاد کنند. ChatGPT 4o همه 10 جمله را به درستی تولید کرد، در حالی که Gemini 1.5 Pro فقط توانست 6 جمله از این قبیل را تولید کند.
6. تست تصویر چندوجهی
در این تست، از مدلها خواسته شد تا تصویری از یک سگ و یک گربه را تجزیه و تحلیل کنند و نژاد هر حیوان را شناسایی کنند. ChatGPT 4o نژاد سگ را به درستی شناسایی کرد، اما نتوانست نژاد گربه را تشخیص دهد. Gemini 1.5 Pro در شناسایی نژاد هر دو حیوان شکست خورد ...
دو نکته پایانی:
- چتجیپیتی نسل چهارم او توسط اوپنایآی به صورت رایگان در دسترس است، در حالی که Gemini 1.5 Pro بخشی از Google AI Studio است که نیاز به اشتراک دارد.
- Gemini 1.5 Pro پنجره متنی بزرگتر را با پشتیبانی از حداکثر 1 میلیون توکن ارائه میدهد، در حالی که ChatGPT 4o محدودیت کمتری دارد.
انتهای پیام/
<div id="div_eRasanehTrustseal_24429"></div>
<script src="https://trustseal.e-rasaneh.ir/trustseal.js"></script>
<script>eRasaneh_Trustseal(24429, false);</script>
|