رقیب گوگل Gemini 1.5 Pro را در تست‌های مختلف شکست می‌دهد - شارا

خانه

تازه ها

پایگاه اخبار

پایگاه اندیشه

پایگاه کتاب

پایگاه اطلاعات

پایگاه بین الملل

پایگاه چندرسانه ای

پایگاه امکانات

دوشنبه، 28 خرداد 1403 - 03:57

مواد مغذی که ممکن است با افزایش سن از مغز شما محافظت کنند
ادامه ادامه مطلب یک

نظریه جدیدی نحوه انتقال اطلاعات توسط امواج را شرح می‌دهد
ادامه ادامه مطلب دو

ربات‌های انسان‌نما به دنبال مشاغل تولیدی هستند
ادامه ادامه مطلب سه

می‌سی‌سی‌پی راهنمای از بین بردن مطبوعات آزاد را منتشر می‌کند
ادامه ادامه مطلب چهار

آخرین مطالب روابط عمومی

چرا سم آلتمن از اوپن‌ای‌آی اخراج شد؟
مهمترین چالش های ارتباط داخلی طبق گزارش آکسیوس
بازاریابی به رهبری بنیانگذار: استراتژی بازاریابی B2B برای سال 2024
نظریه جدیدی نحوه انتقال اطلاعات توسط امواج را شرح می‌دهد
استراتژی بازاریابی FML چیست؟
چگونه در همه چیز موفق باشیم
ادای احترام به دکتر سید وحید عقیلی در دومین اجلاس ملی مدیران روابط‌عمومی
روابط‌عمومی: اسیر توهمات؟ چالش‌ها و راهکارها
ربات‌های انسان‌نما به دنبال مشاغل تولیدی هستند
سرمایه‌گذاری استراتژیک در آموزش متخصصان روابط‌عمومی در زمینه هوش مصنوعی
ادامه آخرین مطالب روابط عمومی

- اندازه متن: + -

کد خبر: 55174

صفحه نخست » فناوری نو و هوش مصنوعی

شنبه، 5 خرداد 1403 - 08:12

رقیب گوگل Gemini 1.5 Pro را در تست‌های مختلف شکست می‌دهد

در این مقاله، ChatGPT 4o، آخرین مدل زبانی OpenAI، را با Gemini 1.5 Pro، مدل پرچمدار جدید گوگل، مقایسه می‌کنیم. ما هر دو مدل را در مجموعه‌ای از وظایف، از جمله استدلال عقل سلیم، درک چندوجهی و کدگذاری، آزمایش کرده‌ایم. نتایج نشان می‌دهد که ChatGPT 4o به طور قابل توجهی از Gemini 1.5 Pro برتر است.

شبکه اطلاع‌رسانی روابط‌عمومی‌ ایران (شارا) || در این مقاله، ChatGPT 4o، آخرین مدل زبانی OpenAI، را با Gemini 1.5 Pro، مدل پرچمدار جدید گوگل، مقایسه می‌کنیم. ما هر دو مدل را در مجموعه‌ای از وظایف، از جمله استدلال عقل سلیم، درک چندوجهی و کدگذاری، آزمایش کرده‌ایم. نتایج نشان می‌دهد که ChatGPT 4o به طور قابل توجهی از Gemini 1.5 Pro برتر است.

خلاصه یافته‌ها

استدلال عقل سلیم: ChatGPT 4o در همه تست‌های استدلال عقل سلیم که انجام دادیم، از جمله محاسبه زمان خشک شدن حوله‌ها و حل معماهای آسانسور جادویی، به درستی پاسخ داد. Gemini 1.5 Pro در برخی از این تست‌ها مشکل داشت.

درک چندوجهی: ChatGPT 4o وظایف درک چندوجهی، مانند فهمیدن اینکه سیب‌ها در کجا هستند یا کدام یک سنگین‌تر است (یک کیلو پر یا یک پوند فولاد) را به درستی انجام داد. Gemini 1.5 Pro در این وظایف عملکرد ضعیف‌تری داشت.

کدگذاری: ChatGPT 4o در عرض چند ثانیه توانست یک بازی پایتون را از ابتدا ایجاد کند. Gemini 1.5 Pro نتوانست کد صحیح را تولید کند.

نتیجه

واضح است که ChatGPT 4o مدل زبانی پیشرفته‌تری نسبت به Gemini 1.5 Pro است. این مدل در طیف گسترده‌ای از وظایف عملکرد بهتری دارد و استفاده از آن آسان‌تر است. اگر به دنبال یک مدل زبانی قدرتمند و همه‌کاره هستید، ChatGPT 4o انتخاب بهتری است.

نتایج ۵ تست

در زیر، جزئیات بیشتری از نتایج تست ما آمده است:

1. محاسبه زمان خشک شدن
ما از هر دو مدل خواستیم تا محاسبه کنند که چقدر طول می‌کشد تا 20 حوله زیر نور خورشید خشک شوند، اگر خشک شدن 15 حوله 1 ساعت طول بکشد. ChatGPT 4o پاسخ صحیح را در عرض چند ثانیه محاسبه کرد. Gemini 1.5 Pro وارد محاسبات ریاضی شد و به یک نتیجه اشتباه رسید.

2. تست آسانسور جادویی
در تست آسانسور جادویی، از مدل‌ها خواسته شد تا توضیح دهند که اگر از طبقه اول با آسانسور جادویی که در طبقات زوج به جای طبقات فرد توقف می‌کند، 3 طبقه بالا بروند و سپس از پله‌ها 3 طبقه دیگر بالا بروند، در نهایت در کدام طبقه خواهند بود. ChatGPT 4o و Gemini 1.5 Pro هر دو پاسخ صحیح را ارائه کردند.

3. سیب را پیدا کنید
در این تست، یک سبد بدون ته در یک جعبه روی زمین قرار داشت و 3 سیب داخل سبد گذاشته شده بود. از مدل‌ها خواسته شد تا بگویند سیب‌ها کجا هستند. ChatGPT 4o به درستی پاسخ داد که سیب‌ها در جعبه روی زمین هستند. Gemini 1.5 Pro به نظر می‌رسید که توجهی ندارد و بسیاری از جنبه‌های کلیدی سوال را نادیده گرفت.

4. کدام سنگین‌تر است؟
در این تست استدلال عقل سلیم، از مدل‌ها پرسیده شد که چه چیزی سنگین‌تر است: یک کیلو پر یا یک پوند فولاد. ChatGPT 4o به درستی اشاره کرد که واحدها متفاوت هستند، از این رو، یک کیلوگرم از هر ماده‌ای بیش از یک پوند وزن خواهد داشت. Gemini 1.5 Pro پاسخ اشتباه را داد و گفت که وزن هر دو یکسان است.

5. دستورالعمل‌های کاربر را دنبال کنید
ما از هر دو مدل خواستیم که 10 جمله با کلمه "انبه" در انتها ایجاد کنند. ChatGPT 4o همه 10 جمله را به درستی تولید کرد، در حالی که Gemini 1.5 Pro فقط توانست 6 جمله از این قبیل را تولید کند.

6. تست تصویر چندوجهی
در این تست، از مدل‌ها خواسته شد تا تصویری از یک سگ و یک گربه را تجزیه و تحلیل کنند و نژاد هر حیوان را شناسایی کنند. ChatGPT 4o نژاد سگ را به درستی شناسایی کرد، اما نتوانست نژاد گربه را تشخیص دهد. Gemini 1.5 Pro در شناسایی نژاد هر دو حیوان شکست خورد ...

دو نکته پایانی:

- چت‌جی‌پی‌تی نسل چهارم او توسط اوپن‌ای‌آی به صورت رایگان در دسترس است، در حالی که Gemini 1.5 Pro بخشی از Google AI Studio است که نیاز به اشتراک دارد.

- Gemini 1.5 Pro پنجره متنی بزرگ‌تر را با پشتیبانی از حداکثر 1 میلیون توکن ارائه می‌دهد، در حالی که ChatGPT 4o محدودیت کمتری دارد.

انتهای پیام/

<div id="div_eRasanehTrustseal_24429"></div>
<script src="https://trustseal.e-rasaneh.ir/trustseal.js"></script>
<script>eRasaneh_Trustseal(24429, false);</script>