شبکه اطلاعرسانی روابطعمومی ایران (شارا) || این مقاله از وبسایت Tom's Guide قابلیت جدید بینایی را در چتجیپیتی، یک چتبات مدل زبانی بزرگ توسعه یافته توسط اوپنایآی، بررسی میکند. نویسنده 7 چالش مختلف را برای چتجیپیتی تعیین میکند تا ببیند چگونه میتواند تصاویر را درک و تفسیر کند.
نتایج:
چتجیپیتی به طور چشمگیری در همه 7 چالش عملکرد خوبی داشت. با دقت اشیا را در تصاویر تشخیص داد، متن را از تصاویر استخراج کرد، احساسات را در چهرهها تشخیص داد، صحنهها را درک کرد، کیفیت تصاویر را ارزیابی کرد و اشیا را در تصاویر شلوغ تشخیص داد.
نکات کلیدی:
- چتجیپیتی از مدل زبانی GPT-4o استفاده میکند که به طور بومی چندوجهی است و درک عمیقتری از تصاویر، ویدئوها، صداها و متن دارد.
- چتجیپیتی میتواند تصاویر را به روشی دقیق و توصیفی تجزیه و تحلیل کند، حتی زمانی که زمینه یا اطلاعات اضافی ارائه نشود.
- چتجیپیتی میتواند احساسات را در چهرهها تشخیص دهد و صحنهها را درک کند، که میتواند برای کاربردهای مختلفی مانند تجزیه و تحلیل ویدئو و تشخیص چهره مفید باشد.
- چتجیپیتی میتواند کیفیت تصاویر را ارزیابی کند، که میتواند برای وظایفی مانند ویرایش عکس و انتخاب تصویر مفید باشد.
- چتجیپیتی میتواند اشیاء را در تصاویر شلوغ تشخیص دهد، که میتواند برای کاربردهایی مانند رباتیک و بینایی کامپیوتر مفید باشد.
نتیجه گیری:
نویسنده نتیجه میگیرد که چتجیپیتی یکی از بهترین مدلهای بینایی هوش مصنوعی است که تا به حال منتشر شده است. قابلیتهای آن برای طیف گستردهای از کاربردها مفید خواهد بود.
- چتجیپیتی در حال حاضر به صورت رایگان با اشتراک چتجیپیتی پلاس در دسترس است.
- اوپنایآی در حال توسعه یک برنامه دسکتاپ چتجیپیتی است که در حال حاضر در نسخه بتا است.
- نویسنده معتقد است که عینک های هوشمند با ادغام قابلیتهای بینایی هوش مصنوعی مانند چتجیپیتی، پتانسیل تبدیل شدن به آینده تعامل با دادهها را دارند.
منبع انگلیسی: tomsguide
منبع فارسی: شارا
انتهای پیام/
با کلیک روی لینک زیر به کانال تلگرام ما بپیوندید:
https://telegram.me/sharaPR
|