چت جی‌پی‌تی حالا می‌تواند ببیند، بشنود و حرف بزند

این شرکت روز دوشنبه در پستی وبلاگی اعلام کرد که به‌روزرسانی ربات چت هوش مصنوعی اوپن ای‌آی به کاربران اجازه خواهد داد تا مکالمه صوتی با این ربات چت هوش مصنوعی داشته باشند و همچنین با استفاده از تصویر، با آن تعامل داشته باشند.

شبکه اطلاع‌رسانی روابط‌عمومی‌ ایران (شارا) || بنا بر اعلام شرکت اوپن ای‌آی، چت‌جی‌بی‌تی یک به‌روز‌رسانی جدید دارد که به این ابزار فراگیر هوش مصنوعی امکان می‌دهد «ببیند، بشنود و صحبت کند».

این شرکت روز دوشنبه در پستی وبلاگی اعلام کرد که به‌روزرسانی ربات چت هوش مصنوعی اوپن ای‌آی به کاربران اجازه خواهد داد تا مکالمه صوتی با این ربات چت هوش مصنوعی داشته باشند و همچنین با استفاده از تصویر، با آن تعامل داشته باشند.

این شرکت همچنین در پستی در اکس/توییتر نوشت: «چت جی‌پی‌تی حالا می‌تواند ببیند، بشنود، و صحبت کند.»

این قابلیت‌ها «در دو هفته آینده» در دسترس خواهد بود و به کاربران امکان می‌دهد «با استفاده از صدا، مکالمه‌ای دوطرفه» با دستیار هوش مصنوعی داشته باشند.

به گفته اوپن‌ ای‌آی، با این قابلیت‌های جدید، چت جی‌پی‌تی می‌تواند برای «درخواست قصه شب برای خانواده‌تان، یا حل‌و‌فصل بحث سر میز شام» کاربرد داشته باشد، که چت جی‌پی‌تی را به خدماتی که دستیار هوش مصنوعی الکسای آمازون یا سیری اپل ارایه می‌دهند نزدیک‌تر می‌کند.

اوپن ای‌آی برای نمایش نمونه‌ای از نحوه کارکرد این قابلیت، ویدیویی را به اشتراک گذاشت که در آن کاربری از چت جی‌پی‌تی می‌خواهد داستانی درباره «خارپشت معرکه آفتاب‌گردانی به نام لری» بگوید.

ربات چت با صدایی شبیه انسان به سوال پاسخ می‌دهد و همچنین به سوال‌هایی مانند «خانه‌اش چه شکلی است؟» و «دوست صمیمی‌اش چه کسی است؟» جواب می‌دهد.

به گفته اوپن ای‌آی، قابلیت صوتی با استفاده از یک مدل تبدیل متن به گفتار پشتیبانی می‌شود که از متن و نمونه گفتاری چند ثانیه‌ای صدای شبیه انسان تولید می‌کند.

این شرکت گفت: «ما برای خلق هر کدام از این صداها، با صداپیشگان حرفه‌ای همکاری کردیم. ما همچنین از ویسپر، سیستم تشخیص گفتار متن‌باز شرکت خودمان، استفاده کردیم تا صحبت‌های شفاهی شما را به شکل متن رونویسی کنیم.»

این شرکت هوش مصنوعی معتقد است که فناوری صوتی جدید قادر است از فقط چند ثانیه گفتار واقعی، صداهای مصنوعی شبیه واقعی بسازد، و می‌تواند راه را برای اپلیکیشن‌های خلاقانه زیادی باز کند.

با وجود این، شرکت اوپن ای‌آی همچنین هشدار داده است که قابلیت‌های جدید ممکن است خطرهای جدیدی ایجاد کنند «مانند این احتمال که افراد دارای سوءنیت خود را جای چهره‌های سرشناس جا بزنند یا اقدام به کلاهبرداری کنند».

به‌روز‌رسانی مهم دیگر این ربات چت هوش مصنوعی به کاربران امکان می‌دهد که تصویری را بارگذاری گنند و از چت جی‌پی‌تی در موردش سوال کنند.

اوپن ای‌آی توضیح داد: «علت روشن نشدن کباب‌پز را عیب‌یابی کنید، محتویات یخچال را وارسی و برای غذا برنامه‌ریزی کنید، یا یک نمودار پیچیده را برای داده‌های مرتبط با کار تجزیه و تحلیل کنید.»

به گفته این شرکت، قابلیت جدید همچنین به کاربران امکان می‌دهد با استفاده از ابزار ترسیم اپلیکیشن موبایل چت جی‌پی‌تی، روی بخش خاصی از تصویر تمرکز کنند.

این نوع تشخیص چندوجهی ربات چت از مدتی قبل پیش‌بینی می‌شد، و این شناخت تصویری جدید با مدل چندوجهی جی‌پی‌تی‌ـ۳.۵ (GPT-3.5) و جی‌پی‌تی-۴ (GPT-4) پشتیبانی می‌شود.

این مدل‌ها می‌توانند مهارت‌های منطق زبانی‌شان را برای انواع تصاویر، از جمله عکس، نماگرفت (اسکرین‌شات) و مدارک، به کار ببرند.

به گفته اوپن ای‌آی، قابلیت‌های جدید ظرف دو هفته آینده برای مشترکان پولی سرویس‌های چت جی‌پی‌تی پلاس و اینترپرایز در اپلیکیشن در دسترس خواهد بود.

این شرکت هوش مصنوعی گفت: «هیجان‌زده‌ایم که پس از آن، به‌زودی این قابلیت‌ها را در دسترس سایر گروه‌های کاربران، از جمله طراحان و سازندگان، قرار دهیم.»

منبع: Independent

 

انتهای پیام/