شبکه اطلاع رسانی روابط عمومی ایران (شارا)- محققان موسسه OpenAI طی ماه های اخیر بر ایجاد هوش مصنوعی متمرکز بوده اند که می تواند بهتر از دیگر انواع این فناوری بیاموزد. براساس گزارش Science Alert، اکنون محققان موسسه موفق شده اند سیستم را به گونه ای ارتقا دهند که بتواند مانند انسان ها از خطاهای خودش بیاموزد.
این توانایی مدیون الگوریتم منبع بازی به نام HER (مخفف شناخت تکرار تجربه) است که محققان به تازگی آن را ایجاد کرده اند و همانطور که از نامش مشخص است، به سیستم امکان می دهد خطاهای خود را بازبینی کرده و از آنها برای انجام درست وظیفه جدید درس بگیرد. از این رو هوش مصنوعی خطاهای خود را به عنوان موفقیت در نظر می گیرد. به عبارتی، هر خطایی که این سیستم هوش مصنوعی در مسیر انجام یک دستور انجام می دهد، به هدفی دیگر تبدیل می شود، هدفی ناخواسته و مجازی. درست مانند اولین تجربه یادگیری دوچرخه سواری که در آن فرد ابتدا در حفظ تعادل دچار مشکل می شود. اما هر بار زمین افتادن فرد را به هدفش که حفظ تعادل است نزدیک تر می سازد زیرا بشر به این شکل و با استفاده از خطاهایش می آموزد.
با استفاده از HER، این سیستم هوش مصنوعی قصد دارد به شیوه ای مشابه کارهای جدید را یاد بگیرد. این تکنیک به تدریج جایگزین سیستم پاداشی خواهد شد که در مدل های یادگیری <تقویت یادگیری> مورد استفاده قرار می گیرند. برای اینکه یک هوش مصنوعی به خودش درس بدهد، باید از سیستم پاداشی استفاده کند. سیستمی که متناسب با رسیدن یا نرسیدن هوش مصنوعی به هدفش به آن جایزه می دهد.
این مدل کامل نیست و برخلاف آن سیستم HER حتی زمانی که هوش مصنوعی دچار خطا می شود نیز به او پاداش می دهد. به این شکل سیستم با سرعت و کیفیت بالاتری یاد می گیرد. به گفته محققان استفاده از سیستم جدید یادگیری به آن معنی نیست که یاد دادن کارهای ویژه به هوش مصنوعی ساده تر از گذشته است. حقیقت یادگیری با استفاده از HER در روبات های واقعی هنوز فرایند پیچیده ای است زیرا به دریایی از نمونه ها نیاز دارد.
|