شبکه اطلاعرسانی روابطعمومی ایران (شارا) || اپل دو مدل بنیادین زبانی چندزبانه و چندرسانهای معرفی کرده است که به قابلیتهای هوش مصنوعی اپل در دستگاهها و سرویسها نیرو میبخشند.
اولین مدل، مدلی با حدود ۳ میلیارد پارامتر است که بهصورت محلی روی دستگاه و بهینهشده برای تراشههای اپل طراحی شده است. این مدل از نوآوریهای معماری مانند اشتراکگذاری حافظه کش KV و آموزش کمدقت ۲بیتی بهره میبرد.
مدل دوم، مدلی سروری و مقیاسپذیر است که مبتنی بر ساختار نوین Transformer با نام «ترکیب-متخصصین با مسیرهای موازی» (PT-MoE) است. این مدل با ترکیب پاراللسازی مسیرها، محاسبات پراکنده متخصصین و توجه ترکیبی جهانی-محلی، کیفیت بالا را با هزینه رقابتی در پلتفرم رایانش ابری خصوصی اپل ارائه میکند.
هر دو مدل با دادههای بزرگ چندزبانه و چندرسانهای آموزش دیدهاند که از طریق جستجوی مسئولانه وب، مجموعههای مجاز و دادههای مصنوعی با کیفیت بالا تهیه شدهاند. سپس با آموزش نظارتشده و یادگیری تقویتی روی پلتفرم ناهمزمان بهبود یافتهاند.
نتایج نشان میدهد هر دو مدل، علاوه بر پشتیبانی از زبانهای بیشتر، قادر به درک تصاویر و اجرای فراخوانی ابزارها هستند و در معیارهای عمومی و ارزیابی انسانی، عملکردی برابر یا بهتر از مدلهای باز متناسب دارند.
یک چارچوب مدل بنیادین متمرکز بر زبان Swift ارائه شده که قابلیت تولید هدایتشده، فراخوانی ابزار محدودشده و آموزش دقیق با آداپتور LoRA را فراهم میکند و توسعهدهندگان را قادر میسازد با چند خط کد این امکانات را ادغام کنند.
پیشرفتهای اخیر در مدلهای هوش مصنوعی اپل مبتنی بر رویکرد مسئولانه AI است که شامل فیلتر کردن محتوا، ارزیابیهای محلی و حفظ حریم خصوصی کاربران با فناوریهایی مانند رایانش ابری خصوصی میباشد.
این مقاله جزئیات فنی بهروزرسانیهای مدلهای بنیادین اپل را که در ۹ ژوئن ۲۰۲۵ معرفی شدهاند، ارائه میکند.
نویسنده: Apple Intelligence Foundation
تاریخ انتشار: جولای ۲۰۲۵
منبع: گزارش فنی Apple Intelligence Foundation
با کلیک روی لینک زیر به کانال تلگرام ما بپیوندید:
انتهای پیام/
نظر بدهید