مدل های جدید Google DeepMind AI می توانند در وب جستجو کنند تا به روبات ها کمک کند تا فعالیت ها را انجام دهند
Google DeepMind می گوید که مدل های به روز شده آن به روبات ها اجازه می دهد تا کارهای پیچیده تری را انجام دهند و حتی وب را برای درخواست کمک ترسیم کنند. در طی یک جلسه مطبوعاتی ، رئیس روباتیک Google DeepMind ، کارولینای پارادا ، به روزنامه نگاران گفت که مدل های اطلاعاتی مصنوعی جدید این شرکت به طور هم زمان کار می کنند تا به روبات ها اجازه دهد قبل از بازیگری در دنیای فیزیکی “در مورد گام های بیشتر فکر کنند”.
این سیستم از New Gemini Robotics 1.5 به همراه مدل استدلال گنجانیده شده ، Gemini Robotics-ER 1.5 ، که به روزرسانی هایی برای مدل هایی است که Google DeepMind در ماه مارس معرفی کرده است ، تأمین می شود. اکنون روبات ها می توانند بیش از کارهای مفرد ساده مانند تاشو یک تکه کاغذ یا فشرده سازی کیسه انجام دهند. اکنون آنها می توانند کارهایی مانند لباسشویی جدا شده با رنگ های تیره و شفاف را انجام دهند ، یک چمدان را بر اساس زمان فعلی در لندن بسته بندی کنند ، و همچنین به کسی کمک کنند تا زباله ، کمپوست و قابل بازیافت را بر اساس جستجوی وب متناسب با نیازهای خاص یک موقعیت سفارش دهد.
پارادا گفت: “این مدل ها تاکنون توانسته اند واقعاً خوب عمل کنند تا یک آموزش را به صورت کلی انجام دهند.” “با این بروزرسانی ، ما اکنون از یک آموزش به سمت درک و حل مشکلات واقعی برای فعالیت های بدنی حرکت می کنیم.”
برای انجام این کار ، روبات ها می توانند از مدل Gemini Gemini Robotics-ER 1.5 برای ایجاد درک از محیط اطراف استفاده کنند و از ابزارهای دیجیتالی مانند Google Search برای یافتن اطلاعات بیشتر استفاده کنند. بنابراین Gemini Robotics-er 1.5 این نتایج را به زبان طبیعی برای روباتیک Gemini 1.5 ترجمه می کند ، و به ربات اجازه می دهد تا از دید و درک زبان مدل برای انجام هر مرحله استفاده کند.
علاوه بر این ، Google DeepMind اعلام کرده است که Gemini Robotics 1.5 می تواند به روبات ها کمک کند تا یکدیگر را بیاموزند ، حتی اگر پیکربندی های مختلفی داشته باشند. Google DeepMind کشف کرده است که وظایف ارائه شده در ربات Aloha2 ، که از دو بازوی مکانیکی تشکیل شده است ، “فقط کار کنید” روی این روبات با فرانکای بی-براکی و همچنین روبات انسان دوستانه Artonik Apollo. مهندس نرم افزار Google DeepMind ، Kanishka Rao در هنگام توجیهی گفت: “این دو چیز را برای ما فراهم می کند: یکی کنترل روبات های بسیار متفاوت – از جمله یک انسان دوستانه – با یک مدل واحد است.” “و ثانیاً ، مهارت های آموخته شده در یک ربات اکنون می تواند به ربات دیگری منتقل شود.”
به عنوان بخشی از به روزرسانی ، Google DeepMind در حال راه اندازی Gemini Robotics-er 1.5 از طریق Gemini API در Google برای مطالعه است ، در حالی که تنها شرکای منتخب می توانند به روباتیک Gemini 1.5 دسترسی پیدا کنند.
منبع: theverge
