ورود به «عصر جدید عاملها» با عاملهای هوش مصنوعی مبتنی بر Gemini 2.0
آزمایشگاه تحقیقاتی هوش مصنوعی گوگل، DeepMind، اعلام کرده است که مدل هوش مصنوعی جدید خود، Gemini 2.0، پایه و اساس ساخت عاملهای هوش مصنوعی پیشرفتهتر خواهد بود. یک عامل هوش مصنوعی مبتنی بر Gemini 2.0 که در ۱۱ دسامبر منتشر شد، میتواند دستورالعملهای پیچیده را درک کند، برنامهریزی و استدلال کند، در وبسایتها اقدام کند و حتی در استراتژی بازیهای ویدیویی کمک کند. دمیس هسابیس، مدیرعامل Google DeepMind، و کورای کاووکچوغلو، مدیر ارشد فناوری، در یک پست وبلاگی در ۱۱ دسامبر اعلام کردند.
هسابیس و کاووکچوغلو گفتند: «کاربرد عملی عاملهای هوش مصنوعی یک حوزه تحقیقاتی پر از امکانات هیجانانگیز است. ما در حال بررسی این مرز جدید با مجموعهای از نمونههای اولیه هستیم که میتوانند به مردم در انجام وظایف و کارها کمک کنند.»
به گفته هسابیس و کاووکچوغلو، چندین پروژه دستیار هوش مصنوعی آزمایشی مبتنی بر Gemini وجود دارد که هر کدام عملکرد متفاوتی دارند. یکی از آنها، به نام Deep Research، میتواند با جستجو در وب و سپس تولید یک گزارش طولانی از یافتههای خود، به کاربران در بررسی موضوعات پیچیده کمک کند. Project Astra، یک دستیار هوش مصنوعی جهانی، برای وظایف روزمره مانند ارائه توصیهها و مشاوره بر اساس درخواستهای کاربر طراحی شده است، مانند نحوه شستن لباسها یا اطلاعات بیشتر درباره یک مکان دیدنی.
Project Mariner بر ایجاد یک عامل هوش مصنوعی تمرکز دارد که میتواند کنترل مرورگر Chrome شما را به دست بگیرد، نشانگر را حرکت دهد، دکمهها را کلیک کند، فرمها را پر کند و در وبسایتها پیمایش کند. به گفته هسابیس و کاووکچوغلو، این پروژهها «هنوز در مراحل اولیه توسعه» هستند، اما آنها امیدوارند پس از آزمایش و توسعه بیشتر، آنها را «به طور گسترده در محصولات در آینده» در دسترس قرار دهند. «هنوز زود است، اما Project Mariner نشان میدهد که امکان پیمایش در یک مرورگر به صورت فنی در حال تحقق است، اگرچه امروز همیشه دقیق نیست و کند عمل میکند، که به سرعت بهبود خواهد یافت.»
در همین حال، Project Jules به عنوان یک دستیار برای توسعهدهندگان در حال توسعه است که میتواند به طور مستقیم در جریان کاری GitHub ادغام شود و در وظایفی مانند کدنویسی و برنامهریزی کمک کند. هسابیس و کاووکچوغلو گفتند که آنها همچنین عاملهایی را با استفاده از Gemini 2.0 برای بازیهای ویدیویی ساختهاند که میتوانند در مکالمات بلادرنگ به بازیکن پیشنهادات ارائه دهند و به جستجوی «دانش گسترده بازی» آنلاین بپردازند. آنها گفتند: «ما با توسعهدهندگان برجسته بازی مانند Supercell همکاری میکنیم تا ببینیم این عاملها چگونه کار میکنند و توانایی آنها را در تفسیر قوانین و چالشها در طیف گستردهای از بازیها، از عناوین استراتژی تا شبیهسازهای کشاورزی، آزمایش میکنیم.»
در نوامبر، مارک بنیوف، مدیرعامل شرکت نرمافزاری رایانش ابری آمریکایی Salesforce، گفت که آینده هوش مصنوعی در عاملهای خودمختار نهفته است، نه مدلهای زبانی بزرگ (LLMها). او در پادکست «آینده همه چیز» وال استریت ژورنال در ۲۳ نوامبر گفت: «من واقعاً فکر میکنم که ما در حال رسیدن به محدودیتهای بالای LLMها هستیم.» انویدیا نیز در حال تمرکز بر قرار گرفتن در این روند است. جنسن هوانگ، مدیرعامل انویدیا، در یک تماس درآمدی سهماهه در نوامبر گفت: «ما شاهد رشد تعداد شرکتهای بومی هوش مصنوعی هستیم. و البته، ما شروع به دیدن پذیرش سازمانی هوش مصنوعی عاملمحور کردهایم که واقعاً آخرین هیجان است.»
علاوه بر این، هسابیس و کاووکچوغلو میگویند که تیم آنها در حال «آزمایش عاملهایی که میتوانند در دنیای فیزیکی از طریق رباتیک کمک کنند» نیز هست. عاملهای هوش مصنوعی گوگل در این مرحله فقط برای آزمایشکنندگان و توسعهدهندگان منتشر میشوند.