عامل جدید ChatGPT در OpenAI: انجام "تحقیقات عمیق" آنلاین
OpenAI یک عامل جدید به نام "تحقیقات عمیق" را برای محصول هوش مصنوعی شاخص خود، ChatGPT، معرفی کرده است که میتواند با جستجو در اینترنت، گزارشی در سطح یک تحلیلگر پژوهشی تهیه کند. OpenAI در یک پست وبلاگی در ۲ فوریه اعلام کرد که "تحقیقات عمیق" برای افرادی که در زمینههایی مانند امور مالی، علم، سیاست و مهندسی کار میکنند و به تحقیقات کامل، دقیق و قابل اعتماد نیاز دارند، ساخته شده است. این شرکت افزود که این ابزار همچنین برای تحقیق قبل از خرید اقلام گرانقیمتی مانند خودروها یا لوازم خانگی مفید است و خروجیهای آن—که میتواند بین ۵ تا ۳۰ دقیقه طول بکشد—"کاملاً مستند، با استنادهای واضح و خلاصهای از تفکر خود" ارائه میشود.
این عامل جدید پس از راهاندازی "اپراتور" در ۲۳ ژانویه توسط OpenAI معرفی شده است که یک عامل ChatGPT است که میتواند از اینترنت برای انجام وظایفی مانند سفارش مواد غذایی و رزرو تورهای تعطیلات استفاده کند. این اتفاق حدود یک هفته پس از آن رخ میدهد که فضای هوش مصنوعی و سهام فناوری ایالات متحده با مدل هوش مصنوعی جدیدی از شرکت چینی DeepSeek که گفته میشود به خوبی ChatGPT عمل میکند اما با هزینه بسیار کمتری توسعه یافته، دچار تلاطم شدند. گزارشها حاکی از آن است که مایکروسافت و OpenAI در حال بررسی این موضوع هستند که آیا دادههای API ChatGPT بهطور نادرست توسط گروهی مرتبط با DeepSeek به دست آمده است یا خیر.
OpenAI اعلام کرد که عامل "تحقیقات عمیق" در ارزیابی هوش مصنوعی جدیدی به نام "آخرین آزمون بشریت" که شامل ۳۰۰۰ سؤال در سطح کارشناسی در بیش از ۱۰۰ موضوع است، امتیاز بالایی کسب کرده و به دقت ۲۶.۶٪ دست یافته است، در حالی که مدل DeepSeek-R-1 امتیاز ۹.۴٪ و مدل GPT-4o خود OpenAI امتیاز ۳.۳٪ را کسب کرده بودند. این عامل توسط مدل o3 OpenAI که "بهینهسازی شده برای مرور وب و تحلیل دادهها" است، پشتیبانی میشود. o3 OpenAI جدیدترین "مدل استدلال" این شرکت است که سعی میکند بهطور اساسی خود را بررسی کند تا از اشتباهات جلوگیری کند.
OpenAI هشدار داد که "تحقیقات عمیق" "گاهی اوقات میتواند در پاسخها دچار توهم شود یا استنتاجات نادرست انجام دهد" و میتواند "در تشخیص اطلاعات معتبر از شایعات دچار مشکل شود". ماه گذشته، گوگل اعلام کرد که در اوایل سال ۲۰۲۵ ویژگی مشابهی را برای مدل هوش مصنوعی خود، Gemini، راهاندازی خواهد کرد، در حالی که OpenAI اعلام کرد که عامل آنها اکنون در طرح حرفهای ۲۰۰ دلاری در ماه خود، محدود به ۱۰۰ پرسش در ماه، در دسترس است.