برنامه OpenAI برای عرضه مدل «Open-Weight» با قابلیتهای استدلال
علاقهمندان به هوش مصنوعی، خواستههای شما شنیده شده است. OpenAI قصد دارد با عرضه یک مدل زبان قدرتمند و open-weight با قابلیتهای استدلال، به عرصه فناوریهای باز بازگردد. سم آلتمن، مدیرعامل OpenAI، روز دوشنبه اعلام کرد که این مدل در ماههای آینده عرضه خواهد شد.
آلتمن در پستی در شبکه اجتماعی X نوشت: «ما قصد داریم اولین مدل زبان open-weight خود را از زمان GPT-2 عرضه کنیم. مدتهاست که به این موضوع فکر میکنیم، اما اولویتهای دیگری وجود داشت. اکنون احساس میکنیم که این کار مهم است.»
رقابت فزاینده در حوزه مدلهای باز
این اعلامیه در حالی منتشر میشود که OpenAI با رقابت فزایندهای از سوی رقبایی مانند متا و خانواده مدلهای متنباز Llama، Gemma گوگل با قابلیتهای چندوجهی و آزمایشگاه هوش مصنوعی چینی DeepSeek مواجه است. DeepSeek اخیراً یک مدل استدلال متنباز را عرضه کرده که گفته میشود عملکرد بهتری نسبت به مدل o1 OpenAI داشته است.
یک مدل متنباز زمانی است که توسعهدهنده آن همه چیز را در مورد آن با عموم به اشتراک میگذارد - کاربران به کد، مجموعه داده آموزشی و معماری آن دسترسی دارند. این امر به کاربران امکان میدهد مدل را تغییر داده و بازتوزیع کنند. یک مدل open-weight کمتر باز است: کاربران میتوانند آن را تنظیم کنند، اما نمیتوانند آن را از ابتدا بسازند زیرا به عناصر کلیدی مانند مجموعه داده آموزشی یا معماری دسترسی ندارند.
جمعآوری بازخورد و همکاری با توسعهدهندگان
برای جمعآوری نظرات توسعهدهندگان، OpenAI یک فرم بازخورد در وبسایت خود منتشر کرده و برنامههایی برای رویدادهای توسعهدهندگان در سانفرانسیسکو در هفتههای آینده و سپس جلساتی در اروپا و مناطق آسیا-اقیانوسیه اعلام کرده است. این شرکت در بیانیهای اعلام کرد: «ما از همکاری با توسعهدهندگان، محققان و جامعه گستردهتر برای جمعآوری نظرات و مفیدتر کردن این مدل هیجانزده هستیم.»
استیون هایدل، که در تیم API OpenAI کار میکند، همچنین اعلام کرد که این مدل قابلیت اجرا بهصورت محلی را خواهد داشت: «ما امسال مدلی را عرضه میکنیم که میتوانید آن را روی سختافزار خود اجرا کنید.» او مشخص نکرد که این مدل چند پارامتر خواهد داشت، پنجره زمینه توکنها چگونه خواهد بود، مجموعه داده، تکنیکهای استفادهشده در آموزش یا مجوز انتشار آن چگونه خواهد بود.
تغییر استراتژی OpenAI
اعلامیه امروز نشاندهنده تغییر قابلتوجهی در استراتژی اخیر OpenAI است که مدلهای پیشرفته خود را پشت APIها نگه میداشت. این اقدام با اظهارات اخیر آلتمن در یک جلسه پرسش و پاسخ در Reddit همسو است، جایی که او برای اولین بار اعلام کرد که شرکت در حال بررسی ایده انتشار یک مدل کاملاً متنباز است.
آلتمن نوشت: «بله، ما در حال بحث درباره انتشار برخی از وزنهای مدل و انتشار برخی تحقیقات هستیم. من شخصاً فکر میکنم که ما در اینجا در سمت اشتباه تاریخ بودهایم و باید یک استراتژی متنباز متفاوت پیدا کنیم؛ همه در OpenAI این دیدگاه را ندارند و این همچنین اولویت اصلی ما نیست.»
طبق پست آلتمن، مدل آینده دارای قابلیتهای استدلالی مشابه مدل o3-mini OpenAI خواهد بود. این امر آن را به توانمندترین مدل استدلال باز تا به امروز تبدیل میکند و از مدل DeepSeek R1 پیشی میگیرد.