تحقیق مایکروسافت درباره گروه مرتبط با DeepSeek به دلیل روش جمعآوری دادههای OpenAI
مایکروسافت و OpenAI در حال بررسی این موضوع هستند که آیا دادههای فناوری OpenAI توسط گروهی مرتبط با استارتاپ چینی DeepSeek بهطور نادرست به دست آمده است یا خیر. به گزارش بلومبرگ در ۲۹ ژانویه، محققان امنیتی مایکروسافت در اواخر سال ۲۰۲۴، استخراج دادههای گسترده و مشکوکی را از طریق رابط برنامهنویسی کاربردی (API) OpenAI شناسایی کردند.
مایکروسافت، بزرگترین سرمایهگذار OpenAI، این شرکت را از این فعالیت مطلع کرد که میتواند نقض شرایط خدمات سازنده ChatGPT باشد یا به معنای دور زدن محدودیتهای دسترسی به دادهها توسط این گروه تلقی شود. در ۲۰ ژانویه، DeepSeek مستقر در چین، جدیدترین مدل هوش مصنوعی خود به نام R-1 را منتشر کرد که بهگفتهها با هزینه ساخت بسیار کمتر، عملکردی مشابه ChatGPT دارد. این اعلامیه باعث کاهش ارزش سهام فناوری و هوش مصنوعی در بازار ایالات متحده شد.
دیوید ساکس، مسئول هوش مصنوعی کاخ سفید، در ۲۸ ژانویه به فاکس نیوز گفت که شواهدی وجود دارد که DeepSeek از خروجیهای مدل OpenAI برای آموزش هوش مصنوعی خود از طریق فرآیندی به نام "تقطیر" استفاده کرده است. در این فرآیند، یک مدل هوش مصنوعی از خروجیهای مدل دیگر برای آموزش و توسعه قابلیتهای مشابه استفاده میکند. او گفت: «شواهد قابل توجهی وجود دارد که DeepSeek دانش را از مدلهای OpenAI استخراج کرده است و فکر نمیکنم OpenAI از این موضوع خوشحال باشد.»
OpenAI نگرانیهای کلی درباره تلاش شرکتهای چینی برای استخراج مدلهای هوش مصنوعی ایالات متحده را تأیید کرد اما به طور خاص به DeepSeek اشارهای نکرد. سخنگوی OpenAI به بلومبرگ گفت: «ما میدانیم که شرکتهای مستقر در جمهوری خلق چین - و دیگران - به طور مداوم در تلاش هستند تا مدلهای شرکتهای پیشرو هوش مصنوعی ایالات متحده را استخراج کنند.»
این تحقیقات بر روی نقض احتمالی شرایط خدمات OpenAI یا دور زدن محدودیتهای دسترسی به دادهها متمرکز است و تنشهای فزاینده در رقابت فناوری هوش مصنوعی بین ایالات متحده و چین را برجسته میکند. در همین حال، CNBC در ۲۸ ژانویه گزارش داد که نیروی دریایی ایالات متحده استفاده از DeepSeek را به دلیل نگرانی از سوءاستفاده دولت چین از دادههای حساس برای اعضای خود ممنوع کرده است. نیروی دریایی در ۲۴ ژانویه ایمیلی به پرسنل ارسال کرد و اعلام کرد که این مدل هوش مصنوعی به دلیل «نگرانیهای امنیتی و اخلاقی» نباید «به هیچ وجه» استفاده شود.