DeepSeek؛ ضرورت نوآوری مسئولانه و مدیریت ریسک
از زمان راهاندازی در ۲۰ ژانویه، DeepSeek R1 توجه کاربران، غولهای فناوری، دولتها و سیاستگذاران را در سراسر جهان به خود جلب کرده است؛ از تحسین تا تردید، از پذیرش تا ممنوعیت، از نبوغ نوآورانه تا آسیبپذیریهای غیرقابل اندازهگیری در حریم خصوصی و امنیت. چه کسی درست میگوید؟ پاسخ کوتاه: همه و هیچکس.
DeepSeek یک مدل زبان بزرگ (LLM) با عملکرد قابل مقایسه با GTPo1 OpenAI توسعه داده است، آن هم در کسری از زمان و هزینهای که OpenAI (و سایر شرکتهای فناوری) برای ساخت LLM خود صرف کردهاند. با استفاده از بهینهسازی هوشمند معماری که هزینه آموزش و استنتاج مدل را کاهش میدهد، DeepSeek توانست در کمتر از ۶۰ روز و با هزینه کمتر از ۶ میلیون دلار یک LLM توسعه دهد.
در واقع، باید از DeepSeek به خاطر پیشگامی در یافتن راههای بهتر برای بهینهسازی ساختار و کد مدل تقدیر کرد. این یک زنگ بیدارباش است، اما نه یک «لحظه اسپوتنیک». هر توسعهدهندهای میداند که دو راه برای افزایش عملکرد وجود دارد: بهینهسازی کد و «استفاده» از قدرت محاسباتی زیاد. گزینه دوم بسیار پرهزینه است و به توسعهدهندگان همیشه توصیه میشود قبل از توسل به محاسبات بیشتر، بهینهسازی معماری را به حداکثر برسانند. به نظر میرسد با ارزشگذاریهای بالای استارتاپهای هوش مصنوعی و سرمایهگذاریهای عظیمی که به سمت آنها سرازیر میشود، توسعهدهندگان تنبل شدهاند. چرا وقتی میلیاردها دلار برای قدرت محاسباتی در اختیار دارید، وقت خود را صرف بهینهسازی معماری مدل کنید؟ این یک زنگ بیدارباش برای همه توسعهدهندگان است تا به اصول اولیه بازگردند. نوآوری مسئولانه داشته باشید، از منطقه راحتی خود خارج شوید، خارج از چارچوب فکر کنید و از به چالش کشیدن هنجارها نترسید. نیازی به هدر دادن پول و منابع نیست - از آنها عاقلانه استفاده کنید.
مانند هر LLM دیگری، DeepSeek R1 در استدلال، قابلیتهای برنامهریزی پیچیده، درک دنیای فیزیکی و حافظه مداوم ضعف دارد. بنابراین، در اینجا هیچ نوآوری شگفتانگیزی وجود ندارد. زمان آن فرا رسیده است که دانشمندان فراتر از LLMها عمل کنند، این محدودیتها را برطرف کنند و «الگوی جدیدی از معماریهای هوش مصنوعی» را توسعه دهند. این ممکن است LLM یا هوش مصنوعی مولد نباشد - یک انقلاب واقعی.
رویکرد DeepSeek میتواند توسعهدهندگان سراسر جهان، از جمله کشورهای در حال توسعه، را تشویق کند تا بدون توجه به منابع کم، نوآوری کنند و برنامههای هوش مصنوعی خود را توسعه دهند. هرچه افراد بیشتری در تحقیق و توسعه هوش مصنوعی مشارکت داشته باشند، نوآوری سریعتر پیشرفت میکند و پیشرفتهای معنادار ممکن است حاصل شود. این با چشمانداز Nvidia همسو است: مقرونبهصرفه کردن هوش مصنوعی و امکان توسعه برنامههای هوش مصنوعی توسط هر توسعهدهنده یا دانشمند. این معنای پروژه DIGITS است که در اوایل ژانویه اعلام شد، یک GPU 3000 دلاری برای دسکتاپ شما. بشریت به «همه ذهنها» نیاز دارد تا مشکلات فوری خود را حل کند. منابع ممکن است دیگر مانعی نباشند - زمان آن فرا رسیده است که پارادایمهای قدیمی را به هم بزنیم.
مدیریت ریسک و مسئولیتپذیری
در عین حال، انتشار DeepSeek نیز یک زنگ بیدارباش برای مدیریت ریسک قابل اجرا و هوش مصنوعی مسئولانه بود. همه برنامهها دارای شرایط خدمات هستند که عموم مردم اغلب تمایل به نادیده گرفتن آنها دارند. برخی جزئیات نگرانکننده در شرایط خدمات DeepSeek که میتواند بر حریم خصوصی، امنیت و حتی استراتژی کسبوکار شما تأثیر بگذارد:
موارد فوق نقض آشکار مقررات عمومی حفاظت از دادهها (GDPR) و سایر نقضهای حریم خصوصی و امنیت GDPR است، همانطور که در شکایات ارائه شده توسط بلژیک، ایرلند و ایتالیا که همچنین به طور موقت استفاده از DeepSeek را ممنوع کردند، بیان شده است. در مارس ۲۰۲۳، تنظیمکنندههای ایتالیایی به طور موقت ChatGPT OpenAI را به دلیل نقض GDPR ممنوع کردند و پس از بهبودهای انطباق، یک ماه بعد اجازه بازگشت آن به اینترنت را دادند. آیا DeepSeek نیز تبعیت خواهد کرد؟
مانند سایر LLMها، DeepSeek R1 دچار توهم میشود، در دادههای آموزشی خود سوگیری دارد و رفتارهایی را نشان میدهد که منعکسکننده دیدگاههای سیاسی چین در موضوعات خاص، مانند سانسور و حریم خصوصی است. به عنوان یک شرکت چینی، این چیزی است که انتظار میرود. قانون هوش مصنوعی مولد چین، که برای ارائهدهندگان و کاربران سیستمهای هوش مصنوعی اعمال میشود، در ماده ۴ بیان میکند:
این یک قانون سانسور است. این بدان معناست که کسانی که هوش مصنوعی مولد را توسعه میدهند و/یا از آن استفاده میکنند باید از «ارزشهای اصلی سوسیالیستی» حمایت کنند و از قوانین چین که این موضوع را تنظیم میکنند پیروی کنند. این به معنای آن نیست که سایر LLMها سوگیریها و «دستور کار» خاص خود را ندارند. این توجه را به نیاز به هوش مصنوعی قابل اعتماد و مسئول و کاربران برای پایبندی به مدیریت ریسک هوش مصنوعی جلب میکند.
LLMها ممکن است در معرض حملات خصمانه و آسیبپذیریهای امنیتی قرار گیرند. این آسیبپذیریها حتی نگرانکنندهتر هستند، زیرا بر هر برنامهای که بر اساس این LLM توسط هر سازمان یا فرد ساخته شده باشد تأثیر میگذارند. Qualys نسخه تقطیر شده DeepSeek-R1 LLaMA 8B را از نظر آسیبپذیریها، نگرانیهای اخلاقی و ریسکهای قانونی آزمایش کرده است. مدل در نیمی از حملات jailbreak - یعنی تلاشها برای دور زدن اقدامات ایمنی و دستورالعملهای اخلاقی ساخته شده در مدلهای هوش مصنوعی مانند LLMها - شکست خورد.
گلدمن ساکس در حال بررسی استفاده از DeepSeek است، اما مدل به یک غربالگری امنیتی، مانند تزریق اعلانها و jailbreak نیاز دارد. این یک نگرانی امنیتی برای هر شرکتی است که از یک مدل هوش مصنوعی برای تقویت برنامههای خود استفاده میکند، چه آن مدل چینی باشد یا نه. گلدمن ساکس در حال اجرای مدیریت ریسک صحیح است و سایر سازمانها باید قبل از تصمیمگیری برای استفاده از DeepSeek از این رویکرد پیروی کنند. ما باید هوشیار و دقیق باشیم و قبل از استفاده از هر سیستم یا برنامه هوش مصنوعی، مدیریت ریسک مناسب را اجرا کنیم.
برای کاهش «دستور کار» و سانسور ناشی از توسعه متمرکز هر LLM، ممکن است بخواهیم هوش مصنوعی غیرمتمرکز را در نظر بگیریم، ترجیحاً به صورت یک سازمان مستقل غیرمتمرکز (DAO) ساختار یافته باشد. هوش مصنوعی مرز نمیشناسد. ممکن است زمان آن فرا رسیده باشد که مقررات جهانی یکپارچه هوش مصنوعی را در نظر بگیریم.