cointelegraph
cointelegraph . ۱ سال پیش

ساخت رقیب GPT با کمتر از ۶ میلیون دلار؛ ظهور DeepSeek در ۶۰ روز

ساخت رقیب GPT با کمتر از ۶ میلیون دلار؛ ظهور DeepSeek در ۶۰ روز

DeepSeek؛ ضرورت نوآوری مسئولانه و مدیریت ریسک

از زمان راه‌اندازی در ۲۰ ژانویه، DeepSeek R1 توجه کاربران، غول‌های فناوری، دولت‌ها و سیاست‌گذاران را در سراسر جهان به خود جلب کرده است؛ از تحسین تا تردید، از پذیرش تا ممنوعیت، از نبوغ نوآورانه تا آسیب‌پذیری‌های غیرقابل اندازه‌گیری در حریم خصوصی و امنیت. چه کسی درست می‌گوید؟ پاسخ کوتاه: همه و هیچ‌کس.

DeepSeek یک مدل زبان بزرگ (LLM) با عملکرد قابل مقایسه با GTPo1 OpenAI توسعه داده است، آن هم در کسری از زمان و هزینه‌ای که OpenAI (و سایر شرکت‌های فناوری) برای ساخت LLM خود صرف کرده‌اند. با استفاده از بهینه‌سازی هوشمند معماری که هزینه آموزش و استنتاج مدل را کاهش می‌دهد، DeepSeek توانست در کمتر از ۶۰ روز و با هزینه کمتر از ۶ میلیون دلار یک LLM توسعه دهد.

در واقع، باید از DeepSeek به خاطر پیشگامی در یافتن راه‌های بهتر برای بهینه‌سازی ساختار و کد مدل تقدیر کرد. این یک زنگ بیدارباش است، اما نه یک «لحظه اسپوتنیک». هر توسعه‌دهنده‌ای می‌داند که دو راه برای افزایش عملکرد وجود دارد: بهینه‌سازی کد و «استفاده» از قدرت محاسباتی زیاد. گزینه دوم بسیار پرهزینه است و به توسعه‌دهندگان همیشه توصیه می‌شود قبل از توسل به محاسبات بیشتر، بهینه‌سازی معماری را به حداکثر برسانند. به نظر می‌رسد با ارزش‌گذاری‌های بالای استارتاپ‌های هوش مصنوعی و سرمایه‌گذاری‌های عظیمی که به سمت آنها سرازیر می‌شود، توسعه‌دهندگان تنبل شده‌اند. چرا وقتی میلیاردها دلار برای قدرت محاسباتی در اختیار دارید، وقت خود را صرف بهینه‌سازی معماری مدل کنید؟ این یک زنگ بیدارباش برای همه توسعه‌دهندگان است تا به اصول اولیه بازگردند. نوآوری مسئولانه داشته باشید، از منطقه راحتی خود خارج شوید، خارج از چارچوب فکر کنید و از به چالش کشیدن هنجارها نترسید. نیازی به هدر دادن پول و منابع نیست - از آنها عاقلانه استفاده کنید.

مانند هر LLM دیگری، DeepSeek R1 در استدلال، قابلیت‌های برنامه‌ریزی پیچیده، درک دنیای فیزیکی و حافظه مداوم ضعف دارد. بنابراین، در اینجا هیچ نوآوری شگفت‌انگیزی وجود ندارد. زمان آن فرا رسیده است که دانشمندان فراتر از LLMها عمل کنند، این محدودیت‌ها را برطرف کنند و «الگوی جدیدی از معماری‌های هوش مصنوعی» را توسعه دهند. این ممکن است LLM یا هوش مصنوعی مولد نباشد - یک انقلاب واقعی.

رویکرد DeepSeek می‌تواند توسعه‌دهندگان سراسر جهان، از جمله کشورهای در حال توسعه، را تشویق کند تا بدون توجه به منابع کم، نوآوری کنند و برنامه‌های هوش مصنوعی خود را توسعه دهند. هرچه افراد بیشتری در تحقیق و توسعه هوش مصنوعی مشارکت داشته باشند، نوآوری سریع‌تر پیشرفت می‌کند و پیشرفت‌های معنادار ممکن است حاصل شود. این با چشم‌انداز Nvidia همسو است: مقرون‌به‌صرفه کردن هوش مصنوعی و امکان توسعه برنامه‌های هوش مصنوعی توسط هر توسعه‌دهنده یا دانشمند. این معنای پروژه DIGITS است که در اوایل ژانویه اعلام شد، یک GPU 3000 دلاری برای دسکتاپ شما. بشریت به «همه ذهن‌ها» نیاز دارد تا مشکلات فوری خود را حل کند. منابع ممکن است دیگر مانعی نباشند - زمان آن فرا رسیده است که پارادایم‌های قدیمی را به هم بزنیم.

مدیریت ریسک و مسئولیت‌پذیری

در عین حال، انتشار DeepSeek نیز یک زنگ بیدارباش برای مدیریت ریسک قابل اجرا و هوش مصنوعی مسئولانه بود. همه برنامه‌ها دارای شرایط خدمات هستند که عموم مردم اغلب تمایل به نادیده گرفتن آنها دارند. برخی جزئیات نگران‌کننده در شرایط خدمات DeepSeek که می‌تواند بر حریم خصوصی، امنیت و حتی استراتژی کسب‌وکار شما تأثیر بگذارد:

موارد فوق نقض آشکار مقررات عمومی حفاظت از داده‌ها (GDPR) و سایر نقض‌های حریم خصوصی و امنیت GDPR است، همانطور که در شکایات ارائه شده توسط بلژیک، ایرلند و ایتالیا که همچنین به طور موقت استفاده از DeepSeek را ممنوع کردند، بیان شده است. در مارس ۲۰۲۳، تنظیم‌کننده‌های ایتالیایی به طور موقت ChatGPT OpenAI را به دلیل نقض GDPR ممنوع کردند و پس از بهبودهای انطباق، یک ماه بعد اجازه بازگشت آن به اینترنت را دادند. آیا DeepSeek نیز تبعیت خواهد کرد؟

مانند سایر LLMها، DeepSeek R1 دچار توهم می‌شود، در داده‌های آموزشی خود سوگیری دارد و رفتارهایی را نشان می‌دهد که منعکس‌کننده دیدگاه‌های سیاسی چین در موضوعات خاص، مانند سانسور و حریم خصوصی است. به عنوان یک شرکت چینی، این چیزی است که انتظار می‌رود. قانون هوش مصنوعی مولد چین، که برای ارائه‌دهندگان و کاربران سیستم‌های هوش مصنوعی اعمال می‌شود، در ماده ۴ بیان می‌کند:

این یک قانون سانسور است. این بدان معناست که کسانی که هوش مصنوعی مولد را توسعه می‌دهند و/یا از آن استفاده می‌کنند باید از «ارزش‌های اصلی سوسیالیستی» حمایت کنند و از قوانین چین که این موضوع را تنظیم می‌کنند پیروی کنند. این به معنای آن نیست که سایر LLMها سوگیری‌ها و «دستور کار» خاص خود را ندارند. این توجه را به نیاز به هوش مصنوعی قابل اعتماد و مسئول و کاربران برای پایبندی به مدیریت ریسک هوش مصنوعی جلب می‌کند.

LLMها ممکن است در معرض حملات خصمانه و آسیب‌پذیری‌های امنیتی قرار گیرند. این آسیب‌پذیری‌ها حتی نگران‌کننده‌تر هستند، زیرا بر هر برنامه‌ای که بر اساس این LLM توسط هر سازمان یا فرد ساخته شده باشد تأثیر می‌گذارند. Qualys نسخه تقطیر شده DeepSeek-R1 LLaMA 8B را از نظر آسیب‌پذیری‌ها، نگرانی‌های اخلاقی و ریسک‌های قانونی آزمایش کرده است. مدل در نیمی از حملات jailbreak - یعنی تلاش‌ها برای دور زدن اقدامات ایمنی و دستورالعمل‌های اخلاقی ساخته شده در مدل‌های هوش مصنوعی مانند LLMها - شکست خورد.

گلدمن ساکس در حال بررسی استفاده از DeepSeek است، اما مدل به یک غربالگری امنیتی، مانند تزریق اعلان‌ها و jailbreak نیاز دارد. این یک نگرانی امنیتی برای هر شرکتی است که از یک مدل هوش مصنوعی برای تقویت برنامه‌های خود استفاده می‌کند، چه آن مدل چینی باشد یا نه. گلدمن ساکس در حال اجرای مدیریت ریسک صحیح است و سایر سازمان‌ها باید قبل از تصمیم‌گیری برای استفاده از DeepSeek از این رویکرد پیروی کنند. ما باید هوشیار و دقیق باشیم و قبل از استفاده از هر سیستم یا برنامه هوش مصنوعی، مدیریت ریسک مناسب را اجرا کنیم.

برای کاهش «دستور کار» و سانسور ناشی از توسعه متمرکز هر LLM، ممکن است بخواهیم هوش مصنوعی غیرمتمرکز را در نظر بگیریم، ترجیحاً به صورت یک سازمان مستقل غیرمتمرکز (DAO) ساختار یافته باشد. هوش مصنوعی مرز نمی‌شناسد. ممکن است زمان آن فرا رسیده باشد که مقررات جهانی یکپارچه هوش مصنوعی را در نظر بگیریم.

نوشته شده توسط admin
497

نظرات

هنوز دیدگاهی ثبت نشده است.