زیرساخت دادههای متمرکز، ناقض هسته غیرمتمرکز وب ۳
دادههای باز در حال حاضر یکی از عوامل اصلی در ساخت اقتصاد فناوریهای نوظهور جهانی هستند و بازار آن بیش از ۳۵۰ میلیارد دلار برآورد میشود. با این حال، منابع دادههای باز اغلب به زیرساختهای متمرکز متکی هستند که برخلاف فلسفه استقلال و مقاومت در برابر سانسور است. برای تحقق پتانسیل خود، دادههای باز باید به زیرساختهای غیرمتمرکز منتقل شوند. هنگامی که کانالهای دادههای باز از زیرساختهای غیرمتمرکز و باز استفاده کنند، چندین آسیبپذیری برای برنامههای کاربردی کاربر حل خواهد شد.
کاربردهای زیرساخت باز
زیرساخت باز کاربردهای زیادی دارد، از میزبانی یک برنامه غیرمتمرکز (DApp) یا ربات معاملاتی گرفته تا اشتراکگذاری دادههای تحقیقاتی برای آموزش و استنتاج مدلهای زبان بزرگ (LLM). بررسی دقیق هر یک از این موارد به ما کمک میکند تا بهتر درک کنیم چرا استفاده از زیرساخت غیرمتمرکز برای دادههای باز نسبت به زیرساخت متمرکز کاربردیتر است.
قدرت پروتکلهای منبع باز
راهاندازی هوش مصنوعی منبع باز DeepSeek، که ۱ تریلیون دلار از بازارهای فناوری ایالات متحده را تحت تأثیر قرار داد، قدرت پروتکلهای منبع باز را نشان میدهد. این یک زنگ بیدارباش برای تمرکز بر اقتصاد جدید دادههای باز است. در ابتدا، مدلهای هوش مصنوعی متمرکز و بسته هزینههای بالایی برای آموزش LLMها و تولید نتایج دقیق دارند. جای تعجب نیست که مرحله نهایی آموزش DeepSeek R1 تنها حدود ۵.۵ میلیون دلار هزینه داشت، در حالی که این رقم برای GPT-4 شرکت OpenAI بیش از ۱۰۰ میلیون دلار بود.
چالشهای زیرساخت متمرکز در صنعت هوش مصنوعی
با این حال، صنعت نوظهور هوش مصنوعی همچنان به پلتفرمهای زیرساخت متمرکز مانند ارائهدهندگان API LLM متکی است که اساساً با نوآوریهای منبع باز در تضاد هستند. میزبانی LLMهای منبع باز مانند Llama 2 و DeepSeek R1 ساده و کمهزینه است. برخلاف بلاکچینهای حالتدار که نیاز به همگامسازی مداوم دارند، LLMها بدون حالت هستند و فقط به بهروزرسانیهای دورهای نیاز دارند. با وجود این سادگی، هزینههای محاسباتی اجرای استنتاج بر روی مدلهای منبع باز بالا است، زیرا اجراکنندگان گره به GPU نیاز دارند. این مدلها میتوانند در هزینهها صرفهجویی کنند زیرا نیازی به بهروزرسانیهای بلادرنگ برای همگامسازی مداوم ندارند.
مزایای زیرساخت غیرمتمرکز برای مدلهای زبان بزرگ
ظهور مدلهای پایه قابل تعمیم مانند GPT-4 توسعه محصولات جدید را از طریق استنتاج متنی امکانپذیر کرده است. شرکتهای متمرکزی مانند OpenAI اجازه پشتیبانی یا استنتاج از شبکههای تصادفی را از مدل آموزشدیده خود نمیدهند. برعکس، اجراکنندگان گره غیرمتمرکز میتوانند با ارائه خدمات بهعنوان نقاط پایانی هوش مصنوعی، توسعه LLMهای منبع باز را پشتیبانی کنند و دادههای قطعی را به مشتریان ارائه دهند. شبکههای غیرمتمرکز با توانمندسازی اپراتورها برای راهاندازی دروازه خود بر روی شبکه، موانع ورود را کاهش میدهند. این پروتکلهای زیرساخت غیرمتمرکز با منبع باز کردن دروازه اصلی و زیرساخت خدمات، میلیونها درخواست را در شبکههای بدون مجوز خود سرویسدهی میکنند. در نتیجه، هر کارآفرین یا اپراتوری میتواند دروازه خود را مستقر کرده و به یک بازار نوظهور دسترسی پیدا کند.
پتانسیل بازار آموزش و استنتاج هوش مصنوعی
به عنوان مثال، شخصی میتواند یک LLM را با منابع محاسباتی غیرمتمرکز در پروتکل بدون مجوز Akash آموزش دهد که خدمات محاسباتی سفارشی را با ۸۵٪ قیمت کمتر از ارائهدهندگان ابری متمرکز امکانپذیر میکند. بازار آموزش و استنتاج هوش مصنوعی پتانسیل عظیمی دارد. شرکتهای هوش مصنوعی روزانه حدود ۱ میلیون دلار برای نگهداری زیرساخت جهت اجرای استنتاج LLM هزینه میکنند. این امر بازار خدمات قابل دستیابی (SAM) را به حدود ۳۶۵ میلیون دلار در سال میرساند. همانطور که دادهها نشان میدهند، شرایط بازار نشاندهنده پتانسیل رشد عظیم برای زیرساختهای غیرمتمرکز است.
تسریع تحقیقات علمی با دادههای باز
در حوزه علمی و تحقیقاتی، اشتراکگذاری دادهها همراه با یادگیری ماشین و LLMها میتواند بهطور بالقوه تحقیقات را تسریع کرده و زندگی انسان را بهبود بخشد. دسترسی به آن دادهها توسط سیستم مجلات پرهزینه که بهطور انتخابی تحقیقاتی را که هیئت مدیره آن تأیید میکند منتشر میکند و بهطور گستردهای پشت اشتراکهای گرانقیمت غیرقابل دسترسی است، محدود شده است. با ظهور مدلهای یادگیری ماشین مبتنی بر بلاکچین و بدون افشای اطلاعات، دادهها اکنون میتوانند بهصورت قابل اعتماد به اشتراک گذاشته و محاسبه شوند و حریم خصوصی بدون افشای دادههای حساس حفظ شود. بنابراین، محققان و دانشمندان میتوانند دادههای تحقیقاتی را بدون افشای اطلاعات شناسایی شخصی بالقوه محدود به اشتراک بگذارند و به آنها دسترسی داشته باشند.
ضرورت زیرساخت غیرمتمرکز برای اشتراکگذاری پایدار دادههای تحقیقاتی
برای اشتراکگذاری پایدار دادههای تحقیقاتی باز، محققان به زیرساخت غیرمتمرکزی نیاز دارند که آنها را برای دسترسی به آن دادهها پاداش دهد و واسطهها را حذف کند. یک شبکه دادههای باز با انگیزه میتواند اطمینان حاصل کند که دادههای علمی خارج از باغ محصور مجلات گرانقیمت و شرکتهای خصوصی قابل دسترسی باقی میمانند.
چالشهای پلتفرمهای میزبانی داده متمرکز
پلتفرمهای میزبانی داده متمرکز مانند Amazon Web Services، Google Cloud و Microsoft Azure در میان توسعهدهندگان برنامه محبوب هستند. با وجود دسترسی آسان، پلتفرمهای متمرکز از یک نقطه شکست واحد رنج میبرند که بر قابلیت اطمینان تأثیر میگذارد و منجر به قطعیهای نادر اما محتمل میشود. موارد مختلفی در تاریخ فناوری وجود داشته است که پلتفرمهای زیرساخت بهعنوان سرویس نتوانستهاند خدمات بدون وقفه ارائه دهند. به عنوان مثال، در سال ۲۰۲۲، MetaMask بهطور موقت دسترسی کاربران از مناطق جغرافیایی خاص را به دلیل مسدود شدن توسط Infura پس از برخی تحریمهای ایالات متحده رد کرد. اگرچه MetaMask غیرمتمرکز است، اتصالات و نقاط پایانی پیشفرض آن به فناوری متمرکزی مانند Infura برای دسترسی به اتریوم وابسته است. این یک حادثه منفرد نبود. مشتریان Infura همچنین در سال ۲۰۲۰ با وقفه مواجه شدند، در حالی که Solana و Polygon در طول ترافیک اوج با بارگذاری بیش از حد فراخوانیهای رویه از راه دور متمرکز (RPC) مواجه شدند.
محدودیتهای پلتفرمهای متمرکز در اکوسیستم منبع باز
برای یک شرکت دشوار است که نیازهای متنوع توسعهدهندگان را در یک اکوسیستم منبع باز در حال رشد برآورده کند. هزاران پروتکل لایه ۱، رولآپ، نمایهسازی، ذخیرهسازی و سایر پروتکلهای میانافزار با موارد استفاده خاص وجود دارند. اکثر پلتفرمهای متمرکز، مانند ارائهدهندگان RPC، به ساخت همان زیرساخت ادامه میدهند که باعث ایجاد اصطکاک، کندی معیارهای رشد و تأثیر بر مقیاسپذیری میشود زیرا پروتکلها به جای افزودن ویژگیهای جدید بر بازسازی زیرساخت تمرکز میکنند.
موفقیت شبکههای اجتماعی غیرمتمرکز
برعکس، موفقیت عظیم برنامههای شبکههای اجتماعی غیرمتمرکز مانند BlueSky و AT Protocol نشاندهنده جستجوی کاربران برای پروتکلهای غیرمتمرکز است. با عبور از RPCهای متمرکز به دسترسی به دادههای باز، چنین پروتکلهایی به ما یادآوری میکنند که نیاز به ساخت و کار بر روی زیرساختهای غیرمتمرکز داریم. به عنوان مثال، یک پروتکل مالی غیرمتمرکز میتواند دادههای قیمت زنجیرهای را از Chainlink دریافت کند تا به APIهای متمرکز برای فیدهای قیمت و دادههای بازار بلادرنگ وابسته نباشد.
پتانسیل بازار درخواستهای RPC در وب ۳
تقریباً ۱۰۰ میلیارد درخواست RPC قابل سرویسدهی در بازار وب ۳ وجود دارد که هزینه آن ۳ تا ۶ دلار به ازای هر میلیون درخواست است. بنابراین، اندازه بازار قابل دسترسی RPC وب ۳ سالانه ۱۰۰ میلیون تا ۲۰۰ میلیون دلار است. با رشد پایدار لایههای جدید دسترسی به دادهها، میتواند بیش از ۱ تریلیون درخواست RPC در روز وجود داشته باشد. ضروری است که به سمت زیرساختهای غیرمتمرکز حرکت کنیم تا با انتقال دادههای باز همگام شویم و به بازار دادههای منبع باز دسترسی پیدا کنیم.
آینده زیرساختهای بلاکچین
در بلندمدت، شاهد خواهیم بود که مشتریان بلاکچین عمومی ذخیرهسازی و شبکهسازی را به پروتکلهای میانافزار تخصصی واگذار میکنند. به عنوان مثال، Solana رهبری حرکت به سمت غیرمتمرکزسازی را بر عهده داشت زمانی که برای اولین بار شروع به ذخیره دادههای خود در زنجیرههایی مانند Arweave کرد. جای تعجب نیست که Solana و Phantom بار دیگر ابزارهای اصلی برای مدیریت ترافیک عظیم میمکوین ریاستجمهوری TRUMP بودند که لحظهای کلیدی در تاریخ مالی و فرهنگی بود. در آینده، شاهد جریان بیشتر دادهها از طریق پروتکلهای زیرساخت خواهیم بود که وابستگیهایی به پلتفرمهای میانافزار ایجاد میکند. با ماژولار و مقیاسپذیرتر شدن پروتکلها، فضای بیشتری برای ادغام میانافزارهای منبع باز و غیرمتمرکز در سطح پروتکل ایجاد خواهد شد.
مزایای زیرساخت غیرمتمرکز
غیرممکن است که شرکتهای متمرکز بهعنوان واسطه برای هدرهای مشتریان سبک عمل کنند. زیرساخت غیرمتمرکز قابل اعتماد، توزیعشده، مقرونبهصرفه و مقاوم در برابر سانسور است. در نتیجه، زیرساخت غیرمتمرکز انتخاب پیشفرض برای توسعهدهندگان برنامه و شرکتها خواهد بود و منجر به یک روایت رشد سودمند متقابل میشود.