cointelegraph . ۱ سال پیش

داده‌های غیرمتمرکز OORT AI در Kaggle گوگل صدرنشین شدند

داده‌های غیرمتمرکز OORT AI در پلتفرم Google Kaggle به صدر جدول رسیدند

یک مجموعه داده تصویری آموزشی هوش مصنوعی که توسط ارائه‌دهنده راه‌حل‌های غیرمتمرکز هوش مصنوعی OORT توسعه یافته، موفقیت قابل‌توجهی در پلتفرم Kaggle گوگل کسب کرد.

فهرست مجموعه داده Diverse Tools OORT در Kaggle اوایل آوریل منتشر شد؛ از آن زمان تاکنون این مجموعه در چندین دسته‌بندی به صفحه اول صعود کرده است.

Kaggle یک پلتفرم آنلاین متعلق به گوگل برای رقابت‌ها، یادگیری و همکاری در زمینه علم داده و یادگیری ماشین است.

رامکومار سوبرامانیام، مشارکت‌کننده اصلی در پروژه OpenLedger، به کوین تلگراف گفت: «رتبه‌بندی صفحه اول Kaggle یک سیگنال اجتماعی قوی است که نشان می‌دهد این مجموعه داده جامعه‌های مناسب دانشمندان داده، مهندسان یادگیری ماشین و متخصصان را جذب کرده است.»

مکس لی، بنیان‌گذار و مدیرعامل OORT، به کوین تلگراف گفت که شرکت «شاخص‌های تعامل امیدوارکننده‌ای مشاهده کرده که تقاضای اولیه و مرتبط بودن» داده‌های آموزشی جمع‌آوری‌شده از طریق مدل غیرمتمرکز را تأیید می‌کند.

او اضافه کرد: «علاقه طبیعی جامعه، از جمله استفاده فعال و مشارکت‌ها، نشان می‌دهد که خطوط لوله داده غیرمتمرکز و جامعه‌محور مانند OORT می‌توانند بدون اتکا به واسطه‌های متمرکز، توزیع و تعامل سریعی داشته باشند.»

لی همچنین گفت که در ماه‌های آینده، OORT قصد دارد چندین مجموعه داده دیگر منتشر کند؛ از جمله مجموعه داده فرمان‌های صوتی داخل خودرو، فرمان‌های صوتی خانه هوشمند و مجموعه‌ای برای ویدیوهای دیپ‌فیک به منظور بهبود تأیید رسانه‌های هوش مصنوعی.

این مجموعه داده به‌طور مستقل توسط کوین تلگراف تأیید شد که اوایل این ماه در دسته‌بندی‌های هوش مصنوعی عمومی، خرده‌فروشی و خرید، تولید و مهندسی به صفحه اول Kaggle رسیده است.

در زمان انتشار این خبر، این موقعیت‌ها پس از به‌روزرسانی احتمالا نامرتبط مجموعه داده در ۶ مه و ۱۴ مه از دست رفت.

درحالی‌که این دستاورد قابل‌توجه است، سوبرامانیام به کوین تلگراف گفت: «این یک شاخص قطعی برای پذیرش واقعی در جهان یا کیفیت سطح سازمانی نیست.» او گفت تفاوت مجموعه داده OORT «فقط در رتبه‌بندی نیست، بلکه منشأ و لایه انگیزشی پشت آن است.»

او توضیح داد: «برخلاف فروشندگان متمرکزی که ممکن است به خطوط لوله غیرشفاف متکی باشند، یک سیستم شفاف با انگیزه‌سازی توکنی ردیابی‌پذیری، مدیریت جامعه و پتانسیل بهبود مستمر را در صورت وجود حاکمیت مناسب فراهم می‌کند.»

لکس سوکولین، شریک در شرکت سرمایه‌گذاری خطرپذیر هوش مصنوعی Generative Ventures، گفت که هرچند معتقد نیست این نتایج سخت‌قابل تکرار باشند، «در عین حال نشان می‌دهد پروژه‌های کریپتو می‌توانند از محرک‌های غیرمتمرکز برای سازماندهی فعالیت‌های ارزشمند اقتصادی استفاده کنند.»

داده‌های منتشرشده توسط شرکت تحقیقاتی Epoch AI نشان می‌دهد که داده‌های متنی تولیدشده توسط انسان برای آموزش هوش مصنوعی تا سال ۲۰۲۸ تمام خواهند شد. فشار به قدری زیاد است که سرمایه‌گذاران اکنون در حال میانجی‌گری معاملات اعطای حقوق آثار دارای حق نشر به شرکت‌های هوش مصنوعی هستند.

گزارش‌های مربوط به کمبود فزاینده داده‌های آموزشی هوش مصنوعی و محدودیت احتمالی رشد در این حوزه سال‌هاست که منتشر می‌شوند.

در حالی که داده‌های مصنوعی (تولیدشده توسط هوش مصنوعی) با موفقیت نسبی استفاده می‌شوند، داده‌های انسانی همچنان به‌عنوان گزینه‌ای باکیفیت‌تر و مؤثرتر شناخته می‌شوند که منجر به مدل‌های هوش مصنوعی بهتر می‌شوند.

در زمینه تصاویر آموزشی هوش مصنوعی به‌ویژه، اوضاع پیچیده‌تر شده است زیرا هنرمندان عمداً تلاش‌های آموزشی را خراب می‌کنند. ابزار Nightshade به کاربران امکان «مسموم‌سازی» تصاویرشان را می‌دهد تا عملکرد مدل‌ها را به‌شدت کاهش دهد.

سوبرامانیام گفت: «ما در دوره‌ای وارد می‌شویم که داده تصویری باکیفیت به‌طور فزاینده‌ای کمیاب خواهد شد.»

او همچنین اذعان کرد این کمبود توسط محبوبیت رو به رشد روش‌های مسموم‌سازی تصویر تشدید شده است: «با افزایش تکنیک‌هایی مانند پنهان‌سازی تصویر و واترمارک مخرب برای مسموم‌سازی آموزش هوش مصنوعی، مجموعه‌داده‌های متن‌باز با چالش کمیت و اعتماد روبه‌رو هستند.»

در این وضعیت، سوبرامانیام گفت که مجموعه‌داده‌های قابل‌تأیید و جامعه‌محور با انگیزه‌سازی «ارزشمندی‌شان بیش از همیشه است.»

به گفته او، چنین پروژه‌هایی «می‌توانند نه تنها جایگزین، بلکه ستون‌های هم‌راستایی هوش مصنوعی و منشأ در اقتصاد داده باشند.»

نوشته شده توسط admin

387

نظرات

هنوز دیدگاهی ثبت نشده است.