دادههای غیرمتمرکز OORT AI در پلتفرم Google Kaggle به صدر جدول رسیدند
یک مجموعه داده تصویری آموزشی هوش مصنوعی که توسط ارائهدهنده راهحلهای غیرمتمرکز هوش مصنوعی OORT توسعه یافته، موفقیت قابلتوجهی در پلتفرم Kaggle گوگل کسب کرد.
فهرست مجموعه داده Diverse Tools OORT در Kaggle اوایل آوریل منتشر شد؛ از آن زمان تاکنون این مجموعه در چندین دستهبندی به صفحه اول صعود کرده است.
Kaggle یک پلتفرم آنلاین متعلق به گوگل برای رقابتها، یادگیری و همکاری در زمینه علم داده و یادگیری ماشین است.
رامکومار سوبرامانیام، مشارکتکننده اصلی در پروژه OpenLedger، به کوین تلگراف گفت: «رتبهبندی صفحه اول Kaggle یک سیگنال اجتماعی قوی است که نشان میدهد این مجموعه داده جامعههای مناسب دانشمندان داده، مهندسان یادگیری ماشین و متخصصان را جذب کرده است.»
مکس لی، بنیانگذار و مدیرعامل OORT، به کوین تلگراف گفت که شرکت «شاخصهای تعامل امیدوارکنندهای مشاهده کرده که تقاضای اولیه و مرتبط بودن» دادههای آموزشی جمعآوریشده از طریق مدل غیرمتمرکز را تأیید میکند.
او اضافه کرد: «علاقه طبیعی جامعه، از جمله استفاده فعال و مشارکتها، نشان میدهد که خطوط لوله داده غیرمتمرکز و جامعهمحور مانند OORT میتوانند بدون اتکا به واسطههای متمرکز، توزیع و تعامل سریعی داشته باشند.»
لی همچنین گفت که در ماههای آینده، OORT قصد دارد چندین مجموعه داده دیگر منتشر کند؛ از جمله مجموعه داده فرمانهای صوتی داخل خودرو، فرمانهای صوتی خانه هوشمند و مجموعهای برای ویدیوهای دیپفیک به منظور بهبود تأیید رسانههای هوش مصنوعی.
این مجموعه داده بهطور مستقل توسط کوین تلگراف تأیید شد که اوایل این ماه در دستهبندیهای هوش مصنوعی عمومی، خردهفروشی و خرید، تولید و مهندسی به صفحه اول Kaggle رسیده است.
در زمان انتشار این خبر، این موقعیتها پس از بهروزرسانی احتمالا نامرتبط مجموعه داده در ۶ مه و ۱۴ مه از دست رفت.

درحالیکه این دستاورد قابلتوجه است، سوبرامانیام به کوین تلگراف گفت: «این یک شاخص قطعی برای پذیرش واقعی در جهان یا کیفیت سطح سازمانی نیست.» او گفت تفاوت مجموعه داده OORT «فقط در رتبهبندی نیست، بلکه منشأ و لایه انگیزشی پشت آن است.»
او توضیح داد: «برخلاف فروشندگان متمرکزی که ممکن است به خطوط لوله غیرشفاف متکی باشند، یک سیستم شفاف با انگیزهسازی توکنی ردیابیپذیری، مدیریت جامعه و پتانسیل بهبود مستمر را در صورت وجود حاکمیت مناسب فراهم میکند.»
لکس سوکولین، شریک در شرکت سرمایهگذاری خطرپذیر هوش مصنوعی Generative Ventures، گفت که هرچند معتقد نیست این نتایج سختقابل تکرار باشند، «در عین حال نشان میدهد پروژههای کریپتو میتوانند از محرکهای غیرمتمرکز برای سازماندهی فعالیتهای ارزشمند اقتصادی استفاده کنند.»
دادههای منتشرشده توسط شرکت تحقیقاتی Epoch AI نشان میدهد که دادههای متنی تولیدشده توسط انسان برای آموزش هوش مصنوعی تا سال ۲۰۲۸ تمام خواهند شد. فشار به قدری زیاد است که سرمایهگذاران اکنون در حال میانجیگری معاملات اعطای حقوق آثار دارای حق نشر به شرکتهای هوش مصنوعی هستند.
گزارشهای مربوط به کمبود فزاینده دادههای آموزشی هوش مصنوعی و محدودیت احتمالی رشد در این حوزه سالهاست که منتشر میشوند.
در حالی که دادههای مصنوعی (تولیدشده توسط هوش مصنوعی) با موفقیت نسبی استفاده میشوند، دادههای انسانی همچنان بهعنوان گزینهای باکیفیتتر و مؤثرتر شناخته میشوند که منجر به مدلهای هوش مصنوعی بهتر میشوند.
در زمینه تصاویر آموزشی هوش مصنوعی بهویژه، اوضاع پیچیدهتر شده است زیرا هنرمندان عمداً تلاشهای آموزشی را خراب میکنند. ابزار Nightshade به کاربران امکان «مسمومسازی» تصاویرشان را میدهد تا عملکرد مدلها را بهشدت کاهش دهد.

سوبرامانیام گفت: «ما در دورهای وارد میشویم که داده تصویری باکیفیت بهطور فزایندهای کمیاب خواهد شد.»
او همچنین اذعان کرد این کمبود توسط محبوبیت رو به رشد روشهای مسمومسازی تصویر تشدید شده است: «با افزایش تکنیکهایی مانند پنهانسازی تصویر و واترمارک مخرب برای مسمومسازی آموزش هوش مصنوعی، مجموعهدادههای متنباز با چالش کمیت و اعتماد روبهرو هستند.»
در این وضعیت، سوبرامانیام گفت که مجموعهدادههای قابلتأیید و جامعهمحور با انگیزهسازی «ارزشمندیشان بیش از همیشه است.»
به گفته او، چنین پروژههایی «میتوانند نه تنها جایگزین، بلکه ستونهای همراستایی هوش مصنوعی و منشأ در اقتصاد داده باشند.»