چکیده
- بن فیلدینگ به محدودیتهای محاسباتی در هوش مصنوعی پی برد و راهحل را در ایجاد هوش مصنوعی غیرمتمرکز یافت.
- فیلدینگ و همکارش هری گریو در سال ۲۰۲۰ شرکت Gensyn را تأسیس کردند تا به توسعه یک شبکه برای هوش ماشین بپردازند.
- Gensyn ابزارهایی از جمله پروتکل “RL Swarms” و تستنت جدیدی که بلاکچین را به فرآیندها اضافه میکند، معرفی کرده است.
- هدف نهایی این است که منابع زیرساختی مورد نیاز برای یادگیری ماشین به صورت عمومی و برنامهریزیپذیر در دسترس همگان قرار گیرد.
همهچیز از میز پرسروصدایی آغاز شد. این میز، در یک آزمایشگاه در دانشگاه نورثامبریا در شمال انگلستان قرار داشت، جایی که یک محقق جوان در حوزه هوش مصنوعی به نام بن فیلدینگ، مسیر دکترای خود را آغاز کرده بود. این داستان به سال ۲۰۱۵ برمیگردد. فیلدینگ ماشینی بزرگ با استفاده از پردازندههای گرافیکی اولیه ساخته بود تا هوش مصنوعی را توسعه دهد که صدای آن به شدت همکارانش را آزار میداد. فیلدینگ این ماشین را زیر میز چپانده بود، اما به قدری بزرگ بود که مجبور بود پاهایش را به کناری دراز کند.
فیلدینگ ایدههای غیرمتعارفی داشت. او بررسی میکرد که چگونه “گروههای” هوش مصنوعی — یعنی خوشههایی از مدلهای مختلف — میتوانند با یکدیگر گفتگو کرده و از یکدیگر یاد بگیرند، که میتواند بهبود کلی را به همراه داشته باشد. یک مشکل وجود داشت: او به دلیل محدودیتهای ماشین پرسروصدا زیر میزش دچار مشکل بود. او میدانست که امکاناتش نسبت به شرکتهایی مانند گوگل که هزاران GPU در یک مرکز داده داشتند، کمتر است. فیلدینگ میگوید: “آنها هم این تحقیقات را انجام میدادند و چیزی که انجام میدادند خیلی عجیب نبود. من روشها را میدانستم، اما نمیتوانستم آنها را اجرا کنم.”
یک دهه پیش، فیلدینگ به این نتیجه رسید که محدودیتهای محاسباتی همیشه مسئلهای خواهند بود. در سال ۲۰۱۵، او میدانست که اگر محاسبات در دانشگاه محدودیت دارد، بدون شک وقتی هوش مصنوعی به جریان اصلی برسد، این محدودیتها جدیتر خواهند شد.
راهحل چیست؟
هوش مصنوعی غیرمتمرکز.
فیلدینگ به همراه هری گریو در سال ۲۰۲۰ Gensyn را تأسیس کردند، سالها قبل از آن که هوش مصنوعی غیرمتمرکز محبوب شود. این پروژه ابتدا به خاطر ساختن محاسبات غیرمتمرکز شناخته شد، اما دیدگاه آنها در واقع گستردهتر است: “شبکهای برای هوش ماشین.” آنها در تمام لایههای فناوری راهحلهایی ارائه میدهند.
اکنون، یک دهه پس از مشکل میز پرسروصدای فیلدینگ، ابزارهای اولیه Gensyn به بازار عرضه شدهاند. این شرکت به تازگی پروتکل “RL Swarms” و تستنتی را که بلاکچین را به فرآیندها اضافه میکند، راهاندازی کرده است.
در این گفتگو که قبل از اجلاس هوش مصنوعی در تورنتو و در کنفرانس Consensus برگزار شد، فیلدینگ توضیح میدهد که AI Swarms چیست، بلاکچین چگونه در این معما جای میگیرد و چرا همه نوآوران، نه فقط غولهای فناوری، باید حق ساخت فناوریهای یادگیری ماشین را داشته باشند.
تبریک میگویم برای راهاندازی تستنت. اساس کار چیست؟
بن فیلدینگ: این اضافه شدن اولین ویژگیهای نمونهاولیهای از ادغام با بلاکچین به آنچه تاکنون راهاندازی کردهایم است.
ویژگیهای اصلی قبل از ورود بلاکچین چه بود؟
ما “RL Swarm” را چند هفته پیش راهاندازی کردیم که یادگیری تقویتی، پس از آموزش، بهعنوان یک شبکه همتا به همتا است.
بهترین راه برای درک آن این است: وقتی یک مدل پیشآموزشدیده از طریق یادگیری استدلالی میگذرد – مانند DeepSeek-R1 – یاد میگیرد که تفکر خود را نقد کند و بهصورت بازگشتی در برابر وظیفه بهبود یابد. سپس میتواند پاسخ خود را بهبود ببخشد.
ما این فرایند را یک قدم جلوتر میبریم و میگوییم: “خوب است که مدلها تفکر خود را نقد کنند و بهصورت بازگشتی بهبود یابند، اما چه میشود اگر بتوانند با مدلهای دیگر صحبت کرده و افکار یکدیگر را نقد کنند؟” اگر شما مدلهای زیادی را در یک گروه گرد هم بیاورید که بتوانند با یکدیگر صحبت کنند، میتوانند یاد بگیرند که چگونه اطلاعات را به مدلهای دیگر ارسال کنند… با هدف کلی بهبود کل گروه.
متوجه شدم، و این توضیح نام “Swarm” است.
درست است. این یک روش آموزش است که به بسیاری از مدلها اجازه میدهد به صورت موازی ترکیب شوند تا نتیجه یک مدل متا نهایی که میتواند از آن مدلها ساخته شود، بهبود یابد. اما در همان زمان، شما هر مدل فردی را دارید که به تنهایی در حال بهبود است. بنابراین اگر شما با یک مدل روی مکبوک بیایید، به یک گروه بپیوندید و سپس دوباره خارج شوید، یک مدل محلی بهبود یافته خواهید داشت و همچنین مدلهای دیگر در گروه را بهبود دادهاید. این یک فرآیند آموزشی همکارانه است که هر مدلی میتواند به آن بپیوندد و هر مدلی میتواند انجام دهد. این است که RL Swarm چیست.
حال بلاکچین در کجا وارد این ماجرا میشود؟
بلاکچین ما را به جلو برده و برخی از ابتداییترین سطوح را به سیستم وارد کرده است.
بگذارید فرض کنیم که کسی نمیداند “ابتداییترین سطوح” چیست. منظور شما چیست؟
بله، منظورم بسیار نزدیک به خود منبع است. بنابراین اگر به پشته نرمافزاری فکر کنید، یک پشته GPU در یک مرکز داده دارید. شما درایورهای بالای GPU دارید، سیستمعاملها، ماشینهای مجازی و همه این موارد.
پس ابتداییترین سطح نزدیکترین به پایه در پشته فناوری است. آیا درست متوجه شدم؟
بله، دقیقا. و RL Swarm یک نمایش از آنچه ممکن است است. اساسا این یک نمایش آزمایشی از انجام یادگیری ماشین در مقیاس بزرگ و قابل گسترش است. اما آنچه که Gensyn طی بیش از چهار سال گذشته بهطور واقعی انجام داده است، ساخت زیرساختها است. و اکنون در دورهای هستیم که زیرساختها همه در سطح بتا v0.1 هستند. همه چیز آماده است. ما باید بفهمیم چگونه به دنیا نشان دهیم که چه زمانی تغییری بزرگ در نحوه تفکر مردم درباره یادگیری ماشین است.
به نظر میرسد که شما بیشتر از محاسبه غیرمتمرکز یا حتی زیرساخت کار میکنید، درست است؟
ما سه مؤلفه اصلی داریم که زیر ساختار ما قرار دارند. اجرا – ما کتابخانههای اجرای مداوم داریم. ما کامپایلر خودمان را داریم. کتابخانههای قابل بازتولید برای هر هدف سختافزاری داریم.
قطعه دوم ارتباطات است. بنابراین فرض کنید شما میتوانید یک مدل را در هر دستگاهی در جهان اجرا کنید که سازگار باشد، آیا میتوانید آنها را وادار کنید که با یکدیگر صحبت کنند؟ اگر همه به یک استاندارد واحد پایبند باشند، همه میتوانند همانند TCP/IP از اینترنت ارتباط برقرار کنند. بنابراین ما آن کتابخانهها را میسازیم و RL Swarm نمونهای از آن ارتباطات است.
و در نهایت، تایید.
آه، و من تصور میکنم این جایی است که بلاکچین وارد میشود…
فرض کنید در جهانی که هر دستگاه بهطور مداوم اجرا میشود. آنها میتوانند مدلها را به هم متصل کنند. اما آیا میتوانند به یکدیگر اعتماد کنند؟ اگر من مکبوک خود را به شما متصل کنم، بله، میتوانند همان وظایف را اجرا کنند. بله، میتوانند تنسورها را به جلو و عقب بفرستند، اما آیا میدانند آنچه که به دستگاه دیگر میفرستند واقعا در دستگاه دیگر اتفاق میافتد یا نه؟
در دنیای کنونی، شما و من احتمالا قراردادی امضا میکنیم تا بگوییم بله، ما توافق داریم که مطمئن شویم دستگاههای ما کار درست را انجام میدهند. اما در دنیای ماشین، باید برنامهریزیشده انجام شود. بنابراین این آخرین قطعهای است که ما میسازیم، اثباتهای رمزنگاری، اثباتهای احتمالی، اثباتهای نظریه بازی برای این که این فرآیند کاملا برنامهریزیشده شود.
پس بلاکچین اینجا وارد میشود. این به ما همه مزایای بلاکچینی را که میتوانید تصور کنید، مانند هویت پایدار، پرداختها، اجماع و غیره میدهد. و آنچه که اکنون با تستنت انجام میدهیم این است که RL Swarm و ابتداییترین سطوح زیرساختهای دیگر را میگیریم و بخشهای بلاکچین را اضافه میکنیم و میگوییم: “هی، وقتی به یک گروه ملحق میشوید، شما یک هویت پایدار دارید که در دفترکالایی غیرمتمرکز وجود دارد.”
در آینده، امکان پرداختها خواهید داشت، اما در حال حاضر، شما مکانیزم اجماع اعتمادی دارید که میتواند اختلافات را خاتمه دهد. بنابراین، این یک نمونهاولیه از زیرساخت آینده Gensyn است، جایی که ما به مرور زمان اجزا را اضافه خواهیم کرد.
ما را از برنامههای آینده مطلع کنید؟
وقتی به شبکه اصلی برسیم، همه نرمافزار و زیرساختها به بلاکچین بهعنوان منبع اعتماد، پرداختها، اجماع و غیره، هویت متصل خواهند شد. این اولین گام است. اضافه کردن هویت و گفتن اینکه وقتی به یک گروه ملحق میشوید، میتوانید بهعنوان همان شخص ثبتنام کنید. همه میدانند که شما چه کسی هستید بدون نیاز به بررسی یک سرور مرکزی یا وبسایت خاص.
حالا بیاید به آینده بیشتر فکر کنیم. این یک سال دیگر، دو سال دیگر، پنج سال دیگر چگونه به نظر میرسد؟ ستاره شمالی شما چیست؟
البته. دیدگاه نهایی این است که همه منابعی که زیر یادگیری ماشین قرار دارند را بهطور فوری و برنامهریزیشده در دسترس همگان قرار دهیم. یادگیری ماشین به شدت توسط منابع اصلی خود محدود شده است. این یک خندق بزرگ برای شرکتهای هوش مصنوعی متمرکز ایجاد میکند، اما نیازی به وجود آن نیست. اگر بتوانیم نرمافزار مناسب را بسازیم، میتواند بهصورت منبعباز در دسترس باشد. بنابراین دیدگاه ما این است که Gensyn همه زیرساختهای سطح پایین را میسازد تا بهطور نزدیک به منبعباز ممکن شود. مردم باید حق ساخت فناوریهای یادگیری ماشین را داشته باشند.