تُحدَّث يومياً

مصدرُك العربي
لمستقبل الذكاء الاصطناعي

أخبار، تقارير، أدوات وتحليلات يومية — كل ما تحتاجه لمتابعة ثورة الذكاء الاصطناعي باللغة العربية

✅ تم الاشتراك!
تعلم و استخدام الذكاء الاصطناعي

مطور يشغل نموذج محول حقيقي على كمبيوتر كومودور 64 من الثمانينيات

🎧 استمع للملخص

بقلم: يوسف | محرر أدوات الذكاء الاصطناعي · صوت تحريري بإشراف بشري

هل يمكن تشغيل نموذج ذكاء اصطناعي حديث على كمبيوتر من عام 1982؟ أجاب المطور gizmo64k بـ”نعم” عبر إنجازه المذهل Soul Player C64 – نموذج محول حقيقي بـ25 ألف معامل يعمل على Commodore 64 بمعالج 1 ميجاهرتز، مُطبق بلغة التجميع 6502/6510 المكتوبة يدوياً ومُحمل بالكامل من قرص مرن واحد.

يستخدم Soul Player C64 نفس البنية المعمارية وراء ChatGPT وClaude وGemini – محول فك تشفير ثنائي الطبقات مع انتباه ذاتي سببي متعدد الرؤوس حقيقي، وSoftmax حقيقي، وRMSNorm حقيقي. النموذج ينتج حوالي رمز واحد كل 60 ثانية، والرد الكامل يستغرق عدة دقائق، لكنه يُثبت أن المبادئ الأساسية لنماذج اللغة الحديثة تعمل حتى على هذا المقياس الضئيل.

الاختراق التقني الحاسم كان إصلاح تطبيع درجات Softmax. اكتشف المطور أن إزاحة درجات الانتباه بـ14 بت بدلاً من 17 يعطي جدول البحث الأسي المكون من 128 إدخال نطاقاً ديناميكياً كافياً لإنتاج أوزان انتباه ذات معنى (وفقاً لمستودع GitHub). بدون هذا الإصلاح، كان الانتباه الصحيح موزعاً بانتظام عبر جميع المواضع، مما يجعل النموذج “أعمى” بغض النظر عن البنية أو التدريب.

المواصفات التقنية المُحكمة: طبقتان، 4 رؤوس انتباه × 8 أبعاد لكل رأس، 32 بُعد تضمين، 64 وحدة FFN مخفية، مع 25 ألف معامل مُكممة لـint8 بتحويل مقياس قوة-2 لكل tensor. المفردات محدودة بـ128 رمز (4 خاصة + 34 حرف/ترقيم + 90 دمج BPE) ونافذة سياق 20 رمز فقط.

## كيفية تشغيل النموذج الجاهز

  1. حمل ملف disk/soulplayer.d64 وشغله في محاكي C64 مثل VICE
  2. اكتب الأمر LOAD”SOULPLAYER”,8,1 واضغط RETURN
  3. اكتب RUN لبدء تشغيل النموذج
  4. اكتب رسالة قصيرة بأحرف صغيرة فقط واضغط RETURN
  5. انتظر بينما يومض الإطار الحدودي (علامة التفكير) ويصدر أصوات SID مع كل رمز
  6. اكتب q للخروج من البرنامج

قيود مهمة: النموذج يفهم الأحرف الصغيرة والمسافات وعلامات الترقيم الأساسية فقط (. , ! ? ‘ : ; -). الأحرف الكبيرة تصبح رموزاً غير معروفة ``. النموذج “ليس ذكياً” بـ25 ألف معامل – أصغر بـ70 مليون مرة من GPT-4 – وسينتج جملاً مكسورة أحياناً.

## تدريب نموذجك الخاص: العملية الكاملة

إنشاء مجموعة البيانات يتطلب كتابة ملف نصي بصيغة `inputresponse` لكل تبادل، مع الحفاظ على قصر المحادثات نظراً لنافذة السياق المحدودة من 20 رمز. مثال:

“`
hellohey! nice to see you!
i’m sadi hear you. i care about you.
tell me a jokewhy did the bit flip? it was tired!
“`

التدريب يستخدم `python train.py data/example_corpus.txt` ويُطبق Quantization-Aware Training (QAT) حيث تمر الأوزان عبر FakeQuantI8 – تكميم زائف مع تحجيم float مستمر وتقدير تدرج مباشر. عدم التطابق المقصود بين تحجيم التدريب المستمر وشبكة الإزاحة قوة-2 للتصدير يعمل كضوضاء ضمنية، مما يجبر النموذج على تعلم أوزان بهوامش logit أوسع تنجو من فجوة التكميم.

كل 500 epoch، يُقيم النظام الممر الأمامي الصحيح الفعلي (numerics.forward()) ويحفظ أفضل checkpoint بناءً على دقة int8 argmax، وليس خسارة float. مخرجات التدريب تُظهر استنتاج float وint8 جنباً إلى جنب – ما تعلمه النموذج مقابل ما سينتجه C64 فعلياً.

البناء النهائي يتم عبر `python build.py` الذي يُجمع جميع روتينات 6502/6510، ويُدمج الأوزان المُدربة، ويكتب disk/soulplayer.prg وdisk/soulplayer.d64 القابلين للتشغيل على الأجهزة الحقيقية أو المحاكيات.

## التحديات التقنية الفريدة

معالج 6502 لا يحتوي على تعليمة ضرب – كل العمليات تُنفذ بالإزاحة والجمع. خريطة الذاكرة محكمة التنظيم: `$0801-$20FF` للكود وجداول المُرمز (~6 كيلوبايت)، `$2100-$85A0` للأوزان (25.3 كيلوبايت)، `$8600-$9D00` لمخازن التفعيل (5.8 كيلوبايت).

جميع التفعيلات تستخدم نقطة ثابتة Q8.8 (int16)، والأوزان int8 مع إزاحات قوة-2 لكل tensor، والانحيازات int16 مُحجمة مسبقاً لمُراكم matmul. Softmax يستخدم جدول بحث 128-إدخال مع تطبيع درجة `>>14` – هذا الرقم بالتحديد اتضح أنه حاسم لعمل الانتباه.

كل عملية matmul تحصل على إزاحة `× 0.5` لمحاكاة `>> 1` الخاص بـ6502. label smoothing بنسبة 0.15 يمنع النموذج من شحذ توزيعات logit أكثر مما تستطيع حسابات int8 تمييزها بشكل موثوق.

المشروع يتضمن حزمة اختبار شاملة (`python test.py`) تتحقق من السلسلة الكاملة: مرجع float → مرجع integer → ظل مُخلص للذاكرة → روتينات تجميع 6502/6510 → رحلة بناء ذهاب وإياب. أكثر من 90 اختبار في حوالي 30 ثانية لضمان الدقة عبر كل مرحلة.

هذا ليس مجرد تحدٍ تقني – إنه برهان مفاهيمي أن حتى الأجهزة من الثمانينيات يمكنها تشغيل نفس المبادئ الأساسية للنماذج الحديثة، وإن كان بصبر تأملي شديد. “المستقبل عاد للماضي. والآن له روح” كما يقول المطور.

GitHub

مقالات ذات صلة

زر الذهاب إلى الأعلى