
بقلم: طارق | محرر السياسات والأعمال · صوت تحريري بإشراف بشري
تخيل أن تستخدم تطبيق خرائط للوصول لمطعم في الحي المقابل، لكن التطبيق يجبرك على القيادة إلى المطار أولاً في كل مرة تريد الانعطاف. هذا تماماً ما يحدث داخل خوادم الذكاء الاصطناعي اليوم. كلما طرحت سؤالاً على ChatGPT، تبدأ سباق تتابع للبيانات: تنتقل المعلومات من الذاكرة إلى المعالج المركزي للمعالجة المسبقة، ثم تسافر لوحدة الرسومات للحوسبة الثقيلة، قبل العودة مجدداً – وتتكرر هذه الرحلة مع كل كلمة ينتجها النموذج.
شركة XCENA الناشئة ذات المكاتب في كوريا الجنوبية والولايات المتحدة تراهن على أن هذا التنقل المكلف عبر أغلى الرقائق في الصناعة هو العقدة الحقيقية، وليس قوة المعالجة نفسها. جمعت الشركة ذات الأربع سنوات للتو 135 مليون دولار في جولة تمويل من الفئة ب بتقييم 570 مليون دولار، ليصل إجمالي ما جمعته إلى 185 مليون دولار (وفقاً لـ TechCrunch).
صممت XCENA رقاقة تضع قدرات الحوسبة أقرب بكثير لرقائق DRAM – الذاكرة السريعة قصيرة المدى التي تخزن البيانات أثناء معالجة المعالج لها – مما يسمح بتنفيذ العمليات الروتينية للبيانات بجوار الذاكرة مباشرة، دون الرحلات المكلفة بين المعالجات المركزية ووحدات الرسومات والذاكرة. إذا نجحت على نطاق واسع، فإن التأثيرات على تكاليف البنية التحتية للذكاء الاصطناعي قد تكون كبيرة.
أسس الرئيس التنفيذي Jin Kim الشركة عام 2022 مع المدير التقني Dohun Kim ومدير المنتجات Harry Juhyun Kim، وجميعهم من قدامى المحاربين في سامسونغ وSK Hynix، عملاقي الذاكرة اللذين يصنعان الرقائق التي تشغل وحدات الرسومات من إنفيديا. يقول Jin Kim: “المعالجات المركزية ووحدات الرسومات أصبحت أذكى على مدى العقود. الذاكرة لم تفعل ذلك أبداً. XCENA تريد تغيير هذا.”
تتصل رقاقة MX1 من الشركة بالمعالج المركزي عبر CXL (Compute Express Link) – بمثابة ممر سريع مخصص بين المعالج والذاكرة – لمعالجة البيانات قبل أن تحتاج لمغادرة وحدة الذاكرة أبداً. النهج يجلب الحوسبة للبيانات، وليس العكس. تدعي الشركة أن ما اعتاد أن يتطلب 10 خوادم يمكن أن يعمل على خادم واحد فقط.
يوضح Kim: “بينما تتفوق وحدات الرسومات في ضرب المصفوفات – الرياضيات الثقيلة وراء تدريب نماذج الذكاء الاصطناعي – الكثير من تنسيق البيانات المحيطة، بما في ذلك المعالجة المسبقة وإدارة ذاكرة KV التخزين المؤقت (النظام الذي يخزن سياق المحادثة السابق كي لا يحتاج النموذج لإعادة معالجته) وتخزين البيانات مؤقتاً، لا يزال يعمل على المعالجات المركزية. رقاقتنا تتولى تلك المهام مباشرة داخل وحدة الذاكرة نفسها.”
ارتفع الطلب على حلول الذاكرة منذ النصف الثاني من العام الماضي، والشركة تعتقد أن التوقيت يعمل لصالحها. المحادثات مع عدة موردي ذاكرة عالميين في مراحل مبكرة، رغم أن Kim رفض تسميتهم. عملاء الشركة المثاليون هم الشركات العملاقة للحوسبة السحابية التي تنفق عشرات المليارات سنوياً على بنية الذكاء الاصطناعي، حيث حتى مكسب صغير في كفاءة الذاكرة يمكن أن يعني توفير مئات الملايين.
رقاقة MX1 لا تزال نموذجاً أولياً. رقائق الإنتاج الضخم مقرر أن تخرج من خطوط إنتاج سامسونغ بحلول نهاية 2026، مع توقع الشركة بدء توليد الإيرادات في 2027. بينما تتنافس شركات وحدات المعالجة العصبية (NPU) لتحدي إنفيديا في أعباء التدريب، تستهدف XCENA الطبقة كثيفة الذاكرة التي تقبع تحت كل ذلك.
أقرب منافسي XCENA يشملون Astera Labs وMarvell، كلاهما شركتان مدرجتان في ناسداك تعملان على اتصالية الذاكرة للجيل التالي. Marvell لاعب كبير راسخ يعمل بالفعل في نفس المساحة، يقول Kim، مضيفاً أن المُميز يعود لملكية فكرية. “لدينا آلاف النوى،” يقول Kim. بناءً على المواصفات العامة، نهج Marvell يعتمد على حفنة من النوى متعددة الأغراض بالمقارنة.
تلك النوى مبنية على RISC-V – مخطط تصميم رقاقة مفتوح المصدر – ومُحسنة خصيصاً لمعالجة البيانات، مع الحفاظ على كل نواة صغيرة وفعالة عمداً. ما وراء النوى نفسها، تصمم XCENA تسلسلها الهرمي الداخلي للذاكرة ونظام الاتصال الداخلي ووحدة تحكم DRAM – مستوى من التكامل الرأسي تخرجه معظم شركات الرقائق، بما في ذلك المنافسين الأكبر، عادة لمقاولين.
صناديق الاستثمار المقرها سيول Atinum وIMM Investment شاركا في قيادة جولة التمويل من الفئة ب، مع Corstone Asia والمستثمرين الحاليين SBI Investment وMirae Asset Capital. الشركة، التي لديها أكثر من 90 موظفاً عبر مكاتب في Pangyo، مركز التقنية خارج سيول، وSunnyvale، تجري أيضاً محادثات مع مستثمرين دوليين حول تمويل إضافي.
هذا الشهر، الشركات الثلاث التي تهيمن على سوق رقائق الذاكرة العالمية – سامسونغ وSK Hynix وMicron – عبرت كل منها تقييم تريليون دولار لأول مرة. “الارتفاع الحديث في أسعار الذاكرة والأسهم المرتبطة يشير إلى تحول أوسع في بنية الذكاء الاصطناعي نحو معماريات تتمحور حول الذاكرة،” أضاف Kim. رهان XCENA بسيط: الاستنتاج ليس مجرد مشكلة حوسبة، بل مشكلة تزايد في توسيع الذاكرة.







