
جوجل تطور تقنية TurboQuant لضغط ذاكرة الذكاء الاصطناعي بكفاءة عالية
كشفت أبحاث جوجل عن تقنية TurboQuant الجديدة لضغط ذاكرة الذكاء الاصطناعي. التقنية تقلل استهلاك الذاكرة دون التأثير على جودة النماذج. وبالتالي تحل مشكلة رئيسية في تشغيل نماذج الذكاء الاصطناعي الحديثة.
ماذا حدث؟
أعلنت جوجل ريسيرش عن تقنية TurboQuant كطريقة جديدة لضغط البيانات في أنظمة الذكاء الاصطناعي. التقنية تستهدف المتجهات التي تستهلك الذاكرة بشكل مكثف في النماذج اللغوية. كما أن TurboQuant تستخدم تقنيتين متقدمتين هما PolarQuant وQJL لإزالة الأخطاء الخفية. وفضلاً عن ذلك، تحافظ التقنية على جودة النموذج الأصلية مع تقليل استهلاك الذاكرة. وتجدر الإشارة إلى أن الاختبارات أظهرت انخفاض الذاكرة المستخدمة بمعدل ستة أضعاف على الأقل (بحسب المصدر). بالإضافة إلى ذلك، حققت التقنية تسريع عمليات الانتباه بمعدل ثمانية أضعاف على معالجات H100.
السياق والمشهد الأشمل
تواجه صناعة الذكاء الاصطناعي تحدياً متزايداً في إدارة استهلاك الذاكرة. النماذج اللغوية الكبيرة تتطلب موارد حاسوبية هائلة للتشغيل الفعال. في المقابل، تحاول الشركات الكبرى تطوير حلول للحد من هذا الاستهلاك. ومع ذلك، معظم التقنيات السابقة كانت تضحي بجودة النموذج مقابل توفير الذاكرة. نتيجةً لذلك، أصبحت الحاجة ملحة لإيجاد توازن مثالي بين الأداء واستهلاك الموارد. على سبيل المثال، تعمل شركات مثل أوبن إيه آي وأنثروبيك على تحسين كفاءة نماذجها باستمرار. أخبار الذكاء الاصطناعي تشهد تطورات مستمرة في هذا المجال.
لماذا يهم؟
تقنية TurboQuant تفتح آفاقاً جديدة لنشر نماذج الذكاء الاصطناعي بتكلفة أقل. المطورون سيستفيدون من تشغيل نماذج أكبر على أجهزة محدودة الموارد. كما أن الشركات ستتمكن من خفض تكاليف البنية التحتية للذكاء الاصطناعي بشكل كبير. وفضلاً عن ذلك، التقنية تساعد في جعل الذكاء الاصطناعي أكثر إتاحة للمؤسسات الصغيرة. في حين أن السرعة المحسّنة تعني استجابة أفضل للمستخدمين النهائيين. وتجدر الإشارة إلى أن هذا التطور قد يسرع من اعتماد تقنيات الذكاء الاصطناعي في مختلف الصناعات.
ما التالي؟
لم يذكر المصدر مواعيد إتاحة التقنية للاستخدام التجاري. ومع ذلك، يُتوقع أن تدمج جوجل هذه التقنية في منتجاتها المستقبلية. بالإضافة إلى ذلك، قد تؤثر على طريقة تطوير النماذج اللغوية في الصناعة. نتيجةً لذلك، ستحتاج الشركات المنافسة لتطوير تقنيات مشابهة للحفاظ على قدرتها التنافسية. كما أن المطورين يترقبون تفاصيل أكثر حول كيفية تطبيق هذه التقنية عملياً. تعلم واستخدام الذكاء الاصطناعي سيشهد تطورات جديدة بفضل هذه الابتكارات.
أبرز النقاط
- جوجل تكشف عن TurboQuant لضغط ذاكرة الذكاء الاصطناعي بمعدل ستة أضعاف
- التقنية تحافظ على جودة النماذج مع تسريع العمليات بثمانية أضعاف
- الابتكار قد يقلل تكاليف تشغيل نماذج الذكاء الاصطناعي بشكل كبير




