
بقلم: ليلى | محررة أدوات المطورين · صوت تحريري بإشراف بشري

أغاني Lady Gaga وRadiohead وWu-Tang Clan وBruce Springsteen — كلها موجودة في مجموعات البيانات التي تُغذّي نماذج الذكاء الاصطناعي الموسيقي. هذا ما كشفه المحقق الصحفي أليكس رايسنر من مجلة The Atlantic، الذي رصد أربع مجموعات بيانات موسيقية تُستخدم لتدريب نماذج الذكاء الاصطناعي، وحوّلها إلى قاعدة قابلة للبحث يمكن لأي شخص الدخول إليها.
الأرقام وحدها كافية لإثارة القلق: مجموعتان ضخمتان تحتويان على 12 مليون و9 ملايين مقطع موسيقي (وفقاً لـ The Verge)، فضلاً عن مجموعتين أصغر تتجاوزان 100,000 أغنية لكل منهما. وقد جُمّعت هذه البيانات وتُنزَّل بآلاف المرات، إذ أكد كل من Google وStability AI في أوراق بحثية — هذه من Google وهذه من Stability — استخدامهما لها.
التفاصيل التقنية تضيف طبقة إضافية من التعقيد القانوني. ثلاث من المجموعات الأربع لا تُوزَّع كملفات صوتية مباشرة، بل كقوائم روابط على YouTube وSpotify. يقوم المطورون بعدها بتنزيل الصوت فعلياً باستخدام أدوات متخصصة تتحايل على آليات تسجيل الدخول والإعلانات — وهي الآليات التي تدرّ دخلاً للفنانين والمنصات على حد سواء. رايسنر صريح في هذه النقطة: هذه الأدوات تنتهك شروط الخدمة للمنصتين.
المفارقة أن بعض هذه المصادر لا تبدو مشكوكاً فيها للوهلة الأولى. Free Music Archive، على سبيل المثال، منصة تتيح الاستماع المجاني للاستخدام الشخصي — لكن الاستخدام التجاري يتطلب ترخيصاً صريحاً. تدريب نموذج ذكاء اصطناعي تجاري عليها يقع في منطقة رمادية في أحسن الأحوال، وانتهاك صريح في أسوأها. أسماء من قبيل Fred Again.. وAphex Twin والمؤلف التجريبي Hainbach تطفو في هذه البيانات جنباً إلى جنب مع نجوم البوب الكبار.
رايسنر أتاح نتائجه عبر موقع AI Watchdog التابع لـ The Atlantic، حيث يمكن لأي شخص البحث عن اسم فنان أو أغنية بعينها ومعرفة ما إذا كانت موجودة في هذه المجموعات. الأداة لا تخص الموسيقى وحدها؛ تشمل أيضاً الكتب والمحتوى الإعلامي الآخر المستخدم في تدريب النماذج.
ما يجعل هذه القضية أكثر من مجرد خلاف قانوني هو البنية الهيكلية للمشكلة. شركات الذكاء الاصطناعي لا تسرق الملفات بشكل مباشر في الغالب — بل تستخدم مجموعات بيانات “متاحة” من الناحية التقنية على الإنترنت، ويُحمَّل الغموض القانوني لاحقاً على المحاكم. في غضون ذلك، يُبنى النموذج، ويُطلق، ويبدأ في المنافسة الفعلية مع الفنانين الذين أمدّوه بمادته التدريبية. المعادلة غير متوازنة بوضوح: الفنان لا يُستشار، ولا يُعوَّض، وقد لا يعلم أصلاً أن موسيقاه تُستخدم.
في المشهد الأوسع، تأتي هذه الكشوف في وقت تضخ فيه صناعة الذكاء الاصطناعي الموسيقي مبالغ ضخمة؛ فشركة Suno وحدها استقطبت مؤخراً استثمارات بـ400 مليون دولار. والسؤال الذي يظل دون إجابة واضحة: هل بنت هذه النماذج قيمتها على محتوى انتُزع دون إذن؟ قاعدة البيانات الجديدة لا تجيب على هذا السؤال قانونياً، لكنها تجعل الإنكار أصعب بكثير.







