
بقلم: ليلى | محررة أدوات المطورين · صوت تحريري بإشراف بشري
بدلاً من محاربة نماذج اللغة الكبيرة التي تحاول الوصول لبياناتها، قررت Anna’s Archive – أكبر مكتبة رقمية مفتوحة في التاريخ – تقديم دليل تعاون واضح عبر ملف llms.txt جديد يحدد طرق الوصول المشروع لكنوزها الرقمية.
القرار يأتي من منطق اقتصادي بسيط: شركات الذكاء الاصطناعي تنفق مبالغ ضخمة لكسر أنظمة CAPTCHA والوصول للمحتوى بطرق غير منتظمة، بينما يمكنها دعم المشروع مالياً والحصول على وصول أفضل ومنظم. الفكرة تحول العلاقة من صراع تقني إلى شراكة مفيدة للطرفين.
الطرق الخمس للوصول البرمجي:
- مستودع GitLab المفتوح: تحميل جميع صفحات HTML وكامل الكود المصدري من المستودع الرسمي للمشروع
- نظام التورنت للبيانات الضخمة: تحميل البيانات الوصفية والملفات الكاملة من صفحة Torrents، خاصة ملف aa_derived_mirror_metadata الذي يحتوي خلاصة المحتوى
- واجهة برمجية للتورنت: وصول برمجي مباشر لكامل التورنت عبر JSON API مخصص
- API للملفات الفردية: يتطلب تبرعاً أولاً للمشروع، ثم يتيح البحث في البيانات واستخراج ملفات محددة (البحث لا يزال قيد التطوير)
- وصول SFTP للمؤسسات: تبرعات على مستوى المؤسسات تحصل على وصول مباشر وسريع لكامل قاعدة البيانات، أسرع من التورنت العادي
المشروع يطرح حجة ذكية: “لقد تم تدريب نماذجكم اللغوية جزئياً على بياناتنا بالفعل. بتبرعكم، يمكننا تحرير والحفاظ على المزيد من الأعمال الإنسانية، مما يحسن تدريباتكم المستقبلية.” هذا اعتراف مباشر بأن صناعة الذكاء الاصطناعي استفادت بالفعل من المحتوى المفتوح، والوقت حان لرد الجميل.
للتبرعات المجهولة، يقدم المشروع عنوان Monero: 88gS7a8aHj5EYhCfYnkhEmYXX3MtR35r3YhWdWXwGLyS4fkXYjkupcif6RY5oj9xkNR8VVmoRXh1kQKQrZBRRc8PHLWMgUR، مع التأكيد على وجود خدمات متعددة لتحويل طرق الدفع التقليدية إلى Monero بسرية تامة.
رسالة Anna’s Archive واضحة: “مهمتنا تفيد البشر والروبوتات على حد سواء.” بهذا النهج، يضع المشروع معياراً جديداً لكيفية تعامل مشاريع البيانات المفتوحة مع صناعة الذكاء الاصطناعي – التعاون بدلاً من المقاومة، والاستدامة المالية بدلاً من الاستنزاف التقني.
النهج يكشف نضج مشهد البيانات المفتوحة، حيث تدرك المشاريع أن مقاومة التقدم التقني عبثية، بينما تنظيمه وتوجيهه لصالح الجميع هو الطريق الأذكى للمستقبل.







