
بقلم: ليلى | محررة أدوات المطورين · صوت تحريري بإشراف بشري
فاتورة بـ 3000 دولار من OpenAI في ليلة واحدة بسبب حلقة لا نهائية في الكود. هذا الكابوس الذي يعيشه المطورون يومياً دفع فريق LLMCap لبناء حل جذري: بروكسي يقطع الاستدعاءات فور الوصول للحد المحدد، ليس تحذيراً بل إيقافاً فورياً.
النظام يعمل بآلية بسيطة: تغيير عنوان base_url فقط في كودك من “api.anthropic.com” إلى “proxy.llmcap.io/anthropic” مع الاحتفاظ بنفس مفتاح API الأصلي. عندما تصل للحد المحدد – 50 دولاراً مثلاً – يرد النظام برمز خطأ 429 قبل أن تستهلك أي رمز مميز، فتتجنب الدفع تماماً (وفقاً للموقع الرسمي).
التكامل يشمل جميع مزودي الخدمة الكبار: Anthropic وOpenAI وGoogle Gemini وMistral وCohere، مع زمن استجابة إضافي أقل من 35 مللي ثانية ودعم كامل للاستجابات المتدفقة. إذا تجاوزت الميزانية أثناء استجابة متدفقة، يقطع الاتصال فوراً ويرسل حدث 429 نهائي دون أي رسوم إضافية.
- إعداد فوري: تغيير base_url واحد في كودك، لا حاجة لتعديل SDKs أو منطق التعامل مع الأخطاء
- مراقبة مباشرة في VS Code: إضافة تظهر الإنفاق المباشر في شريط الحالة مع تفاصيل الاستخدام اليومي والطلبات المحجوبة
- أداة سطر أوامر متكاملة: فحص الإنفاق وتصفح السجلات وإدارة المفاتيح من الطرفية عبر “pip install llmcap”
- تطبيق Windows Tray: أيقونة في صينية النظام تظهر الإنفاق المباشر مع قائمة سياق للإحصائيات السريعة
- تحكم دقيق بالحدود: حدود يومية أو شهرية أو لكل مفتاح مع إمكانية تخصيص حدود منفصلة لكل نموذج
خطط التسعير تبدأ بـ 19 دولاراً شهرياً للخطة الأساسية (مفتاحان، جميع المزودين، سجل 30 يوماً) و49 دولاراً للخطة الاحترافية (مفاتيح غير محدودة، حدود لكل نموذج، سجل 90 يوماً، دعم لـ 5 مستخدمين). جميع الخطط تتضمن تجربة مجانية لثلاثة أيام تتطلب بطاقة ائتمان مع إمكانية الإلغاء قبل انتهاء الفترة.
النظام لا يحفظ مفاتيح API الأصلية – تُمرر عبر header في كل طلب وتُحذف فوراً، مع تشفير مفاتيح LLMCap فقط باستخدام bcrypt. الفريق يخطط لطرح نسخة للاستضافة الذاتية لاحقاً، حيث أن الكود مفتوح المصدر ومبني على FastAPI وRedis.
لكن ما لا يوضحه الموقع هو سياسة استرداد الأموال إذا واجهت مشاكل فنية، أو كيفية التعامل مع زمن الاستجابة المضاف في التطبيقات الحساسة للوقت.







