→ العودة إلى المدونة
كيف توفر التوكنز في النماذج اللغوية: دليل عملي لـ Claude Code

كيف توفر التوكنز في النماذج اللغوية: دليل عملي لـ Claude Code

كيف توفر التوكنز في النماذج اللغوية: دليل عملي لـ Claude Code

إنفاق 10 اشتراكات بسعر $200 لكل منها ليس مشكلة. المشكلة هي أن تفعل ذلك بوعي. فيما يلي مجموعة من الأساليب العملية لتوفير التوكنز التي أستخدمها يومياً في العمل مع Claude Code.

1. كيف ندفع أصلاً

Claude Code يفرض رسوماً على توكنز الإدخال (input) والإخراج (output). الإدخال هو كل ما يدخل في السياق: البرومبت النظامي، تاريخ المحادثة، الملفات، ولقطات الشاشة. الإخراج هو ما تولّده النموذج.

كل رسالة في المحادثة تضيف إلى الإدخال كامل السياق المتراكم. إذا كنت تستخدم Opus بسياق 1M، فكل رسالة تُفوترة وكأنك تُعيد إرسال المليون توكن بالكامل. الإخراج أيضاً يشارك في حشو السياق — فهو ينمو مع كل إجابة.

الخلاصة: كلما كانت المحادثة أقصر — كان التكلفة أقل. كلما كان السياق أصغر — كان التكلفة أقل. كلما «فكّرت» النموذج أقل — كان التكلفة أقل.

2. الوكلاء الفرعيون — ضرورة لا غنى عنها

العملية الرئيسية (القائد) لا يجب أن تفعل أي شيء بنفسها. مهمتها هي التنسيق والتفويض. كل العمل تنفذه الوكلاء الفرعيون بـ سياقات صغيرة.

لماذا:

  • سياق العملية القائدة يبقى ضمن 100–200K ولا ينمو
  • الوكيل الفرعي أنهى عمله — تم تنظيف السياق
  • يمكن تشغيل عشرات الوكلاء بالتوازي

كيفية الإعداد:

العملية الرئيسية (Opus، سياق 200K)
├── الوكيل 1 (Haiku، سياق قصير) — معالجة السكربتات
├── الوكيل 2 (Sonnet، سياق قصير) — كتابة الاختبارات
└── الوكيل 3 (Haiku، سياق قصير) — إعادة الهيكلة

للمهام الكثيفة (مثلاً، معالجة 8000 سكربت) — سكربت واحد، وكيل فرعي واحد، نموذج Haiku. هذا أرخص بكثير من تشغيل كل شيء عبر محادثة واحدة.

3. السياق والهلوسات — علاقة غير خطية

Opus بسياق 100K يعمل بدقة أعلى من Opus بسياق 1M. عند سياق 1M تزداد الهلوسات بشكل غير خطي. أي أن السياق الكبير — أغلى وأسوأ من حيث الجودة.

الاستنتاج: حافظ على السياقات مدمجة. أفضل 5 محادثات بـ 100K من محادثة واحدة بـ 500K.

4. المهارات تحل المشكلة

المهارات (skills) — هي برومبتات مُعدة مسبقاً تُحمّل عند الحاجة ولا تبقى في السياق بشكل دائم. العديد من الأطر تبدأ بتجهيز/تحميل المهارات للعمل.

على عكس خوادم MCP (التي تُحمّل تعليماتها في السياق باستمرار)، المهارات تُفعّل فقط عند الحاجة. قبل Opus 4.5 كان الكثير من التوكنز يُهدر على MCP — الآن حُلت المشكلة، لكن نهج «استبدال MCP بالمهارات والأوامر» لا يزال فعالياً للتوفير.

Caveman

Caveman مهارة وإضافة مفتوحة المصدر لـ Claude Code (ولوكلاء آخرين): تجعل النموذج يجيب باختزال شديد بأسلوب «caveman speak» مع الإبقاء على الدقة التقنية — تجسيد عملي لفكرة «كلما قصرت المحادثة كان التكلفة أقل» من القسم 1. في معايير الأداء داخل المستودع يُذكر توفير يبلغ في المتوسط حوالي 65% من توكنز الإخراج؛ ويوجد caveman-compress بشكل منفصل لضغط النثر في ملفات الذاكرة وتوفير توكنز الإدخال.

5. النماذج الصينية والاشتراكات الاقتصادية

Alibaba Cloud والاشتراكات الصينية — من حيث نسبة السعر/التوكن تفوز بفارق كبير. اشتراك بحوالي $30 يعطي كمية توكنز مماثلة لاشتراك Anthropic بـ $200.

التطبيق العملي:

  • تُستخدم أغلفة (wrappers) فوق Claude تسمح بتبديل مزوّد النماذج
  • متغيرات البيئة العامة لا تُعدَّل — المطلوب فقط يُمرَّر عند تشغيل الغلاف
  • Gemini أيضاً لديه اشتراكات رخيصة يمكن استخدامها بشكل مشابه

حتى الآن لا يوجد حل جاهز «لدمج جميع النماذج من مزودين مختلفين مباشرة في Claude»، لكن الأغلفة تغطي 80% من الاحتياجات. أحد هذه الحلول — Clother — يسمح بتشغيل Claude Code مع مزودي نماذج مختلفين دون المساس بالإعدادات العامة.

6. رسوم المعرفة وRAG: تقليل التوكنز 10 أضعاف

LightRAG

LightRAG — نهج يربط بين رسوم المعرفة والنماذج اللغوية. يسمح بتقليل استهلاك التوكنز حتى 10 أضعاف من خلال الاستخراج المنظم للمعلومات ذات الصلة بدلاً من تحميل السياق بالكامل.

a8e

تطوير ivansglazunov — المؤلف يعمل في عزلة وينشر القليل، لذا لا يمكن رؤية المشروع بشكل كامل حتى الآن. يعمل كـ أمين مكتبة-RAG: جميع البيانات الواردة تُلقى في قاعدة بيانات. الفكرة هي ربط رسوم المعرفة بالنماذج اللغوية لاستخراج سياق أكثر دقة وأقل تكلفة. النهج مشابه للتقنيات الموصوفة في هذا الفيديو.

cmdop-claude

cmdop-claude — نهج من markolofsen. من رسوم المعرفة تُستخدم أشجار ميركل. الفكرة الأساسية: تشغيل النماذج اللغوية الصينية الرخيصة تقريباً في الخلفية لترتيب مجلد .claude — تجهيز السياق للنموذج الرئيسي.

7. أطر إدارة الوكلاء

Superpowers

إطار شائع لـ Claude Code مع مجموعة من المهارات الجاهزة والأنماط وخطوط المعالجة.

AI Factory

ai-factory — إطار مثير للاهتمام لإدارة وكلاء الذكاء الاصطناعي. مقترناً مع aif-handoff يوفر واجهة أمامية بلوحات كانبان وفلاتر.

الفكرة الأساسية: الإنسان يضع المهام الأولية، الذكاء الاصطناعي يُفككها، لكن العمل لا يبدأ دون موافقة الإنسان على الخطة الجاهزة. هذا يوفر التوكنز (لا إعادة عمل) ويعطي تحكماً.

8. تفاصيل عملية صغيرة

High effort وreasoning يمكن تعطيلهما لتقليل التكلفة. ليست كل مهمة تتطلب «تفكيراً عميقاً» من النموذج.

المهارات بدلاً من MCP. قبل Opus 4.5 كان استبدال MCP بالمهارات يوفر كثيراً. الآن الفرق أقل، لكن للمهام الكثيفة النهج لا يزال فعالاً.

إدارة نموذج الوكلاء الفرعيين. يمكن تحديد النموذج الذي يجب أن يستخدمه الوكيل الفرعي. للمهام الروتينية — Haiku، للمهام المعقدة — Sonnet أو Opus.

وضع --bare — تشغيل نظيف. علامة --bare تشغل Claude Code بدون خطافات أو LSP أو مزامنة الإضافات أو الذاكرة التلقائية أو التحميل المسبق في الخلفية والأهم — بدون اكتشاف تلقائي لـ CLAUDE.md. كل هذا عادة يُحمّل في البرومبت النظامي ويحرق التوكنز قبل أول رسالة. في وضع bare يبدأ السياق بأقل حجم ممكن، ويمكن تمرير البيانات المطلوبة بشكل مُوجّه عبر --system-prompt أو --append-system-prompt أو --add-dir أو --mcp-config. مثالي للوكلاء الفرعيين الكثيفين حيث البري-برومبت الزائد — هدر صريح.

9. الخطافات — توفير تلقائي

الخطافات (hooks) — هي سكربتات تُنفّذ عند حدوث أحداث داخل Claude Code. تُضبط في .claude/settings.json وتسمح بأتمتة الروتين الموفر للتوكنز.

أنواع الخطافات

  • PreToolUse — يُنفّذ قبل استدعاء أداة. يمكن تصفية أو تعديل بيانات الإدخال.
  • PostToolUse — يُنفّذ بعدها. مفيد للتنسيق التلقائي والمعالجة اللاحقة.
  • PreCompact — يُنفّذ قبل ضغط السياق. يسمح بحفظ المعلومات المهمة.
  • Stop — يُنفّذ عندما ينتهي الوكيل من العمل. يمكن التحقق من اكتمال التنفيذ.
  • SessionStart — يُنفّذ عند بدء الجلسة. مفيد للتحميل المسبق للسياق.

أمثلة على خطافات مفيدة

تصفية مخرجات الاختبارات. مثال رسمي من Anthropic — خطاف على PreToolUse لـ Bash يقتطع المخرجات الطويلة للاختبارات ويبقي فقط الاختبارات الفاشلة والملخص. بدلاً من 500 سطر سجل يدخل 10 أسطر في السياق — توفير مباشر للتوكنز.

{
  "hooks": {
    "PreToolUse": [{
      "matcher": "Bash",
      "command": "your_filter_script.sh"
    }]
  }
}

التنسيق التلقائي بعد الكتابة. خطاف على PostToolUse لـ Write/Edit — تشغيل prettier أو black بعد كل حفظ ملف. لا تحتاج النموذج لإنفاق التوكنز على تنسيق الكود — هي تكتب المنطق، والتنسيق يقوم به الخطاف.

الحماية من الأوامر المدمرة. خطاف على PreToolUse لـ Bash يمنع rm -rf وDROP TABLE والأوامر المشابهة. لا يوفر التوكنز مباشرة، لكنه يحمي من الأخطاء المكلفة وإعادة العمل.

حفظ السياق قبل الضغط. خطاف على PreCompact — قبل ضغط السياق يمكن حفظ القرارات الأساسية والحالة في ملف لعدم فقدانها بعد الضغط.

ما لا تستطيع الخطافات فعله

الضغط التلقائي (auto-compact) كل N رسالة لا يمكن ضبطه عبر الخطافات — هذه وظيفة مدمجة في Claude Code. لكن يمكن استخدام خطاف PreCompact للتحكم في ما يُحفظ عند الضغط.

10. لقطات الشاشة — محتقن خفي للتوكنز

Claude حسب التوثيقة يضغط الصور حسب الدقة. عملياً — الضغط غير ملحوظ. على شاشة 4K تكلّف لقطة الشاشة الواحدة كثيراً.

الحل: تصغير لقطات الشاشة إلى حوالي 400px عرض قبل الإرسال. يبقى النص مقروءاً، والتوكنز تُستهلك بدرجة أقل بكثير.

لـ macOS صنعتُ Open Screenshot — أداة تأخذ لقطات الشاشة مباشرة بتنسيق مضغوط الدقة، لا حاجة لتغيير الحجم يدوياً. جرّبها!

قائمة مرجعية للتوفير

النهجالتوفير
وكلاء فرعيون بسياقات قصيرة2–5x في الجلسات الطويلة
نماذج صينية للمهام الروتينية5–10x بالسعر ($30 مقابل $200)
مهارات بدلاً من MCP دائم1.5–2x
خطافات لتصفية المخرجات1.5–3x في مهام الاختبارات/السجلات
لقطات شاشة مدمجة1.5–2x في المهام البصرية
رسوم المعرفة/RAG بدلاً من السياق الكاملحتى 3–5x
تعطيل reasoning للمهام البسيطة1.5–2x
وضع --bare للوكلاء الفرعيين1.5–2x في كل تشغيل
أطر مع موافقة على الخطةبشكل غير مباشر، عبر تقليل إعادة العمل

يمكنك إنفاق ما تشاء — حتى 10 حسابات بـ $200 ليست الحد الأقصى. لكن هذا ليس دليلاً على الكفاءة. الهدف هو تقليل التكاليف 10 أضعاف على الأقل دون فقدان الجودة.