نظرة عامة

autoresearch هو مشروع تجريبي مفتوح المصدر من أندري كارباثي يوضح قوة وكلاء الذكاء الاصطناعي المستقلين في إجراء أبحاث تعلم آلي حقيقية. يوفر إطار تدريب مبسط يعمل على وحدة معالجة رسومات واحدة قائم على تنفيذ مبسط لنظام nanochat، حيث يأخذ وكيل ذكاء اصطناعي للبرمجة السيطرة الكاملة على حلقة التجارب.

بدلاً من تعديل كود بايثون يدوياً، يكتب الباحثون تعليمات عالية المستوى في ملف ماركداون program.md. ثم يقوم الوكيل بتعديل سكربت التدريب (train.py) بشكل تكراري، وينفذ تجارب تدريب بفترة زمنية محددة (عادة 5 دقائق)، ويقيم التحسينات بناءً على مقياس تحقق (مثل val_bpb)، ويثبت فقط التغييرات الفائزة على فرع Git مخصص.

الميزات الرئيسية

حلقة الوكيل المستقل: يخطط الوكيل الذكي للتجارب، ويعدل الكود (الهندسة المعمارية، المعلمات الفائقة، المُحسّن، إلخ)، وينفذ التدريب، ويقرر ما يجب الاحتفاظ به.
كفاءة وحدة معالجة رسومات واحدة: مصمم للأجهزة المتاحة؛ كل تجربة تعمل لمدة قصيرة ثابتة (~5 دقائق)، مما يتيح ~12 تجربة في الساعة.
التحكم في الإصدارات باستخدام Git: يتم تتبع التحسينات عبر عمليات التثبيت على فرع مخصص، مما يجعل مراجعة التغييرات وإرجاعها سهلاً.
إعداد بسيط: قاعدة كود صغيرة (~630 - 1000 سطر في عدة ملفات) تركز على مقياس واحد واضح للتقييم الموضوعي.
الإشراف البشري عبر المطالبات: يحدد المستخدمون "منظمة البحث" من خلال تعليمات اللغة الطبيعية في ماركداون، مما يسمح بسلوكيات وكيل متطورة دون لمس الكود منخفض المستوى.
قابل للتمديد: من السهل إضافة المزيد من الوكلاء، وتحسين مطالبة program.md، أو التكيف مع نماذج/مهام مختلفة.

كيف يعمل

يقوم المستخدم بإعداد المستودر ويوفر هدف البحث في program.md.
يتم تشغيل وكيل برمجة ذكي (مثل Claude أو GPT أو نماذج محلية).
ينشئ/يستخدم الوكيل فرع Git مخصص ويبدأ التكرار:
- يعدل train.py.
- ينفذ تجربة تدريب محددة الوقت.
- يقيس مقياس التحقق الرئيسي.
- إذا تحسن، يثبت التغيير؛ وإلا، يتجاهله ويحاول مرة أخرى.
خلال الليل أو على مدار أيام، يتراكم النظام عشرات إلى مئات التجارب، مما يكشف عن تكوينات نموذج أفضل.

يركز المشروع على هندسة مطالبة الوكيل ("كود منظمة البحث") لتعظيم سرعة البحث على المدى الطويل دون تدخل بشري.

حالات الاستخدام

البحث الشخصي في التعلم الآلي: دع وكيلاً يستكشف المعلمات الفائقة، أو الهندسات المعمارية، أو التحسينات أثناء نومك أو تركيزك على أفكار عالية المستوى.
عرض تعليمي: فهم سير عمل وكلاء الذكاء الاصطناعي في سياق تعلم آلي حقيقي وقابل للتشغيل.
الأسراب الموزعة: تمكين الامتدادات المجتمعية لعدة وكلاء أو أجهزة للتعاون (مثل مشاريع autoresearch@home).
النمذجة الأولية السريعة: اختبار أفكار الاكتشاف العلمي المستقل في تدريب نماذج لغة كبيرة صغيرة الحجم.
معايرة قدرات الوكيل: تقييم مدى أداء نماذج لغة كبيرة مختلفة كباحثين مستقلين.

البدء

قم بنسخ المستودع، وتثبيت التبعيات عبر pyproject.toml، وضبط مزود الذكاء الاصطناعي الخاص بك (مفاتيح واجهة برمجة التطبيقات)، وجهز ملف program.md مع تعليمات البحث الخاصة بك، ثم ابدأ تشغيل حلقة الوكيل. يعمل على بطاقة رسومات واحدة ويتطلب إعدادًا بسيطًا.

يشمل المستودع ملف program.md أساسيًا يمكن التكرار عليه للحصول على نتائج أفضل.

أهميته

يمثل autoresearch نظرة مبكرة على مستقبل يتولى فيه وكلاء الذكاء الاصطناعي العمل الروتيني للبحث التجريبي، مما يحرر البشر للتركيز على التوجيه الإبداعي. وقد أثار اهتمامًا مجتمعيًا واسعًا، وتفرعات، وإصدارات معدلة (لمعالجات AMD، Apple Silicon، إلخ)، ومناقشات حول مجموعات الوكلاء و"المفردية المبكرة" للعلم الآلي.

القيود

تبدأ التجارب من الصفر في كل مرة (لا يوجد ذاكرة مستمرة بين عمليات التشغيل في النسخة الأساسية).
يركز على مقياس واحد بسيط ونماذج صغيرة.
يعتمد النجاع بشكل كبير على جودة وكيل الترميز الأساسي وهندسة المطالبات.

للحصول على أحدث التفاصيل، والكود، ومناقشات المجتمع، قم بزيارة مستودع GitHub الرسمي.

autoresearch

نظرة عامة

الميزات الرئيسية

كيف يعمل

حالات الاستخدام

البدء

أهميته

القيود

Tags

Related Entries

autoresearch

Open SWE

Hermes Agent

Open SWE

وكلاء مساحة العمل

عامل هيرميز

Related Reads

دليل استخدام OpenAI GPT-5.5: تعليمي خطوة بخطوة

ما هو OC Maker؟ أداة الذكاء الاصطناعي التي أحدثت ثورة في إنشاء الشخصيات الأصلية في عام 2026

غوغل تستثمر ما يصل إلى 40 مليار دولار في أنثروبيك بدعم قدرة حوسبية 5 غيغاواط: سباق التسلح في الذكاء الاصطناعي يدخل مرحلة جديدة