جدول المحتويات:
2025 مؤلف: John Day | [email protected]. آخر تعديل: 2025-01-13 06:56
ماذا فعلت؟
● روبوت يمكن تدريبه على المشي (المضي قدمًا) على أسطح مختلفة. يصور الروبوت مخلوقًا بسيطًا بأربع أرجل "بدون ركبة" يكافح للمضي قدمًا. إنه يعرف أنه يمكنه توجيه كل من الساقين بثلاث طرق ممكنة فقط. الآن يتعين عليها معرفة أفضل الخطوات الممكنة التي يمكن أن تتخذها لمواصلة الحركة. نظرًا لأن حركتها تعتمد أيضًا على الاحتكاك مع السطح ، فإننا نعتقد أنه لكل سطح مختلف يمشي ، ستكون هناك مجموعة مختلفة (ليست بالضرورة فريدة ولكن على الأرجح متشابهة) من أجل مضاعفة جهدها للمضي قدمًا.
فيم تستخدم؟
● من الأفضل استخدامه لتصور أنماط المشي لروبوت AI.
الخطوة 1: مخطط التدفق
هنا تفصيل للمشروع بأكمله. على نطاق واسع ، يتكون المشروع من جزأين إلكترونيات بهيكل ميكانيكي للروبوت والآخر هو الخوارزمية التي تعمل على الكمبيوتر والرمز الذي يعمل على اردوينو.
الخطوة الثانية: المكونات الرئيسية المتضمنة:
إلكترونيات
اردوينو UNO (!)
أجهزة الاستشعار بالموجات فوق الصوتية
أجهزة المحركات
وحدة بلوتوث
الترميز
اردوينو IDE
تيراتيرم
دفتر Jupyter
س- خوارزمية التعلم
الخطوة 3: الوحدة النمطية V1:
التعلم المعزز: باستخدام ANN (الشبكة العصبية الاصطناعية) خططنا لتدريب الروبوت الخاص بنا وتوصلنا إلى طريقتين محتملتين.
القيود: كل ساق (محرك مؤازر) مقيدة بأخذ 3 أوضاع ممكنة فقط 60 و 90 و 120 درجة. الافتراضات: نعتبر أن حركة الروبوت ستشكل 4 حالات (الحالة هي اتجاه معين لجميع الماكينات الأربعة) ، أي ستكون هناك 4 حالات مختلفة للروبوت والتي سنعتبرها 4 خطوات على التوالي تمنحنا دورة واحدة من الحركة ، في الذي سيحرك الروبوت مسافة ما للأمام. ستتكرر هذه الدورة إلى ما لا نهاية لإبقاء الروبوت متحركًا.
لكن المشكلة الوحيدة هي عدد التكرارات التي سيتم تقييمها - لدينا 3 اتجاهات محتملة لكل محرك وهناك 4 محركات مختلفة تجعله 3 ^ 4 = 81 حالة يمكن أن يوجد فيها الروبوت في خطوة أو حالة واحدة. علينا أن نتخذ 4 خطوات مختلفة لإكمال حركة معقدة واحدة ، مما يعني أن 81 ^ 4 = 43 ، 046 ، 721 مجموعة ممكنة ليتم فحصها لتحقيق أقصى قدر من الكفاءة لدورة واحدة من الحركة. لنفترض أن تدريب دولة واحدة يستغرق 5 ثوانٍ ، فقد يستغرق الأمر 6.8250 سنة لإكمال التدريب!
الخطوة 4: الوحدة النمطية V2:
خوارزمية التعلم Q
تم تطوير خوارزمية التعلم التعزيزي المبكر لتدريب الأشياء ذات الحالة المحدودة وإيجاد المسارات الأقصر. المصدر:
رياضيات الخوارزمية: هناك 81 حالة محتملة لكل خطوة يمكن أن يكون فيها الروبوت ، نسمي هذه الحالات كأرقام من 1 إلى 81 والآن ما نريد أن نعرفه هو قيمة الانتقال ، وهذا يعني التغيير في موضع الروبوت (المسافة المقطوعة) بينما ينتقل من حالة عشوائية s1 إلى حالة أخرى s2 (s1 ، s2 من تلك الحالات الـ81). يمكننا رؤيتها كمصفوفة بها 81 صفًا و 81 عمودًا حيث سيكون عنصر المصفوفة مساويًا لقيمة المسافة التي انتقلت منها المقابلة لرقم صفها وعمودها. يمكن أن تكون هذه القيم إيجابية أو سلبية اعتمادًا على عمل الروبوت في الكلمة الحقيقية. سنجد الآن حلقة مغلقة من الحالات حيث تكون المسافة التي تقطعها دائمًا موجبة ، وسنقوم بتقييم 81x81 لقيم المصفوفة التي تبلغ 81 ^ 2 = 6561 ، والآن إذا استغرقت 5 ثوانٍ للحصول على هذه القيمة مخزنة في المصفوفة ، فسيتم ذلك. يستغرق 9.1125 ساعة فقط لإنشاء مصفوفة كاملة ومن ثم يمكن معرفة حلقة من الخطوات لزيادة كفاءة الحركة إلى أقصى حد بسهولة.
الخطوة 5: المشاكل التي ينطوي عليها الأمر -
- بالنسبة لبعض الحالات ، كانت حركة الروبوت غير متساوية للغاية وكانت تؤثر على قيمة المستشعر بالموجات فوق الصوتية ، حيث يميل الروبوت ويلتقط المسافة من جدار بعيد.
- كانت مشكلة فصل الكمبيوتر المحمول وإعادة تشغيل اردوينو تجعله يتدرب من قيمة 0 أمرًا مزعجًا للغاية.
- كانت مشاهدة قطار الروبوت لمدة 5 ساعات متواصلة مرهقة للغاية.
الخطوة 6: الوحدة A1 و A2:
- يشمل الجزء الميكانيكي لوحة الهيكل مع أربع أجهزة مؤازرة مثبتة عليه ، وقد استخدمنا عصي الآيس كريم لصنع الأرجل.
- مهمتنا الأساسية - تتبع مسافة الروبوت من موقعه الأولي.
- كان نهجنا الأول هو استخدام مستشعر الدوران واستخدام تسريع الروبوت أثناء تحركه لاستخراج سرعته ومن ثم موضعه.
- المشكلة - اتضح أن تنفيذها معقد للغاية! بديل - قمنا بتقييد حركة الروبوت على بُعد واحد فقط واستخدمنا جهاز استشعار بالموجات فوق الصوتية لقياس المسافة من جدار أمامك مباشرة.
- تم استخدام وحدة HC05-Bluetooth أثناء فترة التدريب لنقل معدل انتقال المسافة بين خطوتين إلى جهاز الكمبيوتر وهناك تم تخزين البيانات في مصفوفة.
الخطوة 7: ربط مقاطع الفيديو:
خطوات الطفل:
لقطة التدريب:
مستقيم تقريبًا:
فيديو الروبوت الراقص:
الفيديو النهائي 0: