أوجد باحثون في معهد ماساشوستس تقنية التنعيم Smoothing كطريقة لزيادة قدرة الروبوت على التلاعب بالأشياء من حوله واستخدام جسمه بالكامل، اقرأ المقال للمزيد.
هل شاهدت من قبل روبوتا يرقص؟ ربما نعم وربما لا، ولكن جميعنا نعرف الروبوتات أنها اختراع جامد الحركة أي أن حركته محدودة وبطيئة بل ونستطيع تقليدها بسهولة، ولكن باحثون في معهد ماساشوستس للتكنولوجيا MIT أوجد تقنية تمكن الروبوتات من التلاعب بالأشياء بأجسامها كما البشر!
هذه التقنية هي التنعيم Smoothing، هذا ما سنتحدث عنه في مقالنا هذا.
قدرة الإنسان على القيام بأبسط المهام كحمل صندوق مثلا أو عمل تمرين القرفصاء سهل جدا ولكن الروبوتات حركتها محدودة ولا تستطيع التلاعب بالأشياء فمثلا لن ترى روبوتا يستطيع تدوير كرة السلة على إصبعه، لأن كل نقطة اتصال بين الروبوت والجسم يجب أن تكون قد تمت برمجتها ضمن الخوارزمية الخاصة به، ومع مليارات الأحداث المحتملة للاتصال، المهمة صعبة للغاية بالنسبة لمعظم الروبوتات لتنفيذها بسلاسة.
وجد باحثون في معهد ماساتشوستس للتكنولوجيا MIT طريقة لزيادة مهارة وبراعة الروبوتات في الحركة، حيث قال Hyung Ju Terry Suh خريج في تخصص الهندسة الكهربائية وعلم الحاسوب:
“Rather than thinking about this as a black-box system, if we can leverage the structure of these kinds of robotic systems using models, there is an opportunity to accelerate the whole procedure,” said HJ Terry Suh, an electrical engineering and computer science graduate student.”
أي بدلا من أن نتعامل مع هذه الأنظمة على أنها نظام غامض لا يمكن فهم كيفية معالجته للأمور، لا بد من فهم هيكل أنظمة الروبوت واستخدام نماذج رياضية لتسريع تحسين عملياته.
تقنية الذكاء الاصطناعي التنعيم smoothing هي تلخيص العديد من نقاط الاتصال بين الجسم والروبوت إلى عدد أقل من القرارات أو الخطوات. أي بدلا من أن تكون كل حركة أو نقطة اتصال قد تم برمجتها ضمن خوارزمية الروبوت تم تلخيص مجموعة من نقاط الاتصال لتكون وكأنها ضمن قرار واحد، هذا يتيح حتى للخوارزمية البسيطة القدرة على التعرف بسرعة على خطة فعّالة للتحكم بالروبوت وتنفيذ المهمة بنجاح. [1]
تتعلم الروبوتات بمبدأ Reinforcement learning أو التعلم المعزز وهو تقنية لتعلم الآلة، حيث يتعلم الروبوت أداء مهمة معينة من خلال مبدأ التجربة والخطأ و وجود مكافأة عند اقترابه من أداء المهمة أو الهدف.
ولكن تطبيق هذه النوع من التعلم يجعل تعليم الروبوت حمل جسم معين أو التفاعل معه معقد وصعب جدا بل ويحتاج أيضا إلى الكثير من الحسابات، ويعزو ذلك إلى وجود المليارات من نقاط الاتصال المحتملة التي يمكن للروبوت أن يواجهها عندما يستخدم أصابعه أو ذراعيه أو حتى جذعه ليتفاعل مع هذا الجسم، والذي قد يجعل مهمة تعليم الروبوت لحمل لجسم معين صعبة ومحدودة. [2]
قال Suh:
‘‘Reinforcement learning may need to go through millions of years in simulation time to actually be able to learn a policy’’.
أي أن التعليم باستخدام التعليم المعزز بالفعل يحتاج الى ملايين السنين لاكتساب القدرة على تعلم استراتيجية.
عندما أجرى الباحثون في MIT تحليلا عميقا اكتشفوا أن تقنية التنعيم Smoothing تحسن من أداء التعلم المعزز Reinforcement Learning، ولكن كيف؟
يتخذ الروبوت العديد من القرارات الصغيرة حول كيفية تعديل وضع أصابعه أثناء التلاعب بالجسم، فمثلا قد يتخذ قرارات حول حركة أصابع الروبوت الأخرى التي لا تتلامس مع الجسم، ولكن ليس كل هذه القرارات مهمة بنفس الدرجة، لذلك باستخدام تقنية التنعيم Smoothing يتم تجميع القرارات غير المهمة ويترك فقط القرارات المهمة.
تم تضمين تقنية التنعيم Smoothing في التعلم المعزز Reinforcement Learning حيث يقوم بأداء تلك العملية بشكل ضمني عن طريق تجربة العديد من نقاط الاتصال وحساب متوسط النتائج. الباحثون في MIT قاموا بتصميم نموذج بسيط يستخدم نفس نهج التمهيد، مما يتيح له التركيز على التفاعلات الأساسية بين الروبوت والأشياء وتوقع سلوك الروبوت على المدى البعيد. وأظهروا أن هذا النموذج يمكن أن يكون مفيدًا بنفس قدرة تعلم التعزيز في إنشاء خطة معقدة.
بعد إيجاد تقنية التنعيم Smoothing، أصبح بالإمكان تصنيع روبوتات صغيرة ومتنقلة يمكنها التلاعب بالأشياء باستخدام أذرعها و أجسامها بدلا من الأذرع الروبوتية الكبيرة التي تقتصر على القبضة باستخدام أطراف الأصابع وبالتالي تقليل استهلاك الطاقة وتخفيض التكاليف.
بالإضافة إلى ذلك، يمكن الاستفادة من هذه التقنية في اكتشاف الفضاء حيث يمكن إرسال الروبوتات في مهمات استكشاف إلى المريخ أو أجسام أخرى في النظام الشمسي، حيث يمكن لهذه الروبوتات التكيف بسرعة مع البيئة باستخدام الكمبيوتر المُثبت داخلها فقط.
الخاتمة
إذا تأتي هذه التنقية كحل لزيادة قدرة الروبوت على الحركة واستخدام جسمه للتلاعب بالأجسام من حوله، تماما مثل زيارة طبيب العظام وقد أصلح تصلب ظهر أحدهم فتسهل حركته. ستتيح هذه التقنية بالفعل استخدام الروبوتات لأداء المهام الحركية فالعمل في المصانع ونقل الأشياء، من يدري فقد نرى الروبوتات تعمل في مجال البناء مثلا.
المصادر