التعلم الآلي غير الخاضع للإشراف يتميز بأن النموذج لا يخضع لتوجيه أو إشراف بشري, نظرا لأن البيانات غير موسومة, حيث يتعين عليه اكتشاف الأنماط الخفية فيها.
مهما بلغ التطور والتقدم في التعلم الآلي ونماذج الذكاء الاصطناعي إلا أنه لا تزال تحتاج الى تدخل بشري في التعليم والتدريب تحت ما يسمى بالتعلم الخاضع للإشراف حيث تكون بيانات التدريب موسومة ومصنفة, صحيح؟ في الواقع الجواب هو لا, هناك بعض أنواع الخوارزميات التي تتعلم تحت التعلم الآلي غير الخاضع للإشراف, يمثل هذا النوع من التعلم تحد هام في عالم الذكاء الاصطناعي حيث يتعامل النظام مع البيانات بشكل ذاتي دون توفير معلومات توجيهية محددة أو تصنيفات واضح.
في التعلم غير الخاضع للإشراف، يظهر التركيز على تحسين قدرة الأنظمة على التكيف مع بيئات متغيرة وفهم الهياكل المعقدة للبيانات بشكل تلقائي, هذا يفتح أفقا واسعة لتحسين أداء النظم الذكية في تحليل البيانات الكبيرة والتعامل مع مهام ذكية تتطلب فهما عميقا وشمولية للمعلومات. ولكن كيف تحديدا يتم تدريب النماذج دون إشراف وما نوع الخوارزميات التي تعتمد هذا النوع من التعلم وما التحديات المرتبطة به, اقرأ المقال لتعرف الإجابات لهذه الأسئلة.
التعلم الآلي غير الخاضع للإشراف Unsupervised Machine Learning هو نوع من أنواع تعلم الآلة, حيث يتم تزويد نماذج الذكاء الاصطناعي بمجموعة بيانات بدون تسميات أو توجيهات محددة, ليقوم بدروه بالاعتماد على ذاته بفهم هذه البيانات ويكتشف الأنماط والتحليلات فيها دون توجيه. [1]
يختلف التعلم غير الخاضع للإشراف عن التعلم الخاضع للإشراف بنوع بيانات تدريب, حيث تكون في التعلم الخاضع للإشراف موسومة بتسميات أو تصنيفات محددة بناء فيتعلم النموذج من هذه التسميات.
يكون التعلم غير الخاضع للإشراف مهما في تطبيقات مثل التعرف على الصور أو تحليل البيانات أو العملاء لأنه قادر على اكتشاف الأنماط والاختلافات في البيانات دون أن تكون موسومة, ثم يقوم بتصنيف البيانات الى مجموعات دون تحيز ووسم نقاط البيانات ذاتيا دون الاعتماد على توجيه خارجي.
لنأخذ مثالا بسيطا عليه:
لنفترض أن لديك مجموعة من الفواكه، وتريد تنظيمها باستخدام تعلم غير الخاضع للإشراف, وهذه الفواكه هي تفاح، وبرتقال، وموز، ولكن ليس لديك تسميات تقول للنظام أي فاكهة هي أي. تقوم بتطبيق خوارزمية تعلم غير الخاضع للإشراف، وهذه الخوارزمية تبدأ في فهم الفروق والتشابهات بين الفواكه بناء على خصائصها, قد تلاحظ الخوارزمية أن لديها فئات تتعلق باللون، الشكل، أو حتى النكهة.
في النهاية، يمكن أن يقوم النظام بتجميع الفواكه بناء على هذه الخصائص، ورغم أنه قد لا يعرف اسم كل فاكهة بشكل صريح، إلا أنه قادر على تشكيل مجموعات بناء على التشابهات والاختلافات التي اكتشفها دون توجيه خارجي.
ذكرنا أن التعلم غير الخاضع للإشراف يتعامل مع بيانات غير موسمومة وغير مصنفة وهو يقوم بتصنيفها, لذلك تندرج مهامه تحت ثلاثة أنواع: التجميع Clustering, قواعد الارتباط Association Rules, تقليل الأبعاد Dimensionality Reduction, لنوضح كلك على حدى. [2]
من الطبيعي أن تكون مجموعات البيانات مختلفة في الخصائص والمميزات, وهنا يأتي دور التعلم غير الخاضع للإشراف بتقسيم البيانات الى مجموعات بناء على الخصائص المتشابهة بينها, فتكون البيانات في المجموعة الواحدة متشابهة في الصفات ولكنها تختلف عن صفات وخصائص البيانات في المجموعات الأخرى, تقسم مهام التجميع الى أنواع اعتمادا على تصنيف البيانات:
كما يشير الاسم "قواعد الارتباط", هي مهمة تعتمد على القواعد بغرض اكتشاف العلاقات والسمات بين المتغيرات في مجموعة البيانات, حيث يقوم النموذج بتحليل البيانات بحثا عن تقارب أو ترابط بين السمات، ويقوم بذلك باستخدام "مقياس الاهتمام" كأداة لتحديد مدى أهمية أو قوة العلاقات التي يكتشفها.
من أشهر استخدامات قواعد الارتباط هي تحليل سلة التسوق لدراسة العلاقات بين المنتجات التي يشتريها العملاء معا بشكل متكرر, مثلا, عادة ما يتم شراء الحليب والخبز معا, هذا يتيح فهم أفضل لعادات وسلوكيات الشراء لديهم وبالتالي إتاحة الفرصة لتطوير استراتيجيات أفضل للبيع مثلا من خلال توفير عروض متكاملة أو تسويق متكامل لمنتجات ذات صلة.
أشهر خوارزمية مستخدمة لهذا الغرض هي خوارزمية Apriori, ولكن هناك خوارزميات أخرى قد تستخدم أيضا في قواعد الارتباط مثل خوارزميات: Eclat و FP-growth.
بعض البيانات قد تكون ضخمة بسبب وجود عدد كبير جدا من المتغيرات العشوائية والتي يكون من الصعب تمثيلها كإحداثيات أي أنها تكون ذات أبعاد عالية, لذلك تأتي مهمة تقليل الأبعاد بتحويل البيانات من مساحة ذات أبعاد عالية الى مساحة ذات أبعاد منخفضة من خلال تقليل عدد المتغيرات العشوائية, بحيث يتم استخلاص مجموعة بيانات فرعية من مجموعة البيانات الأصلية مع احتفاظ المجموعة الفرعية ببعض خصائص البيانات الأصلية, وهكذا لن تتأثر الخصائص المعنوية في البيانات الأصلية.
من أشهر الخوارزميات عليها هما خوارزميتا تحليل المكون الرئيسي Principal Component Analysis و تفريق القيمة المفردة Singular Value Decomposition.
تستفيد خوارزميات التعلم غير الخاضع للإشراف من تقنيات التعلم الذاتي، حيث تكتسب المعرفة بدون حاجة إلى تسميات أو توجيه. يتم تزويد النموذج ببيانات أولية غير مصنفة، حيث يجب عليه استنتاج قواعده الخاصة وهيكل المعلومات استنادا إلى التشابهات والاختلافات والأنماط، دون توجيه صريح حول كيفية التعامل مع كل قسم من البيانات. [3]
تظهر فعالية خوارزميات التعلم غير الخاضع للإشراف بشكل أكبر في المهام التي تتطلب معالجة معقدة، مثل تنظيم مجموعات ضخمة من البيانات إلى تصنيفات, كما أنها مفيدة لاكتشاف الأنماط التي قد لا يتم اكتشافها مسبقا في البيانات، ويمكنها المساعدة في تحديد الميزات ذات الفائدة لتصنيف البيانات.
لنفترض أن لديك مجموعة ضخمة من البيانات المتعلقة بالطقس, سيقوم التعلم غير الخاضع للإشراف بفحص البيانات واكتشاف الأنماط فيها، مثل تجميعها حسب درجات الحرارة أو الأنماط المشابهة في الطقس.
على الرغم من أن الخوارزمية ذاتها لا تدرك هذه الأنماط استنادا إلى أي معلومات سابقة قد قدمتها، يمكنك بعد ذلك مراجعة تجميع البيانات ومحاولة تصنيفها بناء على فهمك للمجموعة البيانية, على سبيل المثال، قد تعترف بأن مجموعات درجات الحرارة المختلفة تمثل فصول السنة الأربعة أو أن أنماط الطقس تنقسم إلى أنواع مختلفة، مثل المطر أو الثلج أو البرد.
كنا قد وضحنا أن التعلم غير الخاضع للإشراف يستخدم بيانات تدريب غير موسومة أما التعلم الخاضع للإشراف فهو يستخدم بيانات تدريب موسومة أو لها تصنيفات محددة, ولكن فضلا عن نوع البيانات, كيف يختلف نوعي التعلم عن بعضهما البعض, نوضح الاختلافات بينهما في عدة نقاط: [4]
وأخيرا يعتمد اختيار استخدام التعلم الخاضع للإشراف أو التعلم غير الخاضع للإشراف على ثلاث أسئلة: هل البيانات موسومة أم لا؟ ما الهدف؟ ما الخوارزمية المناسبة؟
هل لديك الوقت والموارد الكافية لوسم البيانات وتصنيفها أم ستضطر لاستخدام بيانات غير موسومة, أيضا لا بد من تحديد الهدف هل هو التصنيف أم التنبؤ أم تريد من النموذج أن يتعرف على النمط المخفي في البيانات ويكتشف العلاقات بينها, وأخيرا يجب تحديد نوع الخوارزمية المناسبة لتحقيق الهدف المطلوب, بالإجابة على هذه الأسئلة تستطيع أن تعرف ما نوع التعلم الذي ستستخدمه.
رغم استخدامه في المهام المعقدة وتكلفته القليلة بالمقارنة مع التعلم الخاضع للإشراف, إلا أن هناك بعض التحديات فيما يتعلق باستخدامه, منها:
بعض استخدامات التعلم غير الخاضع للإشراف تشمل:
الخاتمة
في الختام، يبرز التعلم الآلي غير الخاضع للإشراف كابتكار ذو أهمية كبيرة في مجال تعلم الآلة. يمكن لهذا النوع من الأنظمة تحقيق فهم عميق للبيانات دون الحاجة إلى تسميات مسبقة أو توجيهات, وهذا بدوره يعزز قدرة النماذج على اكتشاف الأنماط والتحليلات في مجموعات البيانات بشكل ذاتي، وتصنيفها بناء على الخصائص المشتركة بدون توجيه خارجي.
يمكن استخدام التعلم غير الخاضع للإشراف في مهام عديدة مثل التجميع و قواعد الارتباط و تقليل الأبعاد, ومن أشهر التطبيقات عليه اكتشاف الشذوذ وتحليل الصور الطبية وكذلك تقسيم العملاء.
أخيرا، يكشف مقارنة بين التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف عن الفروق الجوهرية بينهما، حيث يظهر التعلم غير الخاضع للإشراف بمستوى تعقيد حسابي أكبر. هذا يظهر التحديات والإمكانيات الكبيرة لكل منهما في مجال تعلم الآلة، مع تفضيل استخدام كل نوع حسب سياق المهمة والبيانات المتاحة.
المصادر