مدونتنا

Blog Thumbnail

الشبكة العصبية الالتفافية CNN-أفضل خوارزمية لتصنيف الصور|SHAI

الشبكة العصبية الالتفافية CNN هي شبكة عصبية تتكون من ثلاث طبقات: طبقة التفافية وطبقة تجميع وطبقة متصلة بالكامل, تعد الأفضل في مجال تصنيف الصور.

3/3/2025 - 8 دقائق

مقدمة في الشبكة العصبية الالتفافية CNN: ما هي, وكيف تتركب وما أنواعها؟ 

هل واجهت يوما تحديات في فهم الأنماط المعقدة والبيانات الضخمة؟ إذا كانت الإجابة نعم، فأنت لست وحدك, لأن فهم ومعالجة هذا النوع من المعلومات يشكل تحديا هائلا في عالمنا المتقدم تكنولوجيا, لذلك تظهر هنا الشبكة العصبية الالتفافية CNN، هذه التكنولوجيا المبتكرة كحل فعالا لمشكلة تعقيد فهم البيانات.


الشبكات العصبية الالتفافية CNN، تمثل نقلة نوعية في مجال التعلم الآلي, بحيث تتميز بتركيبها المستوحى من الدماغ البشري، و تتيح للأنظمة الحاسوبية فهم الأنماط البصرية والسمعية بطريقة متقدمة، مما يمكنها من معالجة البيانات بشكل فعال وتحقيق أداء متفوق في التحليل والتصنيف. في هذا المقال، سنتناول بعمق ماهية الشبكات العصبية الالتفافية وكيف تمثل حلا مبتكرا للتحديات الحديثة في مجال التعامل مع البيانات الضخمة والمعقدة. ترقبوا لفهم أعماق هذه التكنولوجيا وكيف يمكن للشبكات العصبية الالتفافية تحويل مفهومنا عن المعالجة الذكية.



مفهوم الشبكة العصبية الالتفافية وما أهميتها ؟

الشبكة العصبية الالتفافية CNN هي نوع من الشبكات العصبية العميقة ذات تغذية أمامية Feed Forward أي أن المعلومات تنتقل في اتجاه واحد فقط من الطبقة الداخلية Input Layer الى الطبقة الخارجية Output Layer مرورا بالطبقة الخفية Hidden Layer دون وجود تغذية راجعة. [1]


تستخدم بشكل كبير في مهام تصنيف والرؤية الحاسوبية. تقريبا, فإنها تعد الأفضل في مجال تصنيف الصور ومهام التعرف على الكائنات, ولكن ما الذي يجعلها مميزة في هذا المجال تحديدا ؟ الأمر الذي جعلها تتفوق في هذا المجال هو اعتمادها على مبادئ الجبر الخطي وتحديدا على عملية ضرب المصفوفات، وذلك بهدف تحديد الأنماط داخل الصور. [2]


 يشير الجبر الخطي إلى فحص وتحليل العلاقات بين المتغيرات بطرق رياضية مبنية على الخصائص الخطية. يظهر هذا الاعتماد على مبادئ الجبر الخطي أهمية في التعامل مع البيانات الضخمة وتحسين أداء مهام الرؤية الحاسوبية. جعل الجبر الخطي الشبكة العصبية الالتفافية تتفوق في معالجة الصور بسبب قدرتها على اكتشاف وتمثيل الأنماط والميزات المعقدة داخل الصور بفعالية. 


بالرغم من ذلك, فإن هذه الشبكات قد تكون مكلفة حسابيا، مما يتطلب استخدام وحدات معالجة الرسومات GPUs لتدريب النماذج.



مم تتكون الشبكات العصبية الالتفافية؟ 

تتكون في تركيبها من 3 طبقات أساسية كل لديها وظيفته الأساسية, وهي: [3]

  • الطبقة الالتفافية Convolutional Layer: وهي الوحدة الأساسية التي يتم إجراء الحسابات فيها بالإضافة الى وظيفتها في استخراج السمات من البيانات.
  • طبقة التجميع Pooling Layer: تلعب دورا أساسيا في تحسين كفاءة الشبكة من خلال تقليل حجم التمثيل الفضائي للسمات المستخرجة من الطبقة الالتفافية, هذا من شأنه أن يسهم في تقليل عدد العمليات الحسابية، مما يجعل الشبكة أكثر فعالية من حيث الأداء وتسريع عملية التدريب والاختبار.
  • طبقة متصلة بالكامل Fully Connected Layer: تأتي هذه الطبقة كخطوة حاسمة لتحليل السمات المستخرجة, حيث تكون مهمتها دمج المعلومات وتحليلها بعمق من خلال تلخيص السمات من الطبقات السابقة.تكون هذه الطبقة متصلة بالطبقات السابقة والطبقة الحديثة, بحيث يتيح هذا الاتصال الثنائي للطبقة فحص السمات المهمة وتجميعها بشكل شامل.


أنواع الشبكات العصبية الالتفافية

قد يؤدي اختلاف بسيط في تركيب الشبكة الى ظهور أنواع مختلفة لها, سنذكر أهم أنواعها:


  • LeNet: هي شبكة عصبية اصطناعية تتألف من طبقات التفافية وتجميع، يليها طبقات متصلة بالكامل, حيث تضم مجموعتين من الطبقات الالتفافية والتجميع، وثلاث طبقات متصلة بالكامل. تستخدم النواة في الطبقات الالتفافية حجم 5x5، مع تطبيق عدة فلاتر، ويتبع ذلك تقليل الأبعاد من خلال طبقات التجميع. تم تدريبها على مجموعة MNIST لتصنيف الأرقام المكتوبة يدويا، وحققت دقة مرتفعة.على الرغم من بساطتها، كانت خطوة مهمة في تطور الشبكات العصبية لمشاكل التصنيف [4]


  • AlexNet: تم تطويرها في عام 2012 من قبل أليكس كريجفسكي، إيليا سوتسكيفر، وجيفري هينتون، وكانت الأولى في تحدي ImageNet Large Scale Visual Recognition Challenge (ILSVRC). تتكون من طبقات التفافية وتجميع، وطبقات متصلة بالكامل، بإجمالي خمس طبقات التفافية وثلاث طبقات تجميع وثلاث طبقات متصلة بالكامل. تم تدريبها على مجموعة بيانات ImageNet، وقد أظهرت قوة الشبكات العصبية التحويلية في التعرف على الصور، وتمثلت في خطوة مهمة نحو هندسات أعمق مثل VGGNet وGoogleNet وResNet


  • GoogLeNet: تم تطويرها بواسطة باحثين في جوجل، تم إدخالها في عام 2014 وفازت بتحدي ILSVRC في نفس السنة. تتميز بوحدة التضمين Inception التي تتكون من طبقات التفافية متوازية بأحجام فلاتر مختلفة، مع طبقة تجميع ودمج لمخرجاتها. هذا التصميم يمكن الشبكة من تعلم الميزات على مقاييس ودقات متعددة مع تكلفة حوسبة منخفضة, كما تحتوي أيضا على مصنفات فرعية لتعزيز تعلم السمات التمييزية ومنع Overfitting. تعتمد على أفكار الشبكات العصبية الالتفافية السابقة، مثل LeNet، ولكنها أعمق وأكثر تعقيدا [5]


  • VGG: مجموعة (Visual Geometry Group) هي مجموعة بحثية في جامعة أكسفورد، مشهورة بأعمالها في مجال رؤية الحاسوب وخاصة في شبكات CNNs أحد إسهاماتها البارزة هو نموذج VGG، المعروف أيضا باسم VGGNet. هذا النموذج العصبي العميق حقق أداء متميزا في تحدي ILSVRC للتعرف البصري على نطاق واسع في عام 2014، وأصبح معيارا لمهام تصنيف الصور وكشف الكائنات, كما أنها تتميز باستخدام فلاتر التفافية صغيرة (3x3) بهيكل عميق يصل إلى 19 طبقة، مما يمكنها من استخراج سمات معقدة من الصور. يعتمد نموذج VGG أيضًا على طبقات التجميع القصوى (max pooling) لتقليل الدقة المكانية وزيادة المجال الاستقبالي، مما يعزز قدرتها على التعرف على الكائنات بمقاييس وتوجيهات متنوعة [5]


  • ResNet: تستخدم في معالجة الصور وتحل مشكلة اختفاء التدرج Vanishing Gradient، حيث يكون تعلم التمثيلات العميقة صعبا في النماذج العادية. تنتج من عملية Skip Connection حيث يتم إضافة الإدخال الأصلي إلى الإخراج الناتج من كل طبقة، ويستخدم دالة المطابقة Identity Function لتسهيل تعلم الاختلافات بشكل فعال [5]



استخدامات عملية على الشبكات العصبية الالتفافية 

ذكرنا أن الشبكة الالتفافية شائعة الاستخدام في مجال تصنيف الصور والتعرف على الكائنات, ولكن بالطبع لها استخدامات في مجالات أخرى, منها: [6]

  • التحقق الحيوي Biometric authentication

يمكن استخدامها للتعرف على هوية المستخدم عبر تحديد سمات محددة في وجهه, مثل المسافة بين العيون وشكل الأنف وانحناء الشفاه. يمكن تدريب النماذج على الصور أو الفيديوهات لتحديد هذه السمات, بالإضافة إلى ذلك، قامت هذه النماذج بتمييز مختلف الحالات العاطفية مثل السعادة أو الحزن استنادا إلى صور وجوه الأشخاص, كما يمكنها تحديد ما إذا كانت العين مغلقة في الصورة، وتحليل شكل الوجه في صور متعددة الإطارات.


  • المركبات ذاتية القيادة Autonomous driving

الشبكات العصبية الالتفافية تلعب دورا مهما في المركبات ذاتية القيادة,حيث تعمل على تحسين رؤية السيارة من خلال تحليل البيانات البصرية، وتساهم في نظام التوجيه والتحكم باتخاذ قرارات حية, كما تعمل على توقع سلوك السائقين وتحليل الأنماط السلوكية. بالإضافة الى ذلك تلعب دورا في نظم الاستشعار والتعرف على البيئة، مما يسهم في فهم السيارة للظروف المحيطة واتخاذ قرارات تلبي متطلبات القيادة الذاتية.


  • تحليل المستندات Document analysis       

 يمكن تدريب هذه الشبكات على استخراج المعلومات من المستندات النصية، مثل تحديد الجمل الرئيسية والمعلومات الأساسية, كما يمكن استخدامها لتصنيف المستندات وترتيبها حسب المواضيع. بالإضافة إلى ذلك، يمكن للشبكات العصبية أن تعزز فهم السياق في المستندات وتحليل العلاقات بين العناصر المختلفة. تلعب هذه القدرات دورا حيويا في تحسين جودة التحليل النصي وفهم المستندات بشكل أعمق.



الخاتمة

في الختام, يمكننا القول أن الشبكات العصبية الالتفافية CNN قد أثبتت جدارتها في مجالات عدة، خاصة في تصنيف الصور والتعرف على الكائنات. تفوقها يعزى إلى اعتمادها على مبادئ الجبر الخطي، وبالأخص على عملية ضرب المصفوفات، مما يمكنها من استخراج الأنماط والميزات بكفاءة داخل الصور.


بالرغم من ذلك, قد تكون هذه الشبكات مكلفة حسابيا، مما يتطلب استخدام وحدات معالجة الرسومات GPUs في تدريب النماذج. ومع ذلك، مع التطور المستمر في التكنولوجيا، من الممكن توقع تحسينات في كفاءة الحوسبة.


تتكون الشبكات العصبية الالتفافية من ثلاث طبقات رئيسية: الطبقة الالتفافية، وطبقة التجميع، والطبقة المتصلة بالكامل. هذه الطبقات تعمل بتناغم لاستخراج

وتحليل السمات بشكل فعال, اختلاف عدد هذه الطبقات أدى الى ظهور أنواع لها منها: LeNet، AlexNet، GoogLeNet، VGG، وResNet. 

أخيرا، يبرز دور الشبكات العصبية الالتفافية في مجالات متنوعة مثل التحقق الحيوي، والمركبات ذاتية القيادة، وتحليل المستندات. يظهر أن هذه التكنولوجيا لديها إمكانيات كبيرة لتحسين فهمنا للعالم من حولنا وتسهيل العديد من العمليات اليومية, و مع استمرار البحث والتطوير، يمكن توقع أن تكون المستقبل واعداً لتقنيات الشبكات العصبية الالتفافية.





المصادر

  1. Basic CNN Architecture: A Detailed Explanation of the 5 Layers in Convolutional Neural Networks
  2. Convolutional Neural Network (CNN) in Machine Learning - GeeksforGeeks
  3. https://datagen.tech/guides/computer-vision/cnn-convolutional-neural-network/#
  4. https://indiaai.gov.in/article/top-5-applications-of-convolution-neural-
لايوجد تعليقات بعد!

سجل الدخول ﻹضافة تعليق

العلامات
التعلم الالي