شرح الانحدار مقابل التصنيف في التعلم الآلي

نشرت: 2022-12-19

يعد الانحدار والتصنيف من أهم مجالات التعلم الآلي وأهمها.

قد يكون من الصعب التمييز بين خوارزميات الانحدار والتصنيف عندما تدخل في التعلم الآلي. يمكن أن يكون فهم كيفية عمل هذه الخوارزميات ومتى يتم استخدامها أمرًا بالغ الأهمية لإجراء تنبؤات دقيقة وقرارات فعالة.

أولاً ، دعنا نتعرف على التعلم الآلي.

ما هو التعلم الآلي؟

ما هو التعلم الآلي

التعلم الآلي هو طريقة لتعليم أجهزة الكمبيوتر للتعلم واتخاذ القرارات دون أن تكون مبرمجة بشكل صريح. يتضمن تدريب نموذج كمبيوتر على مجموعة بيانات ، مما يسمح للنموذج بعمل تنبؤات أو قرارات بناءً على الأنماط والعلاقات في البيانات.

هناك ثلاثة أنواع رئيسية من التعلم الآلي: التعلم تحت الإشراف والتعلم غير الخاضع للإشراف والتعلم المعزز.

في التعلم الخاضع للإشراف ، يتم تزويد النموذج ببيانات التدريب المسمى ، بما في ذلك بيانات الإدخال والإخراج الصحيح المقابل. الهدف هو أن يقوم النموذج بعمل تنبؤات حول مخرجات البيانات الجديدة غير المرئية بناءً على الأنماط التي تعلمها من بيانات التدريب.

في التعلم غير الخاضع للإشراف ، لا يتم إعطاء النموذج أي بيانات تدريب مصنفة. بدلاً من ذلك ، يُترك اكتشاف الأنماط والعلاقات في البيانات بشكل مستقل. يمكن استخدام هذا لتحديد المجموعات أو المجموعات في البيانات أو للعثور على الانحرافات أو الأنماط غير العادية.

وفي التعلم المعزز ، يتعلم الوكيل كيفية التفاعل مع بيئته لتحقيق أقصى قدر من المكافأة. يتضمن تدريب نموذج لاتخاذ القرارات بناءً على التعليقات التي يتلقاها من البيئة.

مل

يستخدم التعلم الآلي في العديد من التطبيقات ، بما في ذلك التعرف على الصور والكلام ومعالجة اللغة الطبيعية واكتشاف الاحتيال والسيارات ذاتية القيادة. لديها القدرة على أتمتة العديد من المهام وتحسين عملية صنع القرار في مختلف الصناعات.

تركز هذه المقالة بشكل أساسي على مفاهيم التصنيف والانحدار ، والتي تندرج تحت إشراف التعلم الآلي. هيا بنا نبدأ!

التصنيف في تعلم الآلة

فيديو يوتيوب

التصنيف هو أسلوب للتعلم الآلي يتضمن تدريب نموذج لتعيين تسمية الفصل لمدخل معين. إنها مهمة تعلم خاضعة للإشراف ، مما يعني أن النموذج يتم تدريبه على مجموعة بيانات معنونة تتضمن أمثلة لبيانات الإدخال وتسميات الفصل المقابلة.

يهدف النموذج إلى معرفة العلاقة بين بيانات الإدخال وتسميات الفصل للتنبؤ بتسمية الفصل للمدخلات الجديدة غير المرئية.

هناك العديد من الخوارزميات المختلفة التي يمكن استخدامها للتصنيف ، بما في ذلك الانحدار اللوجستي ، وأشجار القرار ، وآلات ناقلات الدعم. يعتمد اختيار الخوارزمية على خصائص البيانات والأداء المطلوب للنموذج.

تتضمن بعض تطبيقات التصنيف الشائعة اكتشاف البريد العشوائي وتحليل المشاعر واكتشاف الاحتيال. في كل حالة من هذه الحالات ، قد تتضمن بيانات الإدخال نصًا أو قيمًا رقمية أو كليهما. يمكن أن تكون تصنيفات الفصل ثنائية (على سبيل المثال ، بريد عشوائي أو ليست بريد عشوائي) أو متعددة الفئات (على سبيل المثال ، مشاعر إيجابية ، محايدة ، سلبية).

على سبيل المثال ، ضع في اعتبارك مجموعة بيانات لمراجعات العملاء لمنتج ما. قد تكون بيانات الإدخال هي نص المراجعة ، وقد يكون تصنيف الفصل تصنيفًا (على سبيل المثال ، إيجابي ، محايد ، سلبي). سيتم تدريب النموذج على مجموعة بيانات من المراجعات المصنفة ومن ثم سيكون قادرًا على التنبؤ بتصنيف مراجعة جديدة لم يسبق له رؤيتها من قبل.

أنواع خوارزميات تصنيف ML

هناك عدة أنواع من خوارزميات التصنيف في التعلم الآلي:

الانحدار اللوجستي

هذا نموذج خطي يستخدم في التصنيف الثنائي. يتم استخدامه للتنبؤ باحتمالية حدوث حدث معين. الهدف من الانحدار اللوجستي هو العثور على أفضل المعاملات (الأوزان) التي تقلل الخطأ بين الاحتمال المتوقع والنتيجة المرصودة.

يتم ذلك باستخدام خوارزمية التحسين ، مثل نزول التدرج ، لضبط المعاملات حتى يناسب النموذج بيانات التدريب قدر الإمكان.

فيديو يوتيوب

أشجار القرار

هذه نماذج شبيهة بالشجرة تتخذ قرارات بناءً على قيم الميزة. يمكن استخدامها لتصنيف ثنائي ومتعدد الفئات. تتمتع أشجار القرار بالعديد من المزايا ، بما في ذلك بساطتها وإمكانية التشغيل البيني.

كما أنهم سريعون في التدريب والتنبؤ ، ويمكنهم التعامل مع البيانات العددية والفئوية. ومع ذلك ، يمكن أن تكون عرضة للإفراط في التجهيز ، خاصة إذا كانت الشجرة عميقة ولها العديد من الفروع.

تصنيف الغابات العشوائية

تصنيف الغابات العشوائية هو طريقة تجميعية تجمع بين تنبؤات أشجار القرار المتعددة لعمل تنبؤ أكثر دقة واستقرارًا. إنها أقل عرضة للتركيب الزائد من شجرة قرار واحدة لأن تنبؤات الأشجار الفردية يتم حسابها في المتوسط ​​، مما يقلل من التباين في النموذج.

AdaBoost

هذه خوارزمية معززة تعمل على تغيير وزن الأمثلة المصنفة بشكل خاطئ في مجموعة التدريب بشكل تكيفي. غالبًا ما يستخدم للتصنيف الثنائي.

فيديو يوتيوب

ساذج بايز

يعتمد Naive Bayes على نظرية بايز ، وهي طريقة لتحديث احتمالية وقوع حدث بناءً على أدلة جديدة. إنه مصنف احتمالي غالبًا ما يستخدم لتصنيف النص وتصفية البريد العشوائي.

K- أقرب الجار

يستخدم K-Nearest Neighbours (KNN) لمهام التصنيف والانحدار. إنها طريقة غير معلمية تصنف نقطة بيانات بناءً على فئة أقرب جيرانها. تتمتع KNN بالعديد من المزايا ، بما في ذلك بساطتها وحقيقة سهولة تنفيذها. يمكنه أيضًا التعامل مع كل من البيانات العددية والفئوية ، ولا يقدم أي افتراضات حول توزيع البيانات الأساسي.

تعزيز التدرج

هذه مجموعات من المتعلمين الضعفاء يتم تدريبهم بالتتابع ، حيث يحاول كل نموذج تصحيح أخطاء النموذج السابق. يمكن استخدامها لكل من التصنيف والانحدار.

الانحدار في تعلم الآلة

فيديو يوتيوب

في التعلم الآلي ، يعد الانحدار نوعًا من التعلم الخاضع للإشراف حيث يكون الهدف هو التنبؤ بمتغير يعتمد على التيار المتردد استنادًا إلى واحد أو أكثر من ميزات الإدخال (تسمى أيضًا المتنبئات أو المتغيرات المستقلة).

تُستخدم خوارزميات الانحدار لنمذجة العلاقة بين المدخلات والمخرجات وعمل تنبؤات بناءً على تلك العلاقة. يمكن استخدام الانحدار لكل من المتغيرات التابعة المستمرة والقطعية.

بشكل عام ، الهدف من الانحدار هو بناء نموذج يمكنه التنبؤ بدقة بالمخرجات بناءً على ميزات الإدخال وفهم العلاقة الأساسية بين ميزات الإدخال والمخرجات.

يستخدم تحليل الانحدار في مجالات مختلفة ، بما في ذلك الاقتصاد والتمويل والتسويق وعلم النفس ، لفهم العلاقات بين المتغيرات المختلفة والتنبؤ بها. إنها أداة أساسية في تحليل البيانات والتعلم الآلي وتُستخدم لإجراء تنبؤات وتحديد الاتجاهات وفهم الآليات الأساسية التي تقود البيانات.

على سبيل المثال ، في نموذج الانحدار الخطي البسيط ، قد يكون الهدف هو التنبؤ بسعر المنزل بناءً على حجمه وموقعه وميزات أخرى. سيكون حجم المنزل وموقعه متغيرات مستقلة ، وسيكون سعر المنزل هو المتغير التابع.

سيتم تدريب النموذج على بيانات الإدخال التي تتضمن حجم وموقع العديد من المنازل ، إلى جانب الأسعار المقابلة لها. بمجرد تدريب النموذج ، يمكن استخدامه لعمل تنبؤات حول سعر المنزل ، نظرًا لحجمه وموقعه.

أنواع خوارزميات الانحدار ML

تتوفر خوارزميات الانحدار في أشكال مختلفة ، ويعتمد استخدام كل خوارزمية على عدد المعلمات ، مثل نوع قيمة السمة ونمط خط الاتجاه وعدد المتغيرات المستقلة. تتضمن تقنيات الانحدار التي تُستخدم غالبًا ما يلي:

الانحدارالخطي

يستخدم هذا النموذج الخطي البسيط للتنبؤ بقيمة مستمرة بناءً على مجموعة من الميزات. يتم استخدامه لنمذجة العلاقة بين الميزات والمتغير المستهدف من خلال ملاءمة خط للبيانات.

الانحدار متعدد الحدود

هذا نموذج غير خطي يُستخدم لملاءمة منحنى مع البيانات. يتم استخدامه لنمذجة العلاقات بين الميزات والمتغير المستهدف عندما لا تكون العلاقة خطية. وهو يعتمد على فكرة إضافة مصطلحات عالية المستوى إلى النموذج الخطي لالتقاط العلاقات غير الخطية بين المتغيرات التابعة والمستقلة.

انحدار ريدج

هذا نموذج خطي يعالج فرط التخصيص في الانحدار الخطي. إنها نسخة منظمة من الانحدار الخطي تضيف مصطلحًا جزائيًا إلى دالة التكلفة لتقليل تعقيد النموذج.

فيديو يوتيوب

دعم الانحدار المتجه

مثل SVMs ، يعد Support Vector Regression نموذجًا خطيًا يحاول ملاءمة البيانات من خلال إيجاد المستوى الفائق الذي يزيد الهامش بين المتغيرات التابعة والمستقلة.

ومع ذلك ، على عكس SVMs ، التي تُستخدم للتصنيف ، يتم استخدام SVR لمهام الانحدار ، حيث يكون الهدف هو التنبؤ بقيمة مستمرة بدلاً من تسمية فئة.

انحدار لاسو

هذا نموذج خطي منظم آخر يستخدم لمنع فرط الانحدار في الانحدار الخطي. يضيف حدًا جزائيًا إلى دالة التكلفة بناءً على القيمة المطلقة للمعاملات.

الانحدار الخطي بايزي

الانحدار الخطي Bayesian هو نهج احتمالي للانحدار الخطي بناءً على نظرية بايز ، وهي طريقة لتحديث احتمالية حدوث حدث بناءً على أدلة جديدة.

يهدف نموذج الانحدار هذا إلى تقدير التوزيع اللاحق لمعلمات النموذج بالنظر إلى البيانات. يتم ذلك عن طريق تحديد توزيع مسبق على المعلمات ثم استخدام نظرية بايز لتحديث التوزيع بناءً على البيانات المرصودة.

الانحدار مقابل التصنيف

يعد الانحدار والتصنيف نوعين من التعلم الخاضع للإشراف ، مما يعني أنه يتم استخدامهما للتنبؤ بمخرجات بناءً على مجموعة من ميزات الإدخال. ومع ذلك ، هناك بعض الاختلافات الرئيسية بين الاثنين:

تراجع تصنيف
تعريف نوع من التعلم الخاضع للإشراف يتنبأ بقيمة مستمرة نوع من التعلم الخاضع للإشراف يتنبأ بقيمة فئوية
نوع الإخراج مستمر منفصلة
مقاييس التقييم متوسط ​​الخطأ التربيعي (MSE) ، جذر متوسط ​​الخطأ التربيعي (RMSE) الدقة ، الدقة ، الاسترجاع ، درجة F1
الخوارزميات الانحدار الخطي ، اللاسو ، ريدج ، KNN ، شجرة القرار الانحدار اللوجستي ، SVM ، Naive Bayes ، KNN ، شجرة القرار
تعقيد النموذج نماذج أقل تعقيدًا نماذج أكثر تعقيدًا
الافتراضات العلاقة الخطية بين السمات والهدف لا توجد افتراضات محددة حول العلاقة بين الميزات والهدف
عدم التوازن الطبقي غير قابل للتطبيق يمكن أن تكون مشكلة
القيم المتطرفة يمكن أن تؤثر على أداء النموذج ليس عادة مشكلة
أهمية الميزة يتم ترتيب الميزات حسب الأهمية لا يتم تصنيف الميزات حسب الأهمية
أمثلة على التطبيقات توقع الأسعار ودرجات الحرارة والكميات توقع ما إذا كان البريد الإلكتروني غير مرغوب فيه أم لا ، وتوقع زخم العميل

مصادر التعلم

قد يكون من الصعب اختيار أفضل الموارد عبر الإنترنت لفهم مفاهيم التعلم الآلي. لقد قمنا بفحص الدورات التدريبية الشائعة التي توفرها الأنظمة الأساسية الموثوقة لنقدم لك توصياتنا لأفضل دورات تعلم الآلة في الانحدار والتصنيف.

# 1. المعسكر التدريبي لتصنيف تعلم الآلة في بايثون

هذه دورة مقدمة على منصة Udemy. يغطي مجموعة متنوعة من خوارزميات وتقنيات التصنيف ، بما في ذلك أشجار القرار والانحدار اللوجستي ، ويدعم آلات المتجهات.

بالطبع 1

يمكنك أيضًا التعرف على موضوعات مثل التجهيز الزائد ومقايضة التباين التحيز وتقييم النموذج. تستخدم الدورة مكتبات Python مثل sci-kit-Learn و pandas لتنفيذ وتقييم نماذج التعلم الآلي. لذا ، فإن المعرفة الأساسية للبايثون مطلوبة لبدء هذه الدورة التدريبية.

# 2. دروس متقدمة في تعلم الآلة في الانحدار في بايثون

في دورة Udemy هذه ، يغطي المدرب الأساسيات والنظرية الأساسية لمختلف خوارزميات الانحدار ، بما في ذلك الانحدار الخطي ، والانحدار متعدد الحدود ، وتقنيات الانحدار Lasso & Ridge.

بالطبع 2

بنهاية هذه الدورة ، ستكون قادرًا على تنفيذ خوارزميات الانحدار وتقييم أداء نماذج التعلم الآلي المدربة باستخدام مؤشرات الأداء الرئيسية المختلفة.

تغليف

يمكن أن تكون خوارزميات التعلم الآلي مفيدة جدًا في العديد من التطبيقات ، ويمكن أن تساعد في أتمتة العديد من العمليات وتبسيطها. تستخدم خوارزميات ML تقنيات إحصائية لتعلم الأنماط في البيانات وإجراء تنبؤات أو قرارات بناءً على تلك الأنماط.

يمكن تدريبهم على كميات كبيرة من البيانات ويمكن استخدامها لأداء المهام التي يصعب على البشر القيام بها يدويًا أو تستغرق وقتًا طويلاً.

كل خوارزمية ML لها نقاط قوتها وضعفها ، واختيار الخوارزمية يعتمد على طبيعة البيانات ومتطلبات المهمة. من المهم اختيار الخوارزمية المناسبة أو مجموعة الخوارزميات المناسبة للمشكلة المحددة التي تحاول حلها.

من المهم اختيار النوع المناسب من الخوارزمية لمشكلتك ، لأن استخدام النوع الخاطئ من الخوارزمية يمكن أن يؤدي إلى ضعف الأداء والتنبؤات غير الدقيقة. إذا لم تكن متأكدًا من الخوارزمية التي يجب استخدامها ، فقد يكون من المفيد تجربة كل من خوارزميات الانحدار والتصنيف ومقارنة أدائها في مجموعة البيانات الخاصة بك.

آمل أن تكون قد وجدت هذه المقالة مفيدة في تعلم الانحدار مقابل التصنيف في التعلم الآلي. قد تكون مهتمًا أيضًا بالتعرف على أفضل نماذج التعلم الآلي.