Learning Evaluation Metrics in ML - Lesson 6 - AUC-ROC Curve

In statistical analysis of binary classification and information retrieval systems, the F-score or F-measure is a measure of predictive performance.

The ROC AUC score is the area under the ROC curve. It sums up how well a model can produce relative scores to discriminate between positive or negative instances across all classification thresholds. The ROC AUC score ranges from 0 to 1, where 0.5 indicates random guessing, and 1 indicates perfect performance.

ROC curve (receiver operating characteristic curve) is a graph showing the performance of a classification model at all classification thresholds. This curve plots two parameters: True Positive Rate. False Positive Rate.

A receiver operating characteristic curve, or ROC curve, is a graphical plot that illustrates the performance of a binary classifier model at varying threshold values. The ROC curve is the plot of the true positive rate against the false positive rate at each threshold setting.

Evaluation metrics are quantitative measures used to evaluate the performance and effectiveness of a statistical or machine learning model. These metrics provide insights into how well the model is performing and help in comparing different models or algorithms. When evaluating a machine learning model, it is crucial to assess its predictive ability, generalization capability, and overall quality.

There are different types of evaluation metrics available, depending on the specific machine learning task. Some of the common evaluation matrices are Precision, recall, F1-score, Mean Absolute Error, Mean Squared Error, R-squared, adjusted r-squared, accuracy, confusion matrix, log-loss, and AUC-ROC are some of the most popular metrics.

مقاييس تقييم التعلم في تعلم الآلة - الدرس 6 - منحني روك

في التحليل الإحصائي لأنظمة التصنيف الثنائي واسترجاع المعلومات، تعد درجة إف أو مقياس إف مقياسًا للأداء التنبؤي.

درجة روك هي المنطقة الواقعة تحت منحنى روك. فهو يلخص مدى قدرة النموذج على إنتاج درجات نسبية للتمييز بين الحالات الإيجابية أو السلبية عبر جميع عتبات التصنيف. تتراوح درجة روك من 0 إلى 1، حيث يشير 0.5 إلى التخمين العشوائي، ويشير 1 إلى الأداء المثالي.

منحنى روك (منحنى خاصية تشغيل المستقبل) هو رسم بياني يوضح أداء نموذج التصنيف عند جميع عتبات التصنيف. يرسم هذا المنحنى معلمتين: المعدل الإيجابي الحقيقي. معدل إيجابي كاذب.

منحنى خاصية تشغيل جهاز الاستقبال، أو منحنى روك، هو مخطط رسومي يوضح أداء نموذج المصنف الثنائي عند قيم عتبة مختلفة. منحنى روك هو مخطط المعدل الإيجابي الحقيقي مقابل المعدل الإيجابي الخاطئ عند كل إعداد عتبة.

مقاييس التقييم هي مقاييس كمية تستخدم لتقييم أداء وفعالية نموذج إحصائي أو التعلم الآلي. توفر هذه المقاييس رؤى حول مدى جودة أداء النموذج وتساعد في مقارنة النماذج أو الخوارزميات المختلفة. عند تقييم نموذج التعلم الآلي، من المهم تقييم قدرته التنبؤية وقدرته على التعميم والجودة الشاملة.

هناك أنواع مختلفة من مقاييس التقييم المتاحة، اعتمادًا على مهمة التعلم الآلي المحددة. بعض مصفوفات التقييم الشائعة هي الدقة، والاستدعاء، ودرجة إف ون، ومتوسط ​​الخطأ المطلق، ومتوسط ​​الخطأ التربيعي، و المعدل، والدقة، ومصفوفة الارتباك، وخسارة السجل، ومنحني روك . المقاييس الشعبية جذر الخطأ.