Встречается на собеседованиях • сегодня

Какие знаешь метрики качества моделей бинарной классификации

Основные метрики для бинарной классификации:

  1. Accuracy — доля правильных предсказаний:

    python
    from sklearn.metrics import accuracy_score
    accuracy_score(y_true, y_pred)

    Не подходит при дисбалансе классов.

  2. Precision — точность положительных предсказаний:

    python
    from sklearn.metrics import precision_score
    precision_score(y_true, y_pred)

    Важна, когда ложные срабатывания дороги (например, спам).

  1. Recall (Sensitivity) — полнота, доля найденных положительных случаев:

    python
    from sklearn.metrics import recall_score
    recall_score(y_true, y_pred)

    Критична, когда пропуск цели опасен (медицина).

  2. F1-score — гармоническое среднее precision и recall:

    python
    from sklearn.metrics import f1_score
    f1_score(y_true, y_pred)

    Оптимален при дисбалансе классов.

  3. ROC-AUC — площадь под ROC-кривой, оценивает качество разделения классов:

    python
    from sklearn.metrics import roc_auc_score
    roc_auc_score(y_true, y_proba)

    Чем ближе к 1, тем лучше.

  4. Log Loss — учитывает уверенность модели:

    python
    from sklearn.metrics import log_loss
    log_loss(y_true, y_proba)

    Штрафует за ошибочные уверенные предсказания.

Выбор метрики зависит от задачи: например, в медицине важен recall, а в кредитовании — precision.

как отвечать на вопрос
пример собеседования
фреймворки на собеседовании
типичные вопросы junior
интервью вопросы и ответы