Source code for secmlt.metrics.classification

"""Classification metrics for machine-learning models and for attack performance."""

from typing import Union

import torch
from secmlt.models.base_model import BaseModel
from torch.utils.data import DataLoader



[docs]
def accuracy(y_pred: torch.Tensor, y_true: torch.Tensor) -> torch.Tensor:
    """
    Compute the accuracy on a batch of predictions and targets.

    Parameters
    ----------
    y_pred : torch.Tensor
        Predictions from the model.
    y_true : torch.Tensor
        Target labels.

    Returns
    -------
    torch.Tensor
        The percentage of predictions that match the targets.
    """
    return (y_pred.type(y_true.dtype) == y_true).mean()




[docs]
class Accuracy:
    """Class for computing accuracy of a model on a dataset."""


[docs]
    def __init__(self) -> None:
        """Create Accuracy metric."""
        self._num_samples = 0
        self._accumulated_accuracy = 0.0



[docs]
    def __call__(self, model: BaseModel, dataloader: DataLoader) -> torch.Tensor:
        """
        Compute the metric on a single attack run or a dataloader.

        Parameters
        ----------
        model : BaseModel
            Model to use for prediction.
        dataloader : DataLoader
            A dataloader, can be the result of an attack or a generic
            test dataloader.

        Returns
        -------
        torch.Tensor
            The metric computed on the given dataloader.
        """
        for _, (x, y) in enumerate(dataloader):
            y_pred = model.predict(x).cpu().detach()
            self._accumulate(y_pred, y)
        return self._compute()


    def _accumulate(self, y_pred: torch.Tensor, y_true: torch.Tensor) -> None:
        self._num_samples += y_true.shape[0]
        self._accumulated_accuracy += torch.sum(
            y_pred.type(y_true.dtype).cpu() == y_true.cpu(),
        )

    def _compute(self) -> torch.Tensor:
        return self._accumulated_accuracy / self._num_samples




[docs]
class AttackSuccessRate(Accuracy):
    """Single attack success rate from attack results."""


[docs]
    def __init__(self, y_target: Union[float, torch.Tensor, None] = None) -> None:
        """
        Create attack success rate metric.

        Parameters
        ----------
        y_target : float | torch.Tensor | None, optional
            Target label for the attack, None for untargeted, by default None
        """
        super().__init__()
        self.y_target = y_target


    def _accumulate(self, y_pred: torch.Tensor, y_true: torch.Tensor) -> None:
        if self.y_target is None:
            super()._accumulate(y_pred, y_true)
        else:
            super()._accumulate(y_pred, torch.ones_like(y_true) * self.y_target)

    def _compute(self) -> torch.Tensor:
        if self.y_target is None:
            return 1 - super()._compute()
        return super()._compute()




[docs]
class AccuracyEnsemble(Accuracy):
    """Robust accuracy of a model on multiple attack runs."""


[docs]
    def __call__(self, model: BaseModel, dataloaders: list[DataLoader]) -> torch.Tensor:
        """
        Compute the metric on an ensemble of attacks from their results.

        Parameters
        ----------
        model : BaseModel
            Model to use for prediction.
        dataloaders : list[DataLoader]
            List of loaders returned from multiple attack runs.

        Returns
        -------
        torch.Tensor
            The metric computed across multiple attack runs.
        """
        for advs in zip(*dataloaders, strict=False):
            y_pred = []
            for x, y in advs:
                y_pred.append(model.predict(x).cpu().detach())
                # verify that the samples order correspond
                assert (y - advs[0][1]).sum() == 0
            y_pred = torch.vstack(y_pred)
            self._accumulate(y_pred, advs[0][1])
        return self._compute()


    def _accumulate(self, y_pred: torch.Tensor, y_true: torch.Tensor) -> None:
        self._num_samples += y_true.shape[0]
        self._accumulated_accuracy += torch.sum(
            # take worst over predictions
            (y_pred.type(y_true.dtype).cpu() == y_true.cpu()).min(dim=0).values,
        )




[docs]
class EnsembleSuccessRate(AccuracyEnsemble):
    """Worst-case success rate of multiple attack runs."""


[docs]
    def __init__(self, y_target: Union[float, torch.Tensor, None] = None) -> None:
        """
        Create ensemble success rate metric.

        Parameters
        ----------
        y_target : float | torch.Tensor | None, optional
            Target label for the attack, None for untargeted,, by default None
        """
        super().__init__()
        self.y_target = y_target


    def _accumulate(self, y_pred: torch.Tensor, y_true: torch.Tensor) -> None:
        if self.y_target is None:
            super()._accumulate(y_pred, y_true)
        else:
            self._num_samples += y_true.shape[0]
            self._accumulated_accuracy += torch.sum(
                # take worst over predictions
                (
                    y_pred.type(y_true.dtype).cpu()
                    == (torch.ones_like(y_true) * self.y_target).cpu()
                )
                .max(dim=0)
                .values,
            )

    def _compute(self) -> torch.Tensor:
        if self.y_target is None:
            return 1 - super()._compute()
        return super()._compute()